Schwertlilien
As a recoder: notes and ideas.

2025-9-27

  1. 修改label文件是否会影响之前已经标注好的图片?
  2. 如何界定是否属于同一道菜?必须食材完全一致。—涉及到label变多。

本次会议主要讨论了菜品食材的分类标注标准、存在的问题及应对策略,并确定了后续的标注任务分工和时间安排。

小结

  1. 食材标签与菜品分类标准

    • 当前问题: 存在图片与标签不匹配的情况,部分标签并未在图片中标注。
    • 解决方式: 对于新增的标签,需要同步更新label.txt文件。
    • 默认值设定: 讨论决定,默认大多数菜品的“烹饪方式”这一属性是默认值(default=0),如生食材等情况因为出现次数少可忽略处理;调料作为指导原则,在占比较大时应视为一道主要食材,而非少量佐料。
  2. 具体菜品场景的处理

    • 生菜: 因整体占比小,决定将其归为“无烹饪”的默认情况,不作为独立标签或品类进行强制标注。
    • 洋葱: 经确认,洋葱确实在蒜薹炒肉等菜中作为重要食材出现,不应被独立列为“调料”,需作为主要食材进行标注。对于类似辣椒占主导的辣椒炒肉场景,也将作为独立菜品进行处理。
  3. 标注任务与进度安排

    • 总目标: 完成总计约2000张图片的标注。

    • 效率预估: 单人总耗时约150小时(按6人排每人25h)。

    • 建议方案: 采用每周交付500张图片的节奏,相关负责人将在本周内进行任务划分并对外公布具体DDL(最终交付日期)。团队可将task.json传递、合并不会、优化存在的一系列问题。

  4. 其他事项:为提升团队积极性,会议提议建立学术交流机制,由王奕琳负责分享研究方向,相关人员轮流进行开放词汇分割领域的论文解读。

待办-标注任务执行与跟进

  1. 在本周内完成任务划分,明确每周交付500张图片的节奏,并给出DDL。每周五晚7点为上传标注文件的时间节点,然后二位进行整理后发至小群。
  2. 每周六11点的会议:分享论文,不拘泥于ppt的形式、分享一篇或多篇论文中值得注意的点。

基本统计

  • 总共找到 2034 张图片
  • 从第51张图片开始,每85张图片划分为一组,共可分为 24 组

分组结果:第1-50张图片: [88, 193] (共50张图片)

week1:

  • 第1组: [196, 307] (共85张图片)
  • 第2组: [309, 440] (共85张图片)
  • 第3组: [441, 595] (共85张图片)
  • 第4组: [596, 795] (共85张图片)
  • 第5组: [798, 1035] (共85张图片)
  • 第6组: [1037, 1231] (共85张图片)

week2:

  • 第7组: [1234, 1476] (共85张图片)
  • 第8组: [1482, 1841] (共85张图片)
  • 第9组: [1845, 2134] (共85张图片)
  • 第10组: [2139, 2471] (共85张图片)
  • 第11组: [2473, 3146] (共85张图片)
  • 第12组: [3156, 3896] (共85张图片)

week3:

  • 第13组: [3915, 4571] (共85张图片)
  • 第14组: [4572, 5017] (共85张图片)
  • 第15组: [5021, 5643] (共85张图片)
  • 第16组: [5662, 6327] (共85张图片)
  • 第17组: [6328, 6412] (共85张图片)
  • 第18组: [6413, 6497] (共85张图片)

week4:

  • 第19组: [6498, 6582] (共85张图片)
  • 第20组: [6583, 6667] (共85张图片)
  • 第21组: [6668, 6752] (共85张图片)
  • 第22组: [6753, 6837] (共85张图片)
  • 第23组: [6838, 6922] (共85张图片)
  • 第24组: [6923, 6951] (共29张图片) - 最后一组因剩余图片不足85张,只有29张
搜索
匹配结果数:
未搜索到匹配的文章。