2025-9-27
- 修改label文件是否会影响之前已经标注好的图片?
- 如何界定是否属于同一道菜?必须食材完全一致。—涉及到label变多。
本次会议主要讨论了菜品食材的分类标注标准、存在的问题及应对策略,并确定了后续的标注任务分工和时间安排。
小结
食材标签与菜品分类标准
- 当前问题: 存在图片与标签不匹配的情况,部分标签并未在图片中标注。
- 解决方式: 对于新增的标签,需要同步更新label.txt文件。
- 默认值设定: 讨论决定,默认大多数菜品的“烹饪方式”这一属性是默认值(default=0),如生食材等情况因为出现次数少可忽略处理;调料作为指导原则,在占比较大时应视为一道主要食材,而非少量佐料。
具体菜品场景的处理
- 生菜: 因整体占比小,决定将其归为“无烹饪”的默认情况,不作为独立标签或品类进行强制标注。
- 洋葱: 经确认,洋葱确实在蒜薹炒肉等菜中作为重要食材出现,不应被独立列为“调料”,需作为主要食材进行标注。对于类似辣椒占主导的辣椒炒肉场景,也将作为独立菜品进行处理。
标注任务与进度安排
总目标: 完成总计约2000张图片的标注。
效率预估: 单人总耗时约150小时(按6人排每人25h)。
建议方案: 采用每周交付500张图片的节奏,相关负责人将在本周内进行任务划分并对外公布具体DDL(最终交付日期)。团队可将task.json传递、合并不会、优化存在的一系列问题。
其他事项:为提升团队积极性,会议提议建立学术交流机制,由王奕琳负责分享研究方向,相关人员轮流进行开放词汇分割领域的论文解读。
待办-标注任务执行与跟进
- 在本周内完成任务划分,明确每周交付500张图片的节奏,并给出DDL。每周五晚7点为上传标注文件的时间节点,然后二位进行整理后发至小群。
- 每周六11点的会议:分享论文,不拘泥于ppt的形式、分享一篇或多篇论文中值得注意的点。
基本统计:
- 总共找到 2034 张图片
- 从第51张图片开始,每85张图片划分为一组,共可分为 24 组
分组结果:第1-50张图片: [88, 193] (共50张图片)
week1:
- 第1组: [196, 307] (共85张图片)
- 第2组: [309, 440] (共85张图片)
- 第3组: [441, 595] (共85张图片)
- 第4组: [596, 795] (共85张图片)
- 第5组: [798, 1035] (共85张图片)
- 第6组: [1037, 1231] (共85张图片)
week2:
- 第7组: [1234, 1476] (共85张图片)
- 第8组: [1482, 1841] (共85张图片)
- 第9组: [1845, 2134] (共85张图片)
- 第10组: [2139, 2471] (共85张图片)
- 第11组: [2473, 3146] (共85张图片)
- 第12组: [3156, 3896] (共85张图片)
week3:
- 第13组: [3915, 4571] (共85张图片)
- 第14组: [4572, 5017] (共85张图片)
- 第15组: [5021, 5643] (共85张图片)
- 第16组: [5662, 6327] (共85张图片)
- 第17组: [6328, 6412] (共85张图片)
- 第18组: [6413, 6497] (共85张图片)
week4:
- 第19组: [6498, 6582] (共85张图片)
- 第20组: [6583, 6667] (共85张图片)
- 第21组: [6668, 6752] (共85张图片)
- 第22组: [6753, 6837] (共85张图片)
- 第23组: [6838, 6922] (共85张图片)
- 第24组: [6923, 6951] (共29张图片) - 最后一组因剩余图片不足85张,只有29张