2025-9-8

1
2
3
4
5
6

2025-9-7

1. 详细的标注规则手册准则

  • 准则一:全景分割原则 (The Panoptic Principle)
    • 图像中的每一个像素点都必须被赋予且仅被赋予一个类别标签和实例ID。
    • 这意味着...

2025-9-6

今天被骗了640块,也不知道能不能要回来。

感觉人就是在被打击的时候会特别的有倾诉欲。无怪乎史铁生在得病时写了《病隙碎笔》。

先说一下,最后要回来了500块钱。

有关于我被骗的详细过程:

9.6在11点左右的时间。是我从海淀大悦城1楼坐电梯到-1楼,准备去往我马超市刚下电梯的时候,就被一个四五十岁的大妈给拉住了,说是商场做活动免费送杯子,然后就跟着他...

2025-9-5

发现Gemini真的会按照我思考的顺序得到研究报告。

基本上我一步步看下来得到的疑问,它都会在下一步帮我解答。

annotations列表中的每个元素对应一张图片的标注。

segments_info是核心,它为mask.png中的每一个id(即每一个实例)提供了详细的语义信息,包括它属于...

2025-9-4

不知道为什么今天就是学不进去,还在狂看布料,想自己做包什么的。。。

但仔细想想,有必要吗?有用吗?实际上并没有。

审了一篇稿。

作者构建了首个同时覆盖 RGB 与光谱信息的综合食物多模态基准Spectral Food (SFOOD)。在普通的视觉图像信息之外,作者还额外采集了部分食品的图片、重量、甜度、高光谱的信息,相较于单视觉图片信息能够从更多的维度去分析Food。

在这个...

2025-9-3

分析一下我们数据集的情况:多菜同盘、混合/覆盖、酱汁漫流、同名食材多烹法外观差异巨大。

在自助餐或学校食堂餐盘的场景下,在CV领域构成了一个独特而复杂的挑战。其核心特征在于,场景是由两类截然不同的视觉元素构成的混合体:一类是离散、可数的物体,例如一块排骨、一个虾仁或一朵西兰花;另一类则是无定形、不可数的区域,例如一摊米饭、一汪酱汁或一盘混合翻炒的蔬菜。这种结构使得传统的图像分割范式难以完全胜任。

两层任务 + 三层本体 + 属性多标签 + ...

2025-9-2

CVPR2024: OVFoodSeg: Elevating Open-Vocabulary Food Image Segmentation via Image-Informed Textual Representation

以two-stage训练

阅读全文

2025-9-1

有时候深刻地感觉自己怀有罪孽,主要体现在:浪费食物的时候、直接丢弃没有喝完的水时。

好吧,写这段文字的时候,我刚丢掉了我喝了半杯的咖啡。阿门。

话说回来了,开始看论文了。

目前做食品分割数据集存在的难点:

  1. 缺乏高质量的、细粒度的成分标签&像素级的位置掩码 数据集。目前存在的数据集要么就是成分标的很粗糙、要么就是数据量太小。...

2025-8-29

目前数据存在的问题:菜品成分间的严重遮挡与长尾类别分布问题。

底层数据集构建:我的数据要怎么标注?➡️我的标签怎么制定?➡️现有的标签规则是否完善?

支撑下游任务:

  1. 食材检测与识别:细粒度分割给出每种食材的掩码。
  2. 营养估计/热量计算:基于精确的食材分割,根据食材类型和份额估计营养成分。
  3. 菜谱生成...

2025-8-28

标签结构格式

所有菜品标签应遵循以下格式: 大类 - 主要食材1 - 主要食材2 - (主要食材3) - (额外标注)

  • 大类: 菜品的基本属性分类(例如:荤素、纯素)。
  • <...
搜索
匹配结果数:
未搜索到匹配的文章。