Schwertlilien
As a recoder: notes and ideas.

2025-9-4

不知道为什么今天就是学不进去,还在狂看布料,想自己做包什么的。。。

但仔细想想,有必要吗?有用吗?实际上并没有。

审了一篇稿。

作者构建了首个同时覆盖 RGB 与光谱信息的综合食物多模态基准Spectral Food (SFOOD)。在普通的视觉图像信息之外,作者还额外采集了部分食品的图片、重量、甜度、高光谱的信息,相较于单视觉图片信息能够从更多的维度去分析Food。

在这个基准上,并能够将该数据集运用到6个不同的食品领域的分析任务,如VQA和实例分割。论文的主要findings是发现当前LVLM在多维食物属性理解上仍存在缺陷、以及Spectrum data is helpful for analyzing food properties.然而,论文存在一些可以改进的地方。下面是相关的修改意见:

  1. 写作上需要避免可能出现的二义性。比如,论文中仅在图解上有写是3,266 subcategories,但是在摘要以及其他地方都没有提及。这些具体分类的情况。
  2. 相关工作部分:因为下游任务的数量过多,所以只是简要的介绍了相关研究。调研光谱食物分析相关研究的论文不够新。
  3. 数据集方面:有些解释不是很详细、不全面。比如在解释食物重量相关的数据时,作者解释说是从网上以及开源数据集中得到的相关数据。但是并没有详细解释这些数据是否具有可信性、以及重量单位是否一致等问题。
  4. 实验部分:作者将提出的基准在已有的模型上进行测试。但是选择的对比模型太老了,不够前沿。比如实例分割部分的对比实验,选取的都是五年以前的模型。此外,对于实验的分析结果不够详细,解释上不够充分。
  5. 作者的结论之一是说Spectrum data is helpful for analyzing food properties.但是实验仅在fruit sweetness prediction and herbal classification 上对比了光谱数据和RGB图片数据。但是更多的实验都是仅在光谱数据集上单独训练模型,并不能充分论证作者的结论。
搜索
匹配结果数:
未搜索到匹配的文章。