2025-9-4
不知道为什么今天就是学不进去,还在狂看布料,想自己做包什么的。。。
但仔细想想,有必要吗?有用吗?实际上并没有。
审了一篇稿。
作者构建了首个同时覆盖 RGB 与光谱信息的综合食物多模态基准Spectral Food (SFOOD)。在普通的视觉图像信息之外,作者还额外采集了部分食品的图片、重量、甜度、高光谱的信息,相较于单视觉图片信息能够从更多的维度去分析Food。
在这个基准上,并能够将该数据集运用到6个不同的食品领域的分析任务,如VQA和实例分割。论文的主要findings是发现当前LVLM在多维食物属性理解上仍存在缺陷、以及Spectrum data is helpful for analyzing food properties.然而,论文存在一些可以改进的地方。下面是相关的修改意见:
- 写作上需要避免可能出现的二义性。比如,论文中仅在图解上有写是3,266 subcategories,但是在摘要以及其他地方都没有提及。这些具体分类的情况。
- 相关工作部分:因为下游任务的数量过多,所以只是简要的介绍了相关研究。调研光谱食物分析相关研究的论文不够新。
- 数据集方面:有些解释不是很详细、不全面。比如在解释食物重量相关的数据时,作者解释说是从网上以及开源数据集中得到的相关数据。但是并没有详细解释这些数据是否具有可信性、以及重量单位是否一致等问题。
- 实验部分:作者将提出的基准在已有的模型上进行测试。但是选择的对比模型太老了,不够前沿。比如实例分割部分的对比实验,选取的都是五年以前的模型。此外,对于实验的分析结果不够详细,解释上不够充分。
- 作者的结论之一是说Spectrum data is helpful for analyzing food properties.但是实验仅在fruit sweetness prediction and herbal classification 上对比了光谱数据和RGB图片数据。但是更多的实验都是仅在光谱数据集上单独训练模型,并不能充分论证作者的结论。