Schwertlilien
As a recoder: notes and ideas.

2025-10-6

对明天会议讨论的论文进行总结

这是他的评审过程:

https://openreview.net/forum?id=UsgFE3cxuP

或许我现在手上有几种可能的方案,他们可以去试试看做?这样的话我们不就可以同步推进很多的paper,好挂名???

⚠️注意:下周二继续安排论文阅读分享。
小结

  1. 数据标注与项目进展

当前任务需继续推进数据标注工作。对于下一个阶段的数据,由石浩辰负责提供zip包,以便团队启动下一周的数据标注(✅已完成)。
数据环节先处理已标注的部分,后处理未标注的部分,具体将在10月8日发出下一组数据。==需要跟进当前版本数据集上出现的标注问题,并与对方小组进行沟通,确保问题得到解决。==

  1. 论文分析:学习经验、规避风险

讲解了一篇Mask-CLIP Plus的工作,该论文虽被ICLR拒稿,但仍具参考价值,因为它披露了审稿人意见,可以帮助团队规避类似问题。
该论文存在以下主要问题:

方法创新性不足:核心贡献是调用并微调一个既有的分割网络模块,而非提出全新的框架。
实验设计不佳:对比实验中缺少与原始模型(如Mask-CLIP)的直接比较,并且混乱地设置了多个变量,使得实验结论不可靠。

同时指出论文本身作者在写作上的部分瑕疵,也影响了阅读体验。

  1. 对后续项目的启发与思考
  • 切入点聚焦:应将研究领域聚焦于特定垂直场景,如“菜品”识别特定类型的食材。这种聚焦的视角可能比通用方法更具针对性和创新潜力。
  • Prompt工程:可以在输入文本(prompt)上进行灵活修改,例如加入具体的菜品描述(如“XX菜的配料”),而不必改动模型结构。
  • GT Mask的数据策略:目前仅有少量可用的Ground Truth(真实)分割标签(约2000张),可尝试利用这些数据在更大的测试集上进行效果评估。
  • 技术路径优化:除了解耦化的mask generator外,还可以从CLIP模型自身入手进行改进,例如采用模型蒸馏等技术。

ZegFormer小结

  1. 零样本分割论文的讨论与理解:会议中,石浩辰 跟进了武汉大学等机构发表的一篇关于零样本分割的论文。论文工作主要基于 previous work,通过 Posec-G 形式进行了改进,在图文相似度计算外增加了FEATURE聚合模块以优化分割表现。

  2. 学术研究方法论指导

    • 讨论了深度学习中的基本概念,如判别式(Discriminative)和生成式(Generative)方法,强调基础理论的重要性。
  • 提出了阅读和分析论文的系统性方法:首先看摘要和引言把握整体,再通过related work了解背景;重点关注方法框架,弄清每项改进的目的与逻辑;并对实验部分进行深入分析,包括消融实验的设计思路。

  • 强调了实践的重要性,建议在目标方向上,可以尝试从基础的CLIP、2021年的研究成果入手,逐步建立知识体系。

  1. 团队协作与资源问题:讨论了团队后续的标注分工,建议将框选(划框)和填写额外信息的工作分开进行。
搜索
匹配结果数:
未搜索到匹配的文章。