wow! A good question is How to collect data to build a dataset.
现在要完成下面的一些问题:
- 分割数据集-标注工具,怎么标注
- 上界做到??最好的分割方法
- 方法构建-当前的最新的方法
- 如何评估
- 分期推进数据 数据集的标注进展
数据收集...
Q: 开放词汇vs开放集vs开放世界??
A: 开放词汇的解释。
Open-Set Object Detection:模型不仅需要识别图像中的已知目标对象(即已知类别),还需要能够识别出图像中不属于已知类别的未知目标对象,并拒绝将它们错误...
课题背景:
随着LLM大模型和多模态技术的快速发展,给下一代广告系统带来了重大机会,LLM可以根据广告平台的投放经验和数据,并且结合对广告大模型的理解,通过Reflection、RLHF等技术构建与真实环境交互的Agent,从而实现专家级别的广告账号管理,实现最高的ROI。同时广告Agent可探索根据用户的兴趣,个性化实现在线素材生产,最终实现广告素材和创意样式的千人千面,极大撬动用户和商品的匹配效率。
课题挑战:
...
参考资料:
一开始面对其的疑惑:
- 实例分割?和语义分割、以及其他分割任务有何区别?
- 为什么近年来的相关论文很少了?基本上集中在2020-2022年?目前还有在做实例分割的,多是3D开放世界实例分割。难道是因为SAM...
4/16:
感觉MoE此处还得修修补补。
4/15:
写了两天了,尊嘟很长。顺便diss一下下面的三篇blog。虽然算是比较偏算法讲解部分,但是还是有错误的。比如:
5 个月前抽象MNIST作业,来自于GPT生成()
📄 实验报告:基于 ResNet50 的 MNIST 手写数字识别
5 个月前Yang, Chuanguang, et al. “Multi-Teacher Knowledge Distillation with Reinforcement Learning for Visual Recognition.” arXiv preprint arXiv:2502.18510 (2025).
也是用了RL,但是不是很fit我的想法捏。
此处使用到的是知识蒸馏为主、关于奖励函数设计、以及...
5 个月前Liu, Ziyu, et al. “Visual-rft: Visual reinforcement fine-tuning.” arXiv preprint arXiv:2503.01785 (2025).
这个标题倒是很fit我的想法;但是他们根本就没写什么很突出的东西;
说是视觉上的RFL,实际上应该算是有关AI智能体的扩展。
因为使用的Agent是LLM;而且实际上也是自己设计了...
