2025-4-22-数据集收集工作推进

wow! A good question is How to collect data to build a dataset.

现在要完成下面的一些问题:

  1. 分割数据集-标注工具,怎么标注
  2. 上界做到??最好的分割方法
  3. 方法构建-当前的最新的方法
  4. 如何评估
  5. 分期推进数据 数据集的标注进展

数据收集...

2025-4-20-论文评审

Q: 开放词汇vs开放集vs开放世界??

A: 开放词汇的解释

Open-Set Object Detection:模型不仅需要识别图像中的已知目标对象(即已知类别),还需要能够识别出图像中不属于已知类别的未知目标对象,并拒绝将它们错误...

2025-4-18-字节广告

课题背景:

随着LLM大模型和多模态技术的快速发展,给下一代广告系统带来了重大机会,LLM可以根据广告平台的投放经验和数据,并且结合对广告大模型的理解,通过Reflection、RLHF等技术构建与真实环境交互的Agent,从而实现专家级别的广告账号管理,实现最高的ROI。同时广告Agent可探索根据用户的兴趣,个性化实现在线素材生产,最终实现广告素材和创意样式的千人千面,极大撬动用户和商品的匹配效率。

课题挑战:

...

2025-4-11-Yang-arxiv-2025

Yang, Chuanguang, et al. “Multi-Teacher Knowledge Distillation with Reinforcement Learning for Visual Recognition.” arXiv preprint arXiv:2502.18510 (2025).

也是用了RL,但是不是很fit我的想法捏。

此处使用到的是知识蒸馏为主、关于奖励函数设计、以及...

2025-4-11-Liu-arxiv-2025

Liu, Ziyu, et al. “Visual-rft: Visual reinforcement fine-tuning.” arXiv preprint arXiv:2503.01785 (2025).

这个标题倒是很fit我的想法;但是他们根本就没写什么很突出的东西;

说是视觉上的RFL,实际上应该算是有关AI智能体的扩展。

因为使用的Agent是LLM;而且实际上也是自己设计了...