放置一些代码:有关DETR,主要是position encoding+prediction head。
其他内容无。
Carion, Nicolas, et al. “End-to-end object detection with transformers.” European conference on computer vision. Cham: Springer International Publish...
1 年前
1 年前
匈牙利算法:Kuhn, H. W. “The Hungarian Method for the Assignment Problem.” Naval Research Logistics Quarterly, pp. 83–97, https://doi.org/10.1002/nav.3800020109.
DETR:C...
1 年前
一、模型架构设计与改进
目标检测中,可能用大模型(教师)指导小模型(学生)的学习。但如何设计蒸馏的损失函数,比如特征图对齐或者预测分布匹配,需要考虑检测任务的特点,如边界框回归和分类。
1 年前
1 年前
1 年前
Janus-Pro
整体架构:与Janus同。
改进点:
- 优化训练策略(Optimized Training Strategy)
- 扩展训练数据(Data Scaling)
- 扩展模型规模(Model Scaling)
1 年前
1 年前
我勒个豆,我写了好几天,令人感叹的效率()
感觉似乎V3的内容会多一点,然后R1和R1-Zero会比较偏向于阐述(?)
或者说是因为细节的东西没给出来,所以全是大段地阐述文字,基本框架组件和v3应该一致.
具体到奖励函数的设计,$r_i$等等,就没有详细的解释了.
[TOC]
1 年前
搜索匹配结果数: 未搜索到匹配的文章。
1 年前
1 年前
1 年前
Janus-Pro
整体架构:与Janus同。
改进点:
- 优化训练策略(Optimized Training Strategy)
- 扩展训练数据(Data Scaling)
- 扩展模型规模(Model Scaling)
1 年前
1 年前
我勒个豆,我写了好几天,令人感叹的效率()
感觉似乎V3的内容会多一点,然后R1和R1-Zero会比较偏向于阐述(?)
或者说是因为细节的东西没给出来,所以全是大段地阐述文字,基本框架组件和v3应该一致.
具体到奖励函数的设计,$r_i$等等,就没有详细的解释了.
[TOC]
1 年前
1 年前
搜索
匹配结果数:
未搜索到匹配的文章。