2025-3-8-一些相关代码存储

放置一些代码:有关DETR,主要是position encoding+prediction head。

其他内容无。

Carion, Nicolas, et al. “End-to-end object detection with transformers.” European conference on computer vision. Cham: Springer International Publish...

2025-3-3

一、模型架构设计与改进

目标检测中,可能用大模型(教师)指导小模型(学生)的学习。但如何设计蒸馏的损失函数,比如特征图对齐或者预测分布匹配,需要考虑检测任务的特点,如边界框回归和分类。

2025-2-24-Deepseek解析

我勒个豆,我写了好几天,令人感叹的效率()

感觉似乎V3的内容会多一点,然后R1和R1-Zero会比较偏向于阐述(?)

或者说是因为细节的东西没给出来,所以全是大段地阐述文字,基本框架组件和v3应该一致.

具体到奖励函数的设计,$r_i$等等,就没有详细的解释了.

[TOC]