除了学习什么都想干()
于是去看歴史了()
唐后是五代十国,五代十国是宋代前的奇妙过度时期。
当然,人民很惨。究其原因,与频繁的战争分不开。古时的兵与匪无甚区别,占据了一城,将军便会允许手下的兵去城池中烧杀掳掠,金钱、女人、粮食、无外乎此。
而这种事情是非常常见的、一直持续到近代。所以说人民的军队才会那么受到百姓的拥护。
五代十国时,大家都见机行事。每任皇帝、每...
除了学习什么都想干()
于是去看歴史了()
唐后是五代十国,五代十国是宋代前的奇妙过度时期。
当然,人民很惨。究其原因,与频繁的战争分不开。古时的兵与匪无甚区别,占据了一城,将军便会允许手下的兵去城池中烧杀掳掠,金钱、女人、粮食、无外乎此。
而这种事情是非常常见的、一直持续到近代。所以说人民的军队才会那么受到百姓的拥护。
五代十国时,大家都见机行事。每任皇帝、每...
放置一些代码:有关DETR,主要是position encoding+prediction head。
其他内容无。
Carion, Nicolas, et al. “End-to-end object detection with transformers.” European conference on computer vision. Cham: Springer International Publish...
匈牙利算法:Kuhn, H. W. “The Hungarian Method for the Assignment Problem.” Naval Research Logistics Quarterly, pp. 83–97, https://doi.org/10.1002/nav.3800020109.
DETR:C...
目标检测中,可能用大模型(教师)指导小模型(学生)的学习。但如何设计蒸馏的损失函数,比如特征图对齐或者预测分布匹配,需要考虑检测任务的特点,如边界框回归和分类。
整体架构:与Janus同。
改进点:
我勒个豆,我写了好几天,令人感叹的效率()
感觉似乎V3的内容会多一点,然后R1和R1-Zero会比较偏向于阐述(?)
或者说是因为细节的东西没给出来,所以全是大段地阐述文字,基本框架组件和v3应该一致.
具体到奖励函数的设计,$r_i$等等,就没有详细的解释了.
[TOC]