Schwertlilien
归档
分类
标签
关于
搜索
归档
分类
标签
关于
Schwertlilien
As a recoder: notes and ideas.
标签 : 每天の学习日记
2025
四月
2025-4-13-再探DeepSeek之MLA+MoE
4/16: 感觉MoE此处还得修修补补。 4/15: 写了两天了,尊嘟很长。顺便diss一下下面的三篇blog。虽然算是比较偏算法讲解...
2025-04-13
2025-4-4-训练数据的收集、与策略梯度操作
训练数据收集 初版: 一开始Agent是完全随机、乱给的\(\{s,a\}\),记录下来;然后做很多的episodes,得到相当多的数据...
2025-04-04
三月
2025-3-28/29-RL简介
3.28: 难绷,一直在补坑。。。 这个补完了:AI Agent介绍 3.29: 这几天一直在看Reinforcement Le...
2025-03-28
2025-3-21-AI-Agent?
AI Agent 比较正规的解释:AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。它们具备记忆、逻辑分析...
2025-03-21
2025-3-10-不打算使用KD
不考虑使用知识蒸馏了。因为想用的话存在以下的问题: 没有现有的开源的有关于食品目标检测任务的大型模型 教师模型和学生模型一般都要在同一数...
2025-03-13
2025-3-8-一些相关代码存储
放置一些代码:有关DETR,主要是position encoding+prediction head。 其他内容无。 Carion, N...
2025-03-08
2025-3-4-为什么DETR中要使用匈牙利算法???
匈牙利算法:Kuhn, H. W. “The Hungarian Method for the Assignment Problem.” ...
2025-03-04
三月
2025-2-26-Janus-Pro
Janus-Pro 整体架构:与Janus同。 改进点: 优化训练策略(Optimized Training Strategy) 扩...
2025-02-26
2025-2-24-Deepseek解析
我勒个豆,我写了好几天,令人感叹的效率() 感觉似乎V3的内容会多一点,然后R1和R1-Zero会比较偏向于阐述(?) 或者说是因为细节...
2025-02-24
2023
三月
2023.3.28
2023.3.28 U-GAT-IT Unsupervised Generative Attentional networks wi...
2023-03-28
1
2
3
搜索
匹配结果数:
未搜索到匹配的文章。