Schwertlilien
归档
分类
标签
关于
搜索
归档
分类
标签
关于
Schwertlilien
As a recoder: notes and ideas.
标签 : 每天の学习日记
2025
七月
2025-7-1
Q:在detrtgt2 = self.self_attn(q, k, value=tgt2, attn_mask=tgt_mask,key_p...
2025-07-01
六月
2025-6-30
探讨Transformer中的QKV 此处是对Transformer-Transfomer Encoder Layer其中两处代码理解上存在的问...
2025-06-30
2025-6-28
今天主要是把detr的代码基本看完,还剩下transformer代码、matcher代码都应该比较好啃。 看代码的过程中,一开始看:我趣这么牛x...
2025-06-28
2025-6-27-对于nn.Embeddding的理解
对于nn.Embeddding的理解nn.Embedding(num_embeddings, embedding_dim)是一个索引表。根据输入...
2025-06-27
2025-6-24
暂时不考虑进行开放词汇检测、后续可以扩展。 感觉下面是一些可以用到的工具: 12345from ultralytics.utils.ops i...
2025-06-24
四月
2025-4-13-再探DeepSeek之MLA+MoE
4/16: 感觉MoE此处还得修修补补。 4/15: 写了两天了,尊嘟很长。顺便diss一下下面的三篇blog。虽然算是比较偏算法讲解部分,但...
2025-04-13
2025-4-4-训练数据的收集、与策略梯度操作
训练数据收集初版: 一开始Agent是完全随机、乱给的$\{s,a\}$,记录下来;然后做很多的episodes,得到相当多的数据。 评价每...
2025-04-04
三月
2025-3-28/29-RL简介
3.28: 难绷,一直在补坑。。。 这个补完了:AI Agent介绍 3.29: 这几天一直在看Reinforcement Learning。...
2025-03-28
2025-3-21-AI-Agent?
AI Agent 比较正规的解释:AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。它们具备记忆、逻辑分析能力和任...
2025-03-21
2025-3-10-不打算使用KD
不考虑使用知识蒸馏了。因为想用的话存在以下的问题: 没有现有的开源的有关于食品目标检测任务的大型模型 教师模型和学生模型一般都要在同一数据集下...
2025-03-13
1
2
3
搜索
匹配结果数:
未搜索到匹配的文章。