搜索

Schwertlilien

As a recoder: notes and ideas.

标签 : 每天の学习日记

Q：在detrtgt2 = self.self_attn(q, k, value=tgt2, attn_mask=tgt_mask,key_p...

探讨Transformer中的QKV 此处是对Transformer-Transfomer Encoder Layer其中两处代码理解上存在的问...

今天主要是把detr的代码基本看完，还剩下transformer代码、matcher代码都应该比较好啃。看代码的过程中，一开始看：我趣这么牛x...

2025-6-27-对于nn.Embeddding的理解

对于nn.Embeddding的理解nn.Embedding(num_embeddings, embedding_dim)是一个索引表。根据输入...

暂时不考虑进行开放词汇检测、后续可以扩展。感觉下面是一些可以用到的工具： 12345from ultralytics.utils.ops i...

2025-4-13-再探DeepSeek之MLA+MoE

4/16：感觉MoE此处还得修修补补。 4/15: 写了两天了，尊嘟很长。顺便diss一下下面的三篇blog。虽然算是比较偏算法讲解部分，但...

2025-4-4-训练数据的收集、与策略梯度操作

训练数据收集初版：一开始Agent是完全随机、乱给的$\{s,a\}$,记录下来；然后做很多的episodes，得到相当多的数据。评价每...

2025-3-28/29-RL简介

3.28：难绷，一直在补坑。。。这个补完了：AI Agent介绍 3.29：这几天一直在看Reinforcement Learning。...

2025-3-21-AI-Agent?

AI Agent 比较正规的解释：AI Agent（人工智能体）是一种能够感知环境、进行决策和执行动作的智能实体。它们具备记忆、逻辑分析能力和任...

2025-3-10-不打算使用KD

不考虑使用知识蒸馏了。因为想用的话存在以下的问题：没有现有的开源的有关于食品目标检测任务的大型模型教师模型和学生模型一般都要在同一数据集下...

12 3

搜索

匹配结果数:

未搜索到匹配的文章。