归档

2025
四月
2025-4-18-字节广告
课题背景: 随着LLM大模型和多模态技术的快速发展,给下一代广告系统带来了重大机会,LLM可以根据广告平台的投放经验和数据,并且结合对广告...
2025-04-18
2025-4-18-实例分割调研
参考资料: IBM-对实例分割的介绍 一开始面对其的疑惑: 实例分割?和语义分割、以及其他分割任务有何区别? 为什么近年来的相关...
2025-04-18
2025-4-13-再探DeepSeek之MLA+MoE
4/16: 感觉MoE此处还得修修补补。 4/15: 写了两天了,尊嘟很长。顺便diss一下下面的三篇blog。虽然算是比较偏算法讲解...
2025-04-13
2025-4-12-MNIST实验报告
抽象MNIST作业,来自于GPT生成() 📄 实验报告:基于 ResNet50 的 MNIST 手写数字识别 实验概述 📌 ...
2025-04-12
2025-4-11-Yang-arxiv-2025
Yang, Chuanguang, et al. "Multi-Teacher Knowledge Distillation with R...
2025-04-11
2025-4-11-Liu-arxiv-2025
Liu, Ziyu, et al. "Visual-rft: Visual reinforcement fine-tuning." arX...
2025-04-10
2025-4-10-Transformers without Normalization
Zhu, Jiachen, et al. Transformers without Normalization. 一句话概括:我们使用...
2025-04-10
2025-4-6-实验
芜湖,跑了100h的pretrain-model跑完了,acc在0.93左右。但是f1-score比较低,在0.2左右,可能与数据集的划分有关。...
2025-04-06
2025-4-4-训练数据的收集、与策略梯度操作
训练数据收集 初版: 一开始Agent是完全随机、乱给的\(\{s,a\}\),记录下来;然后做很多的episodes,得到相当多的数据...
2025-04-04
2025-4-1-继续实验
CPEA 话说,感觉《一兆游戏》第一集25.50-30.00这一段配三个人非常easy。 还是先看论文吧 Backbone基本上是...
2025-04-01