5 个月前
Zhu, Jiachen, et al. Transformers without Normalization.
一句话概括:我们使用tanh函数取缔了Transformer中的Normalization Layer。

5 个月前
芜湖,跑了100h的pretrain-model跑完了,acc在0.93左右。但是f1-score比较低,在0.2左右,可能与数据集的划分有关。

时间来到4.9,CPEA已经跑完了。决定下个跑C_2023,还在艰苦配...
5 个月前
5 个月前
5 个月前
3.28:
难绷,一直在补坑。。。
这个补完了:AI Agent介绍
3.29:
这几天一直在看Reinforcement Learning。是的,我的框架还没搭好,原因是看的太浅了,不了解RL的一些执行细节,虽然之前有看过Markov Process,但是又是一段时间过...
5 个月前
5 个月前
继续实验,今天要做的实验是:(ICML 2023) A Closer Look at Few-shot Classification Again
5 个月前
5 个月前
5 个月前
5 个月前
5 个月前
5 个月前
搜索
匹配结果数:
未搜索到匹配的文章。