Schwertlilien
As a recoder: notes and ideas.

2025-3-20

晚上很饿,遂吃一个香蕉,发现能迅速有效缓解饥饿,赞。

PPT要改的地方:

每个组件 都相较于原来的、改变了什么、为什么比原有的效果好?好在哪里?

再就是听众不清楚强化学习、先介绍一下强化学习是什么。

用一个PPT介绍、再就是给每个组件都举例说明。

为什么是两次SFT+RL?不是三次?

实验需要修改的地方:

  1. 添加一两个近年few-shot方法
  2. 跑food200上所有实验
  3. 把training algorithm改成CLIP再跑结果

师姐说:"主要是方法要换成CLIP得一个实验结果,我不知道这个能不能做出来"

搜索
匹配结果数:
未搜索到匹配的文章。