Schwertlilien
归档
分类
标签
关于
搜索
归档
分类
标签
关于
Schwertlilien
As a recoder: notes and ideas.
分类 : 强化学习
2025
四月
2025-4-4-训练数据的收集、与策略梯度操作
训练数据收集 初版: 一开始Agent是完全随机、乱给的\(\{s,a\}\),记录下来;然后做很多的episodes,得到相当多的数据...
2025-04-04
三月
2025-3-28/29-RL简介
3.28: 难绷,一直在补坑。。。 这个补完了:AI Agent介绍 3.29: 这几天一直在看Reinforcement Le...
2025-03-28
1
搜索
匹配结果数:
未搜索到匹配的文章。