Schwertlilien
归档分类标签关于
搜索
归档分类标签关于
Schwertlilien
As a recoder: notes and ideas.

标签 : 强化学习

2025
四月
2025-4-4-训练数据的收集、与策略梯度操作
训练数据收集 初版: 一开始Agent是完全随机、乱给的\(\{s,a\}\),记录下来;然后做很多的episodes,得到相当多的数据...
2025-04-04
三月
2025-3-28/29-RL简介
3.28: 难绷,一直在补坑。。。 这个补完了:AI Agent介绍 3.29: 这几天一直在看Reinforcement Le...
2025-03-28
2025-3-21-AI-Agent?
AI Agent 比较正规的解释:AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。它们具备记忆、逻辑分析...
2025-03-21
2025-3-15-强化学习
序列建模与概率图模型 时间序列数据:大量数据与时间相关,是研究对象。 序列建模:对序列数据进行学习、掌握其内在模式和规律。 概率图模型(P...
2025-03-15
1
搜索
匹配结果数:
未搜索到匹配的文章。
2022 - 2025 SchwertlilienPowered by Hexo & Theme Meow
总访问量 : 总访客数 :