Schwertlilien
As a recoder: notes and ideas.

2025-3-15-强化学习

序列建模与概率图模型

时间序列数据:大量数据与时间相关,是研究对象。

序列建模:对序列数据进行学习、掌握其内在模式和规律。

概率图模型(Probabilistic Graphical Model):刻画变量之间相关性(无向图)、以及显示存在的因果关系(有向图)

有向图:贝叶斯网络。有向边表示条件概率分布。

联合概率分布:$Parents(x_i)$是$x_i$的父节点。

image-20250315155805994

概率图模型三要素:

  1. 表示(Representation):表征变量之间概率依赖关系
  2. 推断(Inference):在已知部分变量时计算其他未知变量的概率分布
  3. 学习(Learning):通过观测数据来估计模型参数

常见推断方法

  1. 极大似然估计(Maximum Likelihood Estimation,MLE)
  2. 最大后验估计(Maximum A Posterior,MAP)
  3. 期望最大化(Estimation-Maximization,EM)-_>处理隐变量(GMM)
  4. 贝叶斯推断(Bayesian Inference,BI)-> 处理数据不足、干扰
  5. 马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo,MCMC)->计算量大
  6. 变分推断(Variational Inference,VI)->后验分布寻找最合适的分布

image-20250315165538450

搜索
匹配结果数:
未搜索到匹配的文章。