Schwertlilien
As a recoder: notes and ideas.

多元统计分析-Ch1 多元分布

【挑战20天学完多元统计分析,让我们说:DDL是最佳生产力!】

Ch1 多元分布

[TOC]

1.0 预备知识

1.0.1 随机变量

随机变量期望、矩、方差:

期望
方差

1.0.2 随机向量

相互独立,当且仅当,其中的边缘分布函数。

联合分布函数
联合概率密度函数(非负) 存在满足下式:
边缘分布 (也就是选取随机向量中的部分、构成的分布)。个分量()的分布称为边缘分布。
边缘概率密度函数 :
条件密度 , 在给定的条件密度为:$f(x^{(2)} X^{(1)}=x^{(1)})=\frac{f(x^{(1)},x^{(2)})}{g(x^{(1)})}g(x^{(1)})X^{(1)}$的边缘概率密度函数。

1.0.3 多元随机变量(随机向量)

期望
协方差
协方差

1.0.4 矩阵知识

一些运算:

  • :期望和trace的计算等级相同。

  • :二次型,此公式将期望值分解为常数项(期望向量的二次型)和随机项(协方差矩阵与 A 的迹)。

分块矩阵:

,其中是非退化的方阵(可逆,满秩)。

,则有

, 则有:

image-20241128173119356

1.0.5 多元特征函数

(特征函数与概率分布函数一一对应)随机向量的特征函数为:

其中, , 是虚数单位()

性质:

  1. 对正整数, 如果存在, 则
  2. , 分量的特征函数是.
  3. 的边缘特征函数分别为, 记的特征函数是, 则相互独立的充分必要条件是:.
  4. 维随机向量的特征函数分别为, 如果相互独立, 则随机向量和 的特征函数为: .

Q:我个人感觉这个地方是不是写错了?Y怎么会是p维向量?那角标不应该是p吗?

A: 在这里, 是独立的随机向量,每个 依然是 维的,所以 是多个 维向量

1.1 一元正态分布

【分布密度】若随机变量的概率密度函数为:

其中$-\infty0X\overset{d}{\sim}N(\mu,\sigma^2)\mu\sigma^2$是方差。

1.2 多元正态分布

【分布密度】若元随机向量服从参数为的多元正态分布,其概率密度函数为:

其中为p阶正定矩阵,记为

d 代表服从分布(distribution),是多元正态分布的方差

p元标准正态分布:

定理1:设p元随机向量, 其中的行满秩矩阵,, 随机向量, 则, 其中.

证明:随机向量 的特征函数定义为:

其中,是与 同维度的向量。

代入 到特征函数的定义中,得到:

由于 维标准正态随机向量,,其特征函数为:

这里 是与 同维度的向量。

我们知道,一个 维正态分布 的特征函数为:

因此,服从 分布,即:

如何产生的(伪)随机数?—==Cholesky 分解==

生成的标准正态分布随机向量 可以通过下列变换得到目标分布, L 是 Cholesky 分解得到的下三角矩阵,Z是标准正态随机向量。

1.2.2 性质

性质 说明:
1.密度函数 $p(x)=(2\pi)^{-\frac p 2}\ \Sigma\ ^{-\frac 1 2}\exp\left\{-\frac 1 2 (x-\mu)’\Sigma^{-1}(x-\mu)\right\}$
2.特征函数
3.期望方差
4.线性变换
5.相互独立 相互独立,, 则
6.卡方分布 , 则, 其中是自由度为p的卡方分布。
7.矩阵分解 ,则
8.分量独立性 ,则相互独立的充要条件.
9.条件分布 $(X_1 X_2=x_2)\overset{d}{\sim}N_q(\mu_{1 2},\Sigma_{1 2})\mu_{1 2}=E(X_1 X_2=x_2)=\mu_1+\Sigma_{12}\Sigma_{22}^{-1}(x_2-\mu_2)\Sigma_{1 2}=Cov(X_1 X_2=x_2)=\Sigma_{11}-\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}(\Sigma_{1 2}\le\Sigma_{11})$
10.变量的独立分解 ;;则相互独立,相互独立,且$Y_1\overset{d}{\sim}N_q(\mu_1,\Sigma_{11}),Y_2\overset{d}{\sim}N_{p-q}(\mu_2-\Sigma_{21}\Sigma_{11}^{-1}\mu_1,\Sigma_{2 1})Z_2\overset{d}{\sim}N_{p-q}(\mu_2,\Sigma_{22}),Z_1\overset{d}{\sim}N_q(\mu_1-\Sigma_{12}\Sigma_{22}^{-1}\mu_2,\Sigma_{1\ 2}(\Sigma_{2 1}=\Sigma_{22}-\Sigma_{21}\Sigma_{11}^{-1}\Sigma_{12})$

1.3 相关系数

定义 说明
相关系数
相关矩阵R
偏相关系数 , 则$(X_1^{(q)}\ X_2^{(p-q)})\overset{d}{\sim}N_q(\mu_{1 2},\Sigma_{1 2})X_2^{(p-q)}X_iX_j\rho_{(ij) (1 2)}=\frac{\sigma_{(ij) (1 2)}}{\sqrt{\sigma_{(ii) (1 2)}}\sqrt{\sigma_{(jj) (1 2)}}}$
精度矩阵 设随机向量,有, 那么称的精度矩阵。

偏相关系数是图模型和因果推断中的重要统计量,可以由特征函数+期望+方差,可以通过偏相关系数判别多元正态随机向量分量之间的条件独立性

精度矩阵的性质:

  1. , 则, 其中, 设, 有如下分解:

  2. 给定的条件下,相互条件独立的充要条件是(是精度矩阵 中的元素,表示在给定其他所有变量的条件下, 的关系的强度。)

    证明:

    由(分量独立性):, 则相互独立的充要条件.

    条件独立的充要条件为,;则推广有.

    无量纲:因为精度矩阵的数值与变量的量纲有关,所以进行标准化处理。令

    ,(将得到的C根据分块)。

    在给定的条件下,条件独立的充要条件.

1.3.1 练习

image-20241201094117103

image-20241201094132212

对于

image-20241201095141147

预测:计算y关于的条件期望,从而用预测:

image-20241201101835469

1.4 矩阵多元正态分布

1.4.0 矩阵拉直和Kronecker积

矩阵拉直:记的矩阵。矩阵拉直运算,是将矩阵按拉直为向量

Kronecker积:令,A和B的Kronecker积记为:

的计算步骤如下:

拉直运算和Kronecker积的性质

性质 说明
1 对任意实数,有
2
3
4
5
6 都是非奇异的方阵,则
7
8 分别是阶方阵,则
9 分别是的矩阵,则。(如果我们对矩阵 进行线性变换 ,那么其 “拉直” 形式(即按列展开)将受到 Kronecker积的影响。)

1.4.1 矩阵分布

i.i.d.(独立同分布, independent and identically distributed),,即 是来自 元正态总体 的独立样本。

,则 是一个 的随机矩阵。

随机矩阵的期望:, 其中

矩阵的拉直运算:

随机矩阵的协方差阵:

随机矩阵的分布:随机矩阵拉直后的随机向量的分布。

矩阵的运算 由于,有

,其中阶单位阵。

是因为 独立同分布,所以它们的都是一样的。

随机矩阵拉直运算的性质(转置)

性质1:对 的随机矩阵 ,若有

其中, 分别是 维列向量, 分别是 阶方阵,则

由性质1,对上述随机矩阵

因此,对由 维正态总体的独立样本组成的随机矩阵

1.4.3 矩阵正态分布

矩阵正态分布是指矩阵的每一列或每一行都服从正态分布,且这些列或行之间可能具有某种协方差结构。

矩阵正态分布的一个重要特性是它的“拉直”形式也是正态分布。

假设矩阵 是一个 的矩阵,它的“拉直”(vectorization)形式 也就是把矩阵按列展开成一个向量。如果这个向量服从正态分布,我们就说矩阵 服从 矩阵正态分布。更具体地:

  • 如果 ,我们说矩阵 服从矩阵正态分布,记为:

一般地,记 的正态随机矩阵为 ,其中

分别是 阶方阵(正定阵),分别控制着的行列之间的协方差结构。

从这个分布,可以得到的拉直形式服从以下正态分布:

密度函数

矩阵正态分布的密度函数表示了矩阵 出现某种特定值的概率。

,其密度函数如下:

上式等价于(用迹的性质进行简化):

证明:(即证)

利用Kronecker积的一个重要性质: 其中 分别是 的矩阵。

线性变换

如果矩阵服从正态分布,经过线性变换后,结果仍然服从矩阵正态分布,只是均值和协方差矩阵发生了变化。

性质2:设 的矩阵 服从矩阵正态分布

对其进行线性变换 其中 是常数矩阵。

则矩阵的分布将是:

:这是矩阵 的均值矩阵,表示了经过线性变换后的期望。

:这是矩阵 的协方差矩阵,表示了变换后的行列协方差结构。

搜索
匹配结果数:
未搜索到匹配的文章。