多元统计分析-复习(上)
期末复习-上
[TOC]
知识复习
Ch1 多元分布
不考的
- 特征函数
- 分块矩阵
- 偏相关系数、精度矩阵
- 矩阵拉直、Kronecker积、矩阵分布
1.1 矩阵知识
出送分题,计算二维协方差矩阵,对角线是方差
1.2 多元正态分布
似然=密度。会算似然比、极大似然估计。
1.2.1 密度函数
若
其中
1.2.2 线性变换(基本)
定理1:设p元随机向量
p元标准正态分布:
性质
给出的基本都要考。
性质 | 说明: |
||||||||
---|---|---|---|---|---|---|---|---|---|
密度函数 | $p(x)=(2\pi)^{-\frac p 2}\ | \Sigma\ | ^{-\frac 1 2}\exp\left\{-\frac 1 2 (x-\mu)’\Sigma^{-1}(x-\mu)\right\}$ | ||||||
期望方差 | |||||||||
线性变换 | |||||||||
相互独立 | 设 |
||||||||
卡方分布 | |||||||||
边缘分布 | |||||||||
分量独立性 | |||||||||
条件分布 | $(X_1 | X_2=x_2)\overset{d}{\sim}N_q(\mu_{1 | 2},\Sigma_{1 | 2}) |
2}=E(X_1 | X_2=x_2)=\mu_1+\Sigma_{12}\Sigma_{22}^{-1}(x_2-\mu_2) |
2}=Cov(X_1 | X_2=x_2)=\Sigma_{11}-\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21} |
2}\le\Sigma_{11})$ |
条件分布考:给出公式计算即可。
1.3 相关系数
计算相关系数,定义知道即可。
Ch2 由多元正态分布导出的分布
不考的:
- Wishart密度函数、部分性质
- 非中心的Hotelling
分布 - Wilks分布
2.1 Wishart分布
考一个Wishart分布小性质。
设随机向量
2.1.1 性质
简要说明 | 性质 |
---|---|
1.分布期望 | 若 |
2.线性变换 | 若 |
2.2 Hotelling 分布
Hotelling
得到的是数。注意
的协方差矩阵相同 且独立。 进行置信检验使用F分布而不是
.因为 本身就能化成F分布。
Ch3 多元正态分布的估计与检验
不考的:
- 极大似然估计中的正交分解
- 样本相关系数的精确分布和渐进分布
的假设检验 - 渐进分布的区间估计(渐进正态性)、方差齐性变换
- 正态总体均值的Bayes估计
- 多元BF问题
- 多元方差分析
- 独立性检验(很重要,但是不考)、条件独立性检验
- 多重比较
3.1 多元正态分布样本统计量
设
metric | 公式 | 说明 |
---|---|---|
样本均值 | 无偏估计,即 |
|
样本离差阵 | 衡量了样本点相对于样本均值的离散程度。 | |
样本协方差阵 | 对离差阵进行归一化 |
事实:
是 的完全充分统计量, 这意味着 和 包含了样本中关于总体参数 和 的所有信息。
3.1.1 ( , ) 的分布性质
; ; 与 相互独立。
证明:
(1)记
,则有 , 。 令
为 阶正交矩阵,其中:
的第一列 被特别选择为与样本均值方向相关的向量。令 记为 ,则 代表了样本均值方向上的信息, 则代表了与样本均值正交的剩余信息。 从上面的
可以得到: 相互独立,且 , 。 因而有 ,即(1)成立。 (2)由于
,即 ,因而有 所以(2)成立。 又由于
, ,因此 与 独立,即(3)成立。
3.2 多元正态分布的参数估计
密度函数给出,根据密度函数写似然。
3.2.1 极大似然估计
观测样本
首先求
易知
3.2.2 样本相关系数
样本相关系数是总体相关系数的估计,与其差距有多大,使用分布刻画。
知道样本相关系数可以检验X和Y独立,不考。
记
记
3.2.3 正态总体均值的置信域估计
考:
已知时化成 分布、 未知时化成 分布—>F分布 等价于似然比检验和区间估计、使用输入量构造统计量、与似然比殊途同归。
A.单总体
设
已知
如果总体协方差矩阵
则
即有
Q:
分布与置信域的联系? A: 具体来说,样本均值
和总体均值 之间的偏差经过标准化后(即通过协方差矩阵的逆来标准化)符合 分布。这意味着,我们可以通过卡方分布的分位点来构建置信区间。 置信域 D中
是卡方分布自由度为 时,置信度为 的分位点。这表示总体均值 在给定的样本数据下落入该置信域的概率为 。
未知
因为
由正态样本统计量的性质知 :
, , 且 与 独立. Hotelling
分布性质如下:
性质 说明 1. ,其中分子分母相互独立; 2.
因此有:
则当
即有
PS: 因为这个置信域D是一个二次型,那么上述的不等式就是对这个二次型的约束,所以,这个置信域是一个超椭球。
- 协方差矩阵
的逆 定义了椭球的方向和形状,特征值决定了每个方向上的伸缩因子。 分布的临界值 确定了超椭球的大小。
B.两总体
设独立总体
记
已知:
已知条件 | 对应公式 |
---|---|
样本X的样本离差阵和协方差矩阵 | |
样本Y的样本离差阵和协方差矩阵 |
我们下面讨论的问题是:
: ① 未知,② 已知 (这种情况在本课程中不涉及,下面也不会涉及)
因此下面对于
已知
由
根据二次型的性质:
,假设有个p阶方阵 ,则有 . 当 时, .
由此得到
未知
记
由
知
记
由于
进而可知
由此得到
3.3 多元正态分布的检验
本质上就是求似然比、知道一般形式、原则。
考,但是不会考复杂的。最多找一个非常简单的东西写一个似然比。
多元正态分布的检验问题包括:
单总体 | 多总体 | 多变量 |
---|---|---|
均值检验 | 均值比较检验 | 独立性检验 |
协方差检验 | 协方差比较检验 | 条件独立性检验 |
—- | 均值和协方差同时比较检验 | —- |
3.3.0 均值向量的改进估计
总体均值向量
:取值越大,表示 离 的距离越来越远,损失越来越大。 :用 估计 没有损失。
实际问题中,对于均值向量
已知
令
一个好的估计希望平方损失越小越好,在统计决策理论中,损失函数的平均值称为风险函数。
- 当p=1,2时:在平方和损失函数下,样本均值
是总体均值 的容许估计,改进不存在。 - 当p
3时:样本均值 是总体均值 的不容许估计。
极大似然估计:
设
是来自多元正态总体 的样本,其中 . 首先给定
时,求 的极大似然估计,即求对数似然函数 的极大值点。由式(5.3),给定 ,关于 的对数似然函数为 上式不等式中等号成立当且仅当
。因此,总体均值向量 的极大似然估计为样本均值向量 。由 ,因此,样本均值向量 是 的无偏估计。 将上式中的 用它的极大似然估计 替换,得到 的似然函数为: 令
,其中 是正交矩阵, 是对角矩阵,则上式可以简化为 由于
在 处取最大值,所以上式在 时取最大值,从而可知, 的极大似然估计 满足条件 。由此可见, 的极大似然估计为 。 定理5.1.2 设
为来自 元正态总体 的一组随机样本, , 为样本均值向量, 为样本离差阵,则 和 的极大似然估计分别为 和 。
3.3.1 单总体均值检验
设
记
似然比检验方法
假设我们有一个统计模型,参数空间为
, 其中包含了所有可能的参数值。检验问题通常表述为:
表述为参数 属于一个特定的子集 , 表述为参数 不属于原假设所定义的子集 , 即属于 中除 之外的所有可能值。符号 \ 表示集合的差集运算。 记样本
下的似然函数为 。 似然比定义为在原假设 下,似然函数的最大值与在整个参数空间 下的似然函数最大值之比。 此处写的是上确界(所有上界中最小的一个),即使
没有最大元素,但上确界仍然存在 ,这是sup与max的区别。 似然比检验统计量为 :
可以通过
在零假设 下的分布(零分布)构造检验的拒绝域。
(1) 已知的情形
均值参数
因此似然比检验统计量为
故当
(2) 未知的情形
记
其中
分母中的
继续计算
利用似然比原理,在
为检验统计量。并在
根据Hotelling
则当
检验的p值为:
栗子(检验单总体、两总体均值)
(1): 在正态假设下,哥特式教堂的长度和中殿长度是否与罗马式教堂具有相同的均值?
计算哥特式教堂数据的
n=16,p=2,
设定显著性水平为
结论:故拒绝零假设,
(2): 哥特式教堂的长度与罗马式教堂长度是否具有相同的均值?
这实际上是一个单总体正态分布检测。哥特式教堂的样本协方差阵:
t-检验与检验的p值:
总结:
(3): 哥特式教堂的中殿高度与罗马式教堂的中殿高度是否具有相同的均值?
总结:
两种教堂长度和中殿高度的比较问题(例1续)
如果设定
此时Hotelling
结论:拒绝零假设。
1’) 哥特式教堂的长度与罗马式教堂长度是否有相同均值的t - 检验、p值:
结论:因此认为哥特式教堂的长度与罗马式教堂长度有相同均值。
2’) 哥特式教堂的中殿高度与罗马式教堂的中殿高度是否有相同均值的t - 检验、p值:
结论:因此认为哥特式教堂的中殿高度与罗马式教堂的中殿高度有相同的均值。
3.3.2 两个多元总体均值比较的检验
记
两个总体均值是否相等的检验问题为:
注意:此时两个总体的协方差阵相等。 记
(1) 已知的情形
当
检验问题的似然比为:
则检验比检验统计量为:
当
(2) 未知的情形
记
当
检验问题的似然比为:
令 :
取
因此,当
MLE小结
似然比检验统计量由似然函数在极大似然估计下的似然函数值决定。
相同协方差阵下正态总体均值和协方差阵的极大似然估计(MLE):
均值 | 协方差阵 |
---|---|
单总体:均值的极大似然估计为样本均值; | 计算在给定均值极大似然估计下协方差阵的似然函数: |
多总体:各总体均值无约束的极大似然估计为各自的样本均值; | |
多总体:在各总体均值相等的约束条件下,均值的极大似然估计为将所有样本看成是来自同一总体时的样本均值; | 其中 |
Ch4 多元线性模型
不考的:(有些不太确定)
广义逆 有约束的最小二乘基本定理
左乘:有约束化为无约束-线性假设检验
右乘:均值子集的线性假设
多元线性回归模型中参数估计、假设检验、选取变量
- 多元线性模型的均值置信域和预测域
4.1 多元线性模型
要清楚多元线性模型中的每一个参数都代表什么、考基于矩阵形式
知道最小二乘估计的形式
理论上的总体形式,一元线性模型的定义:
其中,
而有了数据之后,可以写成矩阵的形式,估计它的最小二乘。
假设有
x 和 y 由向量转变为矩阵,原先只是在
空间,现在在 空间。
多元线性模型的定义如下:
其中:
是 阶观测的随机矩阵, ; 是已知的 阶设计矩阵, , ; (3)- 是
阶的未知回归系数矩阵; 是 阶不可观测的随机误差矩阵。
模型
我们假定
Q: 一阶矩、二阶矩?
A: 矩(moment)是用来描述随机变量分布特性的数字量度。
- 一阶矩:均值、
- 二阶矩:方差、协方差:
假设
由于
,这里的 是一个常数向量(因为给定了自变量 和回归系数 B),而 是一个多维正态随机向量。
那么模型
记
即模型
不难得出
若
表示Moore-Penrose伪逆、当X满秩的时候伪逆=真逆)
进而有
Q: 设计矩阵?
A: 设计矩阵(Design Matrix) 是回归分析中的一个重要概念,用于表示回归模型中自变量(或特征)和观测数据之间的关系。对于多元回归模型
,设计矩阵 X 存储了所有观测点的自变量值。具体来说:
- Y 是因变量的观测矩阵,表示所有观测点和因变量的值。
- X 是设计矩阵,包含所有观测点的自变量(或特征)值,通常是一个
的矩阵,其中:
- n 是观测点的数量(样本数量)。
- k 是自变量的数量(包括常数项,如果有的话)。
例1: p维的正态分布
设
其中,设计矩阵
例2: 多元方差分析
设有
这相当于如下的多元线性模型 :
其中,
4.2 充分统计量
总体上没什么新东西:意思是比较简单、会考
协方差矩阵与之前的一致,只是均值发生变化、体现在期望发生变化
需要能推导、考:列满秩、计算期望、协方差矩阵、线性变换
由等价模型知,Y的行向量
那么有Y的密度函数为 :
上面
显然Y的分布是指数族分布,
注意到,Y的密度还可以写为:
可见
下面的这种用于X列非满秩的情况、没有逆,只能使用伪逆。
情形1: X列满秩
不考广义逆,一定考列满秩的情况。
性质4.1.1
; ; 与 相互独立。
(1) 证明:由于
,即 。 又有 : 故知
,即(1)成立。 (2) 证明:由于
,有 : 由误差向量的独立同正态分布性知
,而且不难知道 是秩为 的幂等阵。 由第二章关于随机矩阵二次型的性质5的(1)知 : 即性质(2)成立。
(3) 证明:又由第二章关于随机矩阵二次型的性质5的(3)知 :
知
与 独立.
4.3 参数估计
如果误差是正态:那么可以使用极大似然估计,就可以写似然。最小二乘不一定要有似然,因为没有正态也能进行最小二乘。在二维正态下,二者等价。
参数(B, Σ)的似然函数为(去掉常数) :
易知B的极大似然估计为 :
注意到平方和分解 :
即
当
即
当
其中
将
因此,Σ的极大似然估计为
再将
由性质4.1.1的推论(2)知,
易知
由性质4.1.1的推论(3)知,
4.3.1 最小二乘估计的基本定理
不考有约束的。
第一基本定理
令
其中
4.6 多元线性回归
考X,写成矩阵形式(?)不太理解
多元线性回归模型的定义如下:
其中:
- 因变量
是 阶可观测的随机矩阵, ; - 设计矩阵(预报因子)
是已知的 阶矩阵, ; 称为回归系数,截距 是 维向量,斜率 是 阶矩阵, 未知; 是 阶不可观测的随机误差矩阵, , 是未知的 阶正定阵。
行与列向量表示 记
因此,由模型知:
令
因此,模型可以分解成
若令$X^=(1_n,X)
$Y = X^B^+\varepsilon$。
即多元线性回归模型可以转换为多元线性模型。
假定
一些记号:
最后有点不确定。