多元统计分析-Ch4-多元线性模型
Ch4 多元线性模型
码字机施工中…
[TOC]
4.0 一元线性模型
假设有自变量
一元线性模型的定义:
其中,
4.0.1 模型参数的估计
假设有
记
- 则对这组观测,模型可表示为
。 - 则
的最小二乘法估计为 。
模型的应用:
- 对未来的设计变量
,可以预测相应的因变量 : 。 - 当自变量为单变量时,为了控制未来的因变量
, 可以约束自变量的取值范围。
4.1 多元线性模型
相当于x和y由一个值变为一个向量. 此时x在
空间,y在 空间.
假设有自变量
记
假设有
x 和 y 由向量转变为矩阵,原先只是在
空间,现在在 空间。
多元线性模型的定义如下:
其中:
是 阶观测的随机矩阵, ; 是已知的 阶设计矩阵, , ; (3) - 是
阶的未知回归系数矩阵; 是 阶不可观测的随机误差矩阵。
若记 :
则模型
我们假定
Q: 一阶矩、二阶矩?
A: 矩(moment)是用来描述随机变量分布特性的数字量度。
- 一阶矩:均值、
- 二阶矩:方差、协方差:
假设
由于
,这里的 是一个常数向量(因为给定了自变量 和回归系数 B),而 是一个多维正态随机向量。
那么模型
记
即模型
不难得出
若
表示Moore-Penrose伪逆、当X满秩的时候伪逆=真逆)
进而有
Q: 设计矩阵?
A: 设计矩阵(Design Matrix) 是回归分析中的一个重要概念,用于表示回归模型中自变量(或特征)和观测数据之间的关系。对于多元回归模型
,设计矩阵 X 存储了所有观测点的自变量值。具体来说:
- Y 是因变量的观测矩阵,表示所有观测点和因变量的值。
- X 是设计矩阵,包含所有观测点的自变量(或特征)值,通常是一个
的矩阵,其中:
- n 是观测点的数量(样本数量)。
- k 是自变量的数量(包括常数项,如果有的话)。
例1: p维的正态分布
设
其中,设计矩阵
例2: 多元方差分析
设有
这相当于如下的多元线性模型 :
其中,
4.2 充分统计量
由等价模型知,Y的行向量
那么有Y的密度函数为 :
显然Y的分布是指数族分布,
注意到,Y的密度还可以写为:
可见
下面的这种用于X列非满秩的情况、没有逆,只能使用伪逆。
情形1: X列满秩
性质4.1.1
; ; 与 相互独立。
(1) 证明:由于
,即 。 又有 : 故知
,即(1)成立。 (2) 证明:由于
,有 : 由误差向量的独立同正态分布性知
,而且不难知道 是秩为 的幂等阵。 由第二章关于随机矩阵二次型的性质5的(1)知 : 即性质(2)成立。
(3) 证明:又由第二章关于随机矩阵二次型的性质5的(3)知 :
知
与 独立.
情形2:
性质4.1.1的推论
;- (1’)
;_ - (1’’) 对
阶的矩阵C, , 则 ;
- (1’)
; 与 相互独立.
4.3 参数估计
参数(B, Σ)的似然函数为(去掉常数) :
易知B的极大似然估计为 :
注意到平方和分解 :
即
当
即
当
其中
将
因此,Σ的极大似然估计为
再将
由性质4.1.1的推论(2)知,
易知
由性质4.1.1的推论(3)知,
最小二乘基本定理
第一基本定理
令
其中
第二基本定理
在
其中
那么有:
- (i)
,其中, , ; - (ii)
; - (iii)
与 相互独立; - (iv)
。
(i)证明:由广义逆的性质知
的通解是 ,其中 是任意的 阶矩阵。则在 的约束下模型转换为 其设计矩阵为
, 。 由第一基本定理知:
(ii)-(iv) 证明:因为:
由第二章关于随机矩阵二次型的性质5的(2)知:
且
与 相互独立。进而有 : 即(ii)-(iv)得证。
特殊情况
若
- (i)
; - (ii)
; - (iii)
与 相互独立; - (iv)
。
第三基本定理
将
假设
证明:由于有
由于:
所以
。又 ,其中: 由随机矩阵二次型的性质知,
,且 与 相互独立。进而有 :
4.4 线性假设检验
检验问题1
其中
检验问题的似然比为 :
由已知 :
由已知,在约束
因此有:
其中
同样利用已知,可以推得:
进而得 :
4.5 均值子集的线性假设检验
4.6 多元线性回归模型
4.6.1 参数估计
4.6.2 假设检验
4.7 变量选择-逐步回归方法
4.7.1 预报因子的逐步回归选取方法
4.7.2 因变量的逐步回归选取方法
4.7.3 其他的变量选择方法
4.8 多元线性模型的均值置信域和预测域
4.8.1 均值置信域
4.8.2 预测域
4.9 重复测量模型
4.9.2 方差分析
作业
线性模型
答案: