Schwertlilien
As a recoder: notes and ideas.

多元统计分析-Ch4-多元线性模型

Ch4 多元线性模型

码字机施工中…

[TOC]

4.0 一元线性模型

假设有自变量,因变量

一元线性模型的定义:

其中,是模型参数, 是随机误差,

的线性回归:

4.0.1 模型参数的估计

假设有组观测。 最小二乘法即最小化误差平方和(Residual Sum of Squares, RSS, 我们的目标函数):

的矩阵,

  • 则对这组观测,模型可表示为
  • 的最小二乘法估计为

模型的应用

  1. 对未来的设计变量,可以预测相应的因变量
  2. 当自变量为单变量时,为了控制未来的因变量, 可以约束自变量的取值范围。

4.1 多元线性模型

相当于x和y由一个值变为一个向量. 此时x在空间,y在空间.

假设有自变量,因变量

的关系可表示为如下个一元线性模型:

, 其中,是每个子线性模型的参数, 是每个因变量对应的随机误差,

的模型参数矩阵, 是误差向量。 那么,的关系可表示为:

假设有组观测。 记

x 和 y 由向量转变为矩阵,原先只是在空间,现在在空间。

多元线性模型的定义如下:

其中:

  1. 阶观测的随机矩阵,
  2. 是已知的阶设计矩阵,; (3)
  3. 阶的未知回归系数矩阵;
  4. 阶不可观测的随机误差矩阵。

若记 :

则模型 化为

我们假定服从正态分布,只在特别情况下会说明只假定一、二阶矩存在(有界)的情形。

Q: 一阶矩、二阶矩?

A: 矩(moment)是用来描述随机变量分布特性的数字量度。

  • 一阶矩:均值、
  • 二阶矩:方差、协方差:

假设,其中误差协方差阵是未知的阶正定矩阵。 由,知独立同分布,且,则。 则有 :

由于 ,这里的 是一个常数向量(因为给定了自变量 和回归系数 B),而 是一个多维正态随机向量。

那么模型 可以理解为 :

,则有:

即模型可以分解为个一元线性模型,这个一元线性模型有相同的设计矩阵

不难得出的最小二乘估计为

,则.

表示Moore-Penrose伪逆、当X满秩的时候伪逆=真逆)

进而有的最小二乘估计为

Q: 设计矩阵?

A: 设计矩阵(Design Matrix) 是回归分析中的一个重要概念,用于表示回归模型中自变量(或特征)和观测数据之间的关系。对于多元回归模型 ,设计矩阵 X 存储了所有观测点的自变量值。具体来说:

  • Y 是因变量的观测矩阵,表示所有观测点和因变量的值。
  • X 是设计矩阵,包含所有观测点的自变量(或特征)值,通常是一个 的矩阵,其中:
    • n 是观测点的数量(样本数量)。
    • k 是自变量的数量(包括常数项,如果有的话)。

例1: p维的正态分布

是来自的样本,。则

其中,设计矩阵

例2: 多元方差分析

设有个相互独立的总体是来自总体的样本,。记 .

这相当于如下的多元线性模型 :

其中, 阶对角分块矩阵, 阶矩阵。

4.2 充分统计量

由等价模型知,Y的行向量相互独立,且

那么有Y的密度函数为 :

显然Y的分布是指数族分布,是参数的充分统计量。

注意到,Y的密度还可以写为:

可见也是的充分统计量。 平方和分解公式 :

下面的这种用于X列非满秩的情况、没有逆,只能使用伪逆。

情形1: X列满秩

性质4.1.1

  1. 相互独立。

(1) 证明:由于,即。 又有 :

故知,即(1)成立。

(2) 证明:由于,有 :

由误差向量的独立同正态分布性知,而且不难知道是秩为的幂等阵。 由第二章关于随机矩阵二次型的性质5的(1)知 :

即性质(2)成立。

(3) 证明:又由第二章关于随机矩阵二次型的性质5的(3)知 :

独立.

情形2:

性质4.1.1的推论

  1. ;
    • (1’);_
    • (1’’) 对阶的矩阵C, , 则 ;
  2. ;
  3. 相互独立.

4.3 参数估计

参数(B, Σ)的似然函数为(去掉常数) :

易知B的极大似然估计为 :

注意到平方和分解 :

也是的最小二乘估计。

的分布 :

时,由性质4.1.1(1)知,

的无偏估计,且

时,由性质4.1.1的推论(1’’)知,

其中。则的无偏估计,其协差阵为

代入似然函数,有:

因此,Σ的极大似然估计为

再将代入似然函数,有:

由性质4.1.1的推论(2)知,

易知,即的无偏估计。

由性质4.1.1的推论(3)知,相互独立。

最小二乘基本定理

第一基本定理

,则

其中

第二基本定理

的约束条件下,令

其中的矩阵,

那么有:

  • (i) ,其中,
  • (ii)
  • (iii) 相互独立;
  • (iv)

(i)证明:由广义逆的性质知的通解是,其中是任意的阶矩阵。则在的约束下模型转换为

其设计矩阵为

由第一基本定理知:

(ii)-(iv) 证明:因为:

由第二章关于随机矩阵二次型的性质5的(2)知:

相互独立。进而有 :

即(ii)-(iv)得证。

特殊情况

是秩为阶矩阵,则的秩为。因此有:

  • (i)
  • (ii)
  • (iii) 相互独立;
  • (iv)

第三基本定理

分别剖分为:

假设的秩为,并令,则有

证明:由于有

由于:

所以。又,其中:

由随机矩阵二次型的性质知,,且相互独立。进而有 :

4.4 线性假设检验

检验问题1

其中的矩阵。

检验问题的似然比为 :

由已知 :

由已知,在约束下,多元线性模型转化为:

因此有:

其中是多元线性模型的似然函数。

同样利用已知,可以推得:

进而得 :

4.5 均值子集的线性假设检验

4.6 多元线性回归模型

4.6.1 参数估计

4.6.2 假设检验

4.7 变量选择-逐步回归方法

4.7.1 预报因子的逐步回归选取方法

4.7.2 因变量的逐步回归选取方法

4.7.3 其他的变量选择方法

4.8 多元线性模型的均值置信域和预测域

4.8.1 均值置信域

4.8.2 预测域

4.9 重复测量模型

4.9.2 方差分析

作业

线性模型, 其中列满秩, . 给出下面检验问题的检验方案:

答案:

搜索
匹配结果数:
未搜索到匹配的文章。