应用多元统计分析讲稿(朱建平)

发布时间 : 星期三 文章应用多元统计分析讲稿(朱建平)更新完毕开始阅读

X?(X1,X2,?,Xp)?也不可能服从p元正态分布。

第四节 多元正态分布的参数估计

一、多元样本的数字特征 设样本资料可用矩阵表示为

??X1p??X(1)????X22?X2pX(2)??(X,X,?? ?,Xp)?12??????????Xn2?Xnp?X????(n)?在这里我们给出样本均值向量、样本离差阵、样本协差阵以及样本相关阵的定义。

?X11?X21?X?????Xn1?X12?定义2.9 设X(1),X(2),?,X(n)为来自p元总体的样本,其中X(a)?(Xa1,Xa2,?,Xap)?,a?1,2,?,n。

??X?(1) 样本均值向量定义为μ1n(a)X?na?1?(X1,X2,?,Xp)?

其中

n1n?Xa?1(a)??X11??X21??X1??Xn1???X11?X21???Xn1?????????????Xn2?1X12?X22???Xn2X1??X12??X22???????2? ?????????????n???n???????????????????XXXX?X???XX?1p????2p???np????1p?2pnp??????p?????

(2)样本离差阵定义为

n Sp?p?这里,

?(Xa?1(a)?X)(X(a)?X)??(sij)p?p (2.11)

n?(Xa?1(a)?X)(X(a)??Xa1?X1??????nX?Xa22???(Xa1?X1,Xa2?X2,?,Xap?Xp) ?X)? ????????a?1????X?X??p??ap????(XX)1a1?X)(X?X)1a222(X?X)a22?X)1(Xap?Xp)(X?X)a22???(X(Xa1a2?X)(Xap?Xp)1?X2)(Xap?X?(Xap?Xp)22?(X?X)a11n?(X?X)(X?2a1???a2??a?1?(X?Xp)(X?a1?ap??)p?????s11?s21??????sp1?s12s22?sp2???s1p??s2p??(s)ijp?p

???spp??1nS?1nn(3)样本协差阵定义为Vp?p?这里,

1nS?1n?(Xa?1(a)?X)(X(a)?X)??(vij)p?p (2.12)

?n(X(a)?X)(X(a)a?1?1?X)????n???vij(X?X)(X?X)?aiiajj?a?1?p?pn??p?p

????(4)样本相关阵定义为Rp?p?rij?p?p (2.13)

其中rij?vijviivjj?sijsiisjj

在此,我们应该提及的是,样本均值向量和离差阵也可用样本资料阵X直接表示如下:

1 Xp?1?X?1n 其中 1n?(1,1,?,1)?

n?X11?1?X121?X?1n ?n??n??X1p?X21X22?X2p???Xn1??1??X11?X21???Xn1??X1????Xn2?1?1?X12?X22???Xn2?X????????2?

?????????n?????????Xnp?X?X???XX1??????2pnp??1p?p?? 由于 Xp?1

那么,(2.11)式可以表示为:

nS??a?1(X(a)?X)(X(a)?X)??X?X?nXX??X?X?1nX?1n1?X?X?(In?n1n1n1?)X n(2.14)

?1?其中 In????0?0?? ?1??二、均值向量与协差阵的最大似然估计

多元正态分布有两组参数,均值μ和协差阵Σ,在许多问题中它们是未知的,需要通过样本来估计。那么,通过样本来估计总体的参数叫做参数估计,参数估计的原则和方法是很多的,这里用最常见的且具有很多优良性质的最大似然法给出μ和Σ的估计量。

设X(1),X(2),?,X(n)来自正态总体Np(μ,Σ)容量为n的样本,每个样品X(a)?(Xa1,Xa2,?,Xap)?,

a?1,2,?,n,样本资料阵为(2.1)式表示,即

?X11?X21?X?

?????Xn1XX?1222??Xn2???Xp2? ???Xnp??p1X????X ,Σ则可由最大似然法求出μ和Σ的估计量,即有μ1nS (2.15)

实际上,最大似然法求估计量可以这样得到。针对X(1),X(2),?,X(n)来自正态总体Np(μ,Σ)容量为n的样本,构造似然函数,即

nL(μ,Σ)??i?1f(Xi,μ,Σ)?1(2?)1pn/2Σn/2?1exp???2n?i?1(Xi?μ)?Σ?1?(Xi?μ)? (2.16)

?为了求出使(2.16)式取极值的μ和Σ的值,将(2.16)两边取对数,即

lnL(μ,Σ)??12pnln(2?)?n2nilnΣ?(X?2i?1?μ)?Σ(Xi?μ) (2.17)

?1因为对数函数是一个严格单调增函数,所以可以通过对lnL(μ,Σ)的极大值而得到μ和Σ的估计量。 这里我们要注意到,根据矩阵代数理论,对于实对称矩阵A,有?lnA?A。

?1?(X?AX)?X?2AX,

?(X?AX)?A?X?X,

?A那么,针对对数似然函数(2.17)分别对μ和Σ求偏导数,则有

n??lnL(μ,Σ)?1?Σ(Xi?μ)?0???μ?i?1(2.18)由(2.18)式可以得到极大似?n?12??lnL(μ,Σ)??nΣ?1?1(Xi?μ)(Xi?μ)?(Σ)?0???Σ22i?1?然估计量分别为

1n????Xi?X?μni?1? ?n1?Σ??1?(X?X)(X?X)?S?ii?nni?1?由此可见,多元正态总体的均值向量μ的极大似然估计量就是样本均值向量,其协差阵Σ的极大似然估计就是样本协差阵。

μ和Σ的估计量有如下基本性质: 1.E(X)?μ,即X是μ的无偏估计; E(1nS)?1n?11nn?1nΣ,即

1nS不是Σ的无偏估计,而E(1n?1S)?Σ,即

1n?1S是Σ的无偏估计;

2.X,3.X,

S分别是μ,Σ的有效估计;

1n?1S)分别是μ,Σ的一致估计(相合估计)。

S(或

样本均值向量和样本离差阵在多元统计推断中具有十分重要的作用,并有如下结论:

定理2.2 设X和S分别是正态总体Np(μ,Σ)的样本均值向量和离差阵,则 1.X~Np(μ,1nΣ);

n?12.离差阵S可以写为S??Za?1a? 其中,Z1,?,Zn?1独立同分布于Np(0,Σ); Za3.X和S相互独立;

4.S为正定阵的充要条件是n?p。 三、Wishart分布

??在实际应用中,常采用X和Σ1n?1S来估计μ和Σ,前面已指出,均值向量X的分布仍为正态分布,

2而离差阵S的分布又是什么呢?为此给出维希特(Wishart)分布,并指出它是一元?分布的推广,也是

构成其它重要分布的基础。

Wishart分布是Wishart在1928年推导出来的,而该分布的名称也即由此得来。

定义2.10 设X(a)?(Xa1,Xa2,?,Xap)?~Np(μa,Σ),a?1,2,?,n且相互独立,则由X(a)组成的随机

n矩阵:Wp?p??a?1X(a)X(?a) (2.19)的分布称为非中心Wishart分布,记为Wp(n,Σ,Z)。

n其中Z?(?a1,?,?an)(?a1,?,?an)???μa?1a?,μa称为非中心参数;当μa?0时称为中心Wishart分布,μa记为Wp(n,Σ),当n?p,Σ?0,Wp(n,Σ)有密度存在,其表达式为:

?w???f(w)??np22?????0,12(n?p?1)p(p?1)4?1??1exp??trΣw??2?,pn?i?1n2??Σ???2???i?1当w为正定阵 (2.20)

其它显然,当p?1,Σ??nn(a)2时,f(w)就是?2?2(n)的分布密度,此时(2.19)式为

1nW??Xa?1X?a(?)?Xa?12a,有()?2?Xa?12(a)22~?(n)。因此,Wishart分布是?分布在p维正态情况下

的推广。

下面给出Wishart分布的基本性质:

1.若X(a)~Np(μ,Σ),a?1,2,?,n且相互独立,则样本离差阵

nS??(Xa?1(a)?X)(X(a)?X)?~Wp(n?1,Σ),其中X?k1n(a)X?na?1。

k2.若Si~Wp(ni,Σ),i?1,?,k,且相互独立,则?Si~Wp(?ni,Σ)。

i?1i?13.若Xp?p~Wp(n,Σ),Cp?p为非奇异阵,则CXC?~Wp(n,CΣC?)。

这里我们有必要说明一下什么是随机矩阵的分布。随机矩阵的分布有不同的定义,此处是利用已知向量分

布的定义给出矩阵分布的定义。

这里我们有必要说明一下什么是随机矩阵的分布。随机矩阵的分布有不同的定义,此处是利用已知向量分布的定义给出矩阵分布的定义。 设随机矩阵

?X11X12?Xp?1??X21X22?Xp2? X?????????XX?X?n1?n2np??将该矩阵的列向量(或行向量)一个接一个地连接起来,组成一个长的向量,即拉直向量:

(X11,X21,?,Xn1,X12,X22,?,Xn2,?,X1p,X2p,?,Xnp)的分布定义为该阵的分布。若X为对称阵时,

由于

(X11Xi?Xj,X?,21n,

X,1p?n,故只取其下三角部分组成的拉直向量,即

,X?,,pX。n2

,)X,?2n2

联系合同范文客服:xxxxx#qq.com(#替换为@)