统计量与抽样分布

发布时间 : 星期四 文章统计量与抽样分布更新完毕开始阅读

查标准正态分布函数值表可得

u0.05?1.645

而水平0.05的双侧分位数为u0.025,它满足

查表得

?0(u0.025)?1?0.025?0.975

u0.025?1.96

2下面我们给出统计三大分布的生成背景。?分布、t分布和F分布是统计学上的三大分布,它们在统计上有着广泛的应用,在独立性的假设下可以导出这些分布。

1.3.2 ?分布

定义1.3.3 (?分布的由来)设X1,X2,?,Xn是n个相互独立、同分布的随机变量,其共同分布为标准正态分布N(0,1),则随机变量

22Y?X12?X2???Xn

22服从自由度为n的?分布,记为?n。下面来导出?分布的概率密度函数。

首先令Z?X1,并求其分布。由于Z非负,故当z?0时,P(Z?z)?0;而当z?02222时,则Z的分布函数为

P(Z?z)?P(X12?z)?P(?z?X1?

?FX1(z)?FX1(?z)

z)

对z求导数,得Z的概率密度函数

?11?pZ(z)?z2pX1(z)?pX1(?z)

21??

其中pX1(x)?(2?)Exp?x?22?为标准正态概率密度函数。代入上式,可得

z??1?1z2e2,z?0?pZ(z)??2? (1.3.1)

?0,z?0?这正是?分布?(,),即形状参数和尺度参数皆为

11221的?分布(?(?)为Gamma函数)。 2222由于X1,X2,?,Xn独立同分布,故X1,X2,?,Xn亦为独立同分布,其公共分布为

1122???Xn的分布为?(,)。再由?分布的可加性(或再生性)可得Y?X12?X222?n1???,?,这正是?2分布,其概率密度函数为 ?22?

n?1?2????ny?1???2?22?kn(y)???n?ye,y?0 (1.3.2)

??????2???0,y?022

其中n称为自由度,是?分布中唯一的参数。?分布密度函数的图形如图1.3.4所示。。由于?变量Y是n个独立变量X1,X2,?,Xn的平方和,每个变量Xi都可以随意取值,可以说它有n个变量,故有n个自由度。 和

22Y2?Z12?Z2???Zn

2?2分布具有下面的重要性质:

2221.可加性 设Y1~?m,Y2~?n,且两者相互独立,则Y1?Y2~?m?n

事实上,根据?分布的定义,我们可以把Y1和Y2分别表示为

22Y1?X12?X2???Xm

2其中X1,X2,?,Xm和Z1,Z2,?,Zn都服从N(0,1),且相互独立,于是

22根据?分布的定义,这就证明了Y1?Y2~?m?n。

2222.E(?n)?n,D(?n)?2n。即?分布的均值等于它的自由度,而方差等于它的

2222Y1?Y2?X12?X2???Xm?Z12?Z2???Zn

自由度的二倍。

222设Y~?n,则Y?X1?X2???Xn可以表示为,这里Xi~N(0,1)且相互独立。

22因而E(Xi)?0,D(Xi)?E(Xi)?1。故

E(Y)?E(?X)??E(Xi2)?n

2ii?1i?1nn这就证明了第一条结论。 另一方面,利用分部积分不难验证

E(Xi4)?12??4x?e?x22dx?3,i?1,2,?,n

??于是

D(Xi2)?E(Xi4)?(E(Xi2))2?3?1?2

再利用X1,X2,?,Xn的独立性,有

D(Y)??D(Xi2)?2n

i?1n这就证明了第二条结论。

对于给定的正数?,0???1,我们称满足条件

??

P(???(?))?2n2n2?n(?)?kn(y)dy??

2的数?n(?)为?n分布的上?分位数,如图1.3.5所示,对不同的n和?,分位数?n(?)的

22图1.3.4 ?n分布的概率密度函数 图1.3.5 ?n分布的分位数

22

2值可在附表3中查到。例如??0.05,n?20,?20(0.05)?31.410。

1.3.3 t分布

定义1.3.4 (t分布的由来)设随机变量X~N(0,1),Y~?n且X与Y相互独立。 则随机变量

2T=XYn

的分布称为自由度为n的t分布,记为T~tn。下面来导出t分布的概率密度函数。

首先令Z?Yn,并求其的分布。由于Z为正,故当z?0时,P(Z?z)?0;而当

z?0时,Z的分布函数为

P(Z?z)?P(Yn?z)?P(Y?nz2)?FY(nz2)

pZ(z)?2nzkn(nz2),z?0 (1.3.3)

对z求导数,得Z的概率密度函数

其中kn(?)为自由度n的?分布的概率密度函数。如1.3.2式所示。

其次,我们求二个独立随机变量商T?XZ的分布。把随机变量T的取值记为u。由于Z?0,而正态变量X可在(??,?)上取值,故T变量也可在(??,?)上取值,其分布函数为

2

P(T?u)?P(X?u)?P(X?uZ)???pX(x)pZ(z)dxdz Zx?uz由于z?0,上述二重积分的积分区域如图1.3.6所示,通过化重积分为累次积分,可得

?uz?P(T?u)????pX(x)dx?pZ(z)dz

o??????对u求导数,即得t分布函数的概率密度函数为

pt(u)??zpX(uz)pZ(z)dz (1.3.4)

0这里我们就证明了下面定理。

图1.3.6 积分区域

定理1.3.1 设X与Z是二个相互独立仅在(0,?)上取值的随机变量,其概率密度函数分别为pX(x)和pZ(z),则其商T?XZ的密度函数为1.3.4式所示。

在1.3.4式中,取pX(x)是标准正态概率密度函数,pZ(z)是如1.3.3式所示的概率密

联系合同范文客服:xxxxx#qq.com(#替换为@)