概率统计讲课稿第八章(第四,五,六节)

发布时间 : 星期二 文章概率统计讲课稿第八章(第四,五,六节)更新完毕开始阅读

-?,即在这些区间中大约有100(1-?)%的区间包含?真值,100?%的区间不包含?真值。例如,若给定?=0.05,重复抽样100次所得到的100个区间中,大约有95个包含?真值。

第七节 信任估计

前面我们说过从统计学中频率学派的观点看,被估计的参数?虽然未知,但它是一个常数,没有随机性。也就是说无论是区间估计还是点估计,都是从统计学中的频率学派的观点出发的。而数理统计的奠基人之一费希尔却提出了一个出发点截然不同的估计方法,也就是这一节所提到的信任估计。

信任估计法是费希尔在1930年提出的一种区间估计方法。在费希尔对数理统计学的众多贡献中,这一项是争议最大的。费希尔关于信任估计的思想可以通过一个简单的例子来说明。

设X,X,?,X为抽自正态总体N??,??的i.i.d样本,?已知,?未知。求?的区间估计,对此,费希尔的推理如下:

212n2

21

记?????n?X??????

??n?X?则?有分布N?0,1?,解上式得????,

其中?,n为已知常数;X由样本算出,也是已知的;?的分布已知,故(在有了样本后)?的分布可以求出,在此例中?为正态分布

??2?N?X,?/n???。费希尔把?的分布

叫做?的信任分布。如以F记这个分布,

找出?,?,使 F????F????1??

则事件?????的“信任概率“为1??。费希尔把????作为?的区间估计,并称之为?的信任区间,其“信任系数”为1??。本例可取

??X???/n,??X???/n

只有这个取法???使最小,得到与置信区间估计相同的结果

若?未知,则可以用S取代?,并利用

1221121,2??1?/22?/221????n?X????/S~tn?1??的事实,一样可以得出?的

信任区间,也得到与置信区间估计相同

22

的结果

费希尔这个做法的新奇之处,是把?当做随机变量看,有其概率分布,而一般的看法是:?是一个虽然未知,但是固定的常数,这是一个观念上的分歧,这一点倒不能看做是费希尔方法的致命弱点,因为一种方法或理论,只要没有内在的矛盾,就可当做一家之言提出来,而不必一定与现存理论合拍,但是,费希尔未能对信任分布给出一个明确的定义和确定它的方法,而只能停留在对个别例子用特定的方法去处理,如何对信任分布运算也缺乏明确的规则。这些原因使他的方法未能得到广泛的接受,后来也有些学者继续在这个方向上作工作,以图解决这些问题,但未能取得实质性的进展。 在简单的情况下,利用信任估计法求出的若干区间估计,都与用奈曼的置信区间方法求出的相同,但在较复杂的例子中这二者确有不同。最著名且有实用价值的例子,是所谓贝伦斯-费希尔

23

(Behrens-Fisher)问题。下面简单介绍一下这个问题。

设X,X,?,X和Y,Y,?,Y分别是抽自正态总体N??,??和N??,??的i.i.d.样本,?,?,?和?都未知,???,求???的区间估计,这即是贝伦斯-费希尔问题。

当???时,可用t分布求解,但在???的情况下,此问题没有适当的小样本解,如果n,n都很大,可考虑用大样本方法,用正态逼近

12n112n211212221212222122212122212212????????Y?X????2??1???????S21/n1?S/n222?1/2~N?0,1?

22去求解。此处S,S分别是X样本和Y样本的样本方差。

费希尔用信任估计方法处理这个问题。其做法如下:

21记

???n1?X??1?????S1,

???n2?Y??2?????S2

1则?与?独立,分别服从自由度为nn?1的t分布。于是,有

2?1和

????S1?S2???2??1???Y?X?????n1n2

(3-1)

24

联系合同范文客服:xxxxx#qq.com(#替换为@)