第二章 一元线性回归模型

发布时间 : 星期一 文章第二章 一元线性回归模型更新完毕开始阅读

计量经济学课件 9

?2?它是关于?2的无偏估计量。

e??2in?2

?在随机误差项?的方差?2估计出后,参数?0?和?1的方差和标准差的估计量分别是: ?的样本方差: ?1

2?2S????1?x 2i??S?????1的样本标准差: 1?x 2i??0的样本方差: 2?2?Xi2n?xi2S????0 ??S?????0的样本标准差: 0?X2in?xi2

一、变量的显著性检验

回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。在双变量线性模型中,就是要判断X是否对Y具有显著的线性影响。这就需要进行变量的显著性检验。

变量的显著性检验所应用的方法是数理统计学中的假设检验。计量经济学中,主要是针对变量的参数真值是否为零(?)来进行显著性检验的。

?2??1~N(?1,) 2?xi

t?检验步骤:

(1)对总体参数提出假设

????11??2?x2i?????11S??1~t(n?2)

H0: ?1=0, H1:?1?0

(2)以原假设H0构造t统计量,并由样本计算其值

??t?1

S??1(3)给定显著性水平?,查t分布表得临界值t ?/2(n-2) (4) 比较,判断

若 |t|> t ?/2(n-2),则拒绝H0 ,接受H1 ; 若 |t|? t ?/2(n-2),则拒绝H1 ,接受H0 ;

二、参数的置信区间

?来代替总体的参数?。 回归分析希望通过样本所估计出的参数?11假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出

在一次抽样中样本参数值到底离总体参数的真值有多“近”。

计量经济学课件 10

要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数的区间估计。

双变量线性模型中,?i (i=1,2)的置信区间: 在变量的显著性检验中已经知道:t?????iis??i~t(n?2)

意味着,如果给定置信度(1-?),从分布表中查得自由度为(n-2)的临界值,那么t值处在(?t?/2,t?/2)的概率是(1-? )。表示为:

P(?t??t?t?)?1??

22即

P(?t??2????iis??2?t?)?1??

2i??t??s???????t??s?)?1?? P(?iii??i2i于是得到:(1-?)的置信度下, ?i的置信区间是

??t??s?,???t??s?) (?ii??2i2i在上述收入-消费支出例中,如果给定? =0.01,查表得:

t?(n?2)?t0.005(8)?3.355

2由于 S???0.042 S???98.41

10于是,?1、?0的置信区间分别为:

(0.6345,0.9195) , (-433.32,226.98)

由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。

要缩小置信区间,需要

增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;

提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。

§2.6 模型的预测

?是条件均值E(Y|X=X0)或个值Y0的一个无偏估计 一、Y0????X ???对于双变量线性回归模型Yi01i? ,可以此作为其条件均值给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Y0E(Y|X=X0)或个别值Y0的一个近似估计。

计量经济学课件 11

严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:

(1)参数估计量不确定 (2)随机项的影响

二、总体条件均值与个值预测值的置信区间

1、总体均值预测值的置信区间

由于

????X???Y0010

?2??1~N(?1,)2x?i于是

?~N(??00

?X,n?x2ii2?)2

(X0?X)221?Y0~N(?0??1X0,?(?))2n?xi

??(???X)Y010t?0~t(n?2)SY?0

SY?其中

01(X0?X)2?(???)2n?xi2

于是,在1-?的置信度下,总体均值E(Y|X0)的置信区间为

??t??S??E(Y|X)?Y??t??S?Y000YY2020

2、总体个值预测值的预测区间 由Y0??0??1X0?u知:

于是

2(X?X)10??Y~N(0,?(1??Y))002nx?i2

Y0~N(?0??1X0,?2)

??YYt?00~t(n?2)SY??Y00

SY??Y00式中 :

从而在1-?的置信度下,Y0的置信区间为

1(X0?X)2?(1????)2n?xi2

??t??S??Y?Y??t??S?Y000Y?YY?Y200200

计量经济学课件 12

总体回归函数的置信带(域)(confidence band) 个体的置信带(域)

对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间): (1)样本容量n越大,预测精度越高,反之预测精度越低;

(2)样本容量一定时,置信带的宽度当在X均值处最小;X越远离其均值,置信带越宽,预测可信度下降。

案例:用回归模型预测木材剩余物

伊春林区位于黑龙江省东北部,有森林面积219万公顷,木材蓄积量为2.3亿m3。森林覆盖率为62.5%,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为532万m3。按此速度44年之后,1999年的蓄积量将被采伐一空。

为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。

林业局名 乌伊岭 东风 新青 红星 五营 上甘岭 友好 翠峦 乌马河 美溪 大丰 南岔 带岭 朗乡 桃山 双丰 合计 年木材剩余物yt(万m) 年木材采伐量xt(万m) 26.13 23.49 21.97 11.53 7.18 6.80 18.43 11.69 6.80 9.69 7.99 12.15 6.80 17.20 9.50 5.52 202.87 61.4 48.3 51.8 35.9 17.8 17.0 55.0 32.7 17.0 27.3 21.5 35.5 17.0 50.0 30.0 13.8 532.00 33

联系合同范文客服:xxxxx#qq.com(#替换为@)