第三章 K元线性回归模型

发布时间 : 星期日 文章第三章 K元线性回归模型更新完毕开始阅读

在实际工作中,我们可以借助于R2的增减,判断回归模型不同表达形式的优劣。需要注意的是,对于不同因变量的回归模型,比较R2的大小没有任何意义。用同一变量的不同数学表达式作为因变量,R2也是不可比的。时间序列数据建模中如果考虑了滞后的行为反应,导致样本区间发生变动,R2也不可比。

6. 答:回归模型的基本假定有:零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项ui服从均值为0方差为?2

的正态分布假定。在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定;在有效性的证明中,利用了随机项独立同方差假定。

7. 答:区间估计是指研究用未知参数的点估计值(从一组样本观测值算得的)作为近似值的精确程度和误差范围。

三、实践题

2.解:

yx?x??yx?xx???x?x??xx?xxi1i22ii2i1i21i22i1i2i1i2i(1) b1 2i ?74778.346?280?4250.9?4796.084855.096?280?4796.02

?550620757810i ?0.726621ib2yx?x??yx?xx???x?x??xx?xx2ii1i2i1i21i22i1i1i2i2i ?4250.9?84855.096?74778.346?4796.084855.096?280?4796.02

?2073580757810?2.7363b0?Y?b1X1?b2X2 ?367.693?0.7266?402.760?2.7363?8.0 ?53.1572

(2) ?2ue??2in?3??yi?b12?yix1i?b215?3?yix2i ?66042.269?0.7266?74778.346?2.7363?4250.912

?6.3821s(b0)?Var(b0)?115?A??2?12.768

X2?其中:A??x?X??x?x?x??x22i221i22i21i1i?2XX?x2i?xx2i1ix2i?x

1i同理,可得:se(b1)?0.0486,se(b2)?0.8454

b1拟合优度为:R2??yix1i?b2?yix2i?22yi?0.9988

R2?1?(1?R)n?1n?k?0.9986

⑶ d.f.?12, ??5%,查表得P(t?2.179)?0.95

0.7266?b10.04862.7363?b20.8454?2.179??2.179,得到0.6207?b1?0.8325

?2.179?b1的b2的

?2.179,得到0.8942?b2?4.5784

95%的臵信区间: 0.6207?b1?0.8325

?b2?4.578495%的臵信区间: 0.8942

⑷ H0:?i?0 (i?1, 2, 3),

H1:?i?0

??5%,d.f.?15?3?12,查表得临界值为:?2.179?t?2.179

则:tb0?

53.1572?012.9768?4.0963?2.179, 则拒绝原假设:?0?0

tb?10.7266?00.04862.7363?00.8454?14.9509?2.179,拒绝原假设:?1?0

tb?2?3.2367?2.179, 拒绝原假设:?2?0

(5)方差分析表 方差来源 回归平方和 残差平方和 总平方和

F?32981.5096.6042?4994.0203,??5%,d.f.?2,12,F临界值为3.89

平方和 65963.018 79.2507 66042.269

自由度 2 12

均方差 32981.509 6.6042

?F值是显著的,所以拒绝零假设。

5. 解:(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为

10.36+0.131?12+0.210?12=14.452 10.36+0.131?16+0.210?16=15.816

因此,两人的受教育年限的差别为15.816-14.452=1.364

6. 解:(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即?Y=0.32?log(X1)?0.32(?X1/X1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。(2)针对备择假设H1:?1?0,检验原假设H0:?1?0。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。

7. 解:(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,

如果p-值<0.10,则我们拒绝参数为零的原假设。

由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。

(2)针对联合假设H0:?i=0 (i=1,5,6,7)的备择假设为H1:?i=0 (i=1,5,6,7) 中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为

(RSSRF??RSSUU)/(kU?kR)RSS/(n?kU?1)?(5.038e?7?4.763e?7)/(7?3)(4.763e?7)/(40?8)?0.462

显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)的F分布的临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝H0,所以?i(i=1,5,6,7)是联合不显著的。

(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC值最低,所以我们选择该模型为最优的模型。

(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期?3>0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期?3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型A是这种情况,但它们的影响却非常微弱。

联系合同范文客服:xxxxx#qq.com(#替换为@)