影响公路客运量的因素分析

发布时间 : 星期三 文章影响公路客运量的因素分析更新完毕开始阅读

影响公路客运量的因素分析

摘要:本文选取了1978―2011年吉林省公路客运量及相关因素原始数据,分阶段建立回归模型,分析改革开放34年来公路客运量与相关因素之间的关系,并且从经济学角度对所建立的模型给出了合理的解释。

关键词:分段回归;显著性检验;回归诊断 中图分类号:G642.3 文献标志码:A 文章编号:1674-9324(2015)33-0073-03 一、前言

研究从改革开放至今的公路客运量发展变化,可以从国民经济发展的一个侧面了解到二十多年来的交通运输、公共事业建设、人民生活水平、社会生产、流通、分配、消费各环节协调发展等诸多现实经济问题,提升人们对经济发展的认识。

本文以公路客运量作为因变量y(万人),以地区人口x1(万人)、地区生产总值x2(亿元)、年人均可支配收入x3(元)、居民消费价格指数x4、道路路线里程x5(公里)、铁路客运量x6(万人)为影响公路客运量的主要因素,收集整理了1978―2011年吉林省

公路客运量及相关因素原始数据,分阶段建立回归模型,分析改革开放34年来公路客运量与相关因素之间的关系,并且从经济学角度对所建立的模型给出了合理的解释。数据来自《吉林省统计年鉴2012》。 二、模型的确立及阶段的划分 (一)变量间相互关系分析

为了对34年来公路客运量的波动情况有一个全面了解,图1是各因素随年代变化的散点图。图2是两两因素比较的散点。

从中可以看出,数据呈整体上升趋势且有一定的规律性,大部分变量之间呈现出了线性关系,简单的直线回归并不能很好反映出数据的大致趋势。 从整体来看,随着时间的推移,各因素都呈现上升趋势,只是不同时期增长的速度明显不同。改革开放最初十年,各因素增速缓慢。1990年到1996年间,邓小平同志的南巡讲话对中国的经济改革与社会进步起到了关键的推动作用,使得中国经济骤然升温,公路客运量增速加快。1997年爆发的亚洲金融危机,使整个亚洲经济发展遇到了重大挑战,1997―1999年公路客运量增速放缓。从1998年开始,为应对亚洲金融危机,中央政府实施了以扩大内需为主的一系列宏观调控政策,公路客运量增加迅速。

为了更具体的考查变量之间的关系与规律性,我们用spss软件对数据作进一步相关分析,观察变量间的相关性,结果表明公路客运量与总人口、地区生产总值、平均每人全年可支配收入,居民消费价格指数、道路路线里程、铁路客运量的相关系数分别是0.865,0.967,0.980,-0.216,0.958,-0.708。由此可见公路客运量与总人口,地区生产总值,平均每人全年可支配收入,道路路线里程有高相关度性,与消费价格指数相关性较小。说明消费价格指数对公路客运量无显著影响,当然仅凭相关系数的大小是不能决定变量的取舍的,在初步建模时还是应该包含的。公路客运量与铁路客运量呈负相关,这是符合经济意义的,改革开放至90年代末,我国居民的收入还很低,一般认为乘了汽车就乘不了火车,所以呈现负相关,而在20年代以后,国民收入明显提高,乘坐汽车也可以乘坐火车,所以两者负相关不特别显著,仅为0.708。 (二)模型的确立

将原始数据取对数,做两两比较的散点如图3。 从图3可以看出,除因素x4,x6外,其他因素之间呈现明显的线性相关关系。因此,采用柯布―道格拉斯(Cobb―Dauglas)函数描绘公路客运量与相关因素之间的关系(简称C-D模型),数据取对数,建立

线性回归模型。 (三)阶段的划分

从前面的简单分析已经知道,公路客运量增长趋势是分阶段的。由图1和图2不难发现,公路客运量的增长趋势分成两个阶段比较恰当。本文采用常用的AIC准则。具体定义如下:

基于1978-2011年对数数据,以及图1、图2,分别考虑以下两种情形:单个总体(不分段)、两个总体(分两段)。计算结果见表1和表2。

结果表明:两阶段情况下,AIC的值达到最小,R2的值达到最大,所以认为分成1978―1997年,1998―2011年两个阶段比较合理。 三、按阶段建立最优C-D模型

利用S-PLUS软件。根据建立的回归方程,计算预测平方和PRESS、赤池信息量AIC、残差标准差及自相关系数,进行比较。

(一)第一阶段:1978-1997年最优回归模型 取显著性水平α=0.05,经过比较,在通过回归方程和回归系数的显著性检验的方程中,均通过检验且指标最优的两个模型如表3所示:

从表3中可以看到,各项对应指标相差无几。 下面通过比较两者的方差扩大因子、绝对值最大

的删除化残差、最大库克距离和最大杠杆值来选取最优自变量,以进一步确定这两个回归模型的优劣,结果见表4。

由表4不难看出,模型一中各因素之间不存在多重共线性,变量中也不存在异常值,模型二中因素之间存在多重共线性,因变量中存在异常值。因此,两者比较,模型一最优。 显著性检验结果如下:

(1)F=143.294,P值=0.000,复相关系数R=0.987,决定系数R2=0.974,说明x3,x4,x5,x6整体对影响显著。

(2)在回归系数的显著性检验中,p值均小于0.05,即每个变量对因变量影响显著。

(二)第二阶段:1998―2011年最优回归模型 做法同上。第二阶段:1998―2011年最优回归模型的最优模型为lny=11.0405+0.6678lnx2-0.5979lnx3 回归诊断结果如下:

(1)F=649.561,P值=0.000,说明回归方程通过了显著性检验,x2,x5作为整体,对y影响显著。复相关系数R=0.996,决定系数R2=0.991,说明回归方程高度显著。

联系合同范文客服:xxxxx#qq.com(#替换为@)