应用多元统计分析实验报告之主成分分析

发布时间 : 星期日 文章应用多元统计分析实验报告之主成分分析更新完毕开始阅读

应用多元统计分析实验报告

一、研究目的

下表1是2010年各地区6项重要指标的数据,这6项指标分别是:

X1—城市用水普及率(%) X2—城市燃气普及率(%)

X3—每万人拥有公共交通车辆(标台) X4—人均城市道路面积(平方米) X5—人均公园绿地面积(平方米) X6—每万人拥有公共厕所(座)

表1 各地区城市设施水平指标

地区 X1 X2 X3 X4 X5 X6 北京 100.00 100.00 14.24 5.57 11.28 3.54 河北 100.00 100.00 12.05 14.89 8.56 2.01 天津 99.97 99.07 9.53 17.35 14.23 4.22 山西 97.26 89.94 6.83 10.66 9.36 3.32 内蒙古 87.97 79.26 6.89 14.89 12.36 4.73 辽宁 97.44 94.19 9.35 11.19 10.21 2.99 吉林 89.60 85.64 9.75 12.39 10.27 4.53 黑龙江 88.43 84.67 10.00 10.00 11.27 6.56 上海 100.00 100.00 8.82 4.04 6.97 2.62 江苏 99.56 99.12 10.91 21.26 13.29 3.75 浙江 99.79 99.07 11.87 16.70 11.05 4.01 安徽 96.06 90.52 7.73 16.01 10.95 2.55 福建 99.50 98.92 10.32 12.58 10.99 2.64 江西 97.43 92.36 7.61 13.77 13.04 2.17 山东 99.57 99.30 10.18 22.23 15.84 2.05 河南 91.03 73.43 7.58 10.25 8.65 3.32 湖北 97.59 91.75 9.47 14.08 9.62 2.91 湖南 95.17 86.50 10.01 12.95 8.89 2.35 广东 98.37 95.75 9.53 12.69 13.29 2.06 广西 94.65 92.35 8.07 14.31 9.83 1.76 海南 89.43 82.44 8.61 13.81 11.22 1.73 重庆 94.05 92.02 7.23 9.37 13.24 1.55 四川 90.80 84.39 9.65 11.84 10.19 2.93 贵州 94.10 69.72 8.46 6.65 7.33 2.21 云南 96.50 76.40 9.74 10.90 9.30 2.26 西藏 97.42 79.83 20.91 13.25 5.78 4.16 陕西 99.39 90.39 12.64 13.38 10.67 3.13 甘肃 91.57 青海 99.87 宁夏 98.23 新疆 99.17 74.29 90.79 88.01 95.80 8.10 18.30 10.63 11.66 12.20 11.42 17.35 13.19 8.12 8.53 16.18 8.61 2.17 4.65 4.18 3.23 本次实验的研究目的是根据这些指标用主成分分析法对各地区城市设施水平进行综合评价和排序,得出结论并提出建议。

二、研究过程

从标准化数据出发,首先计算这些指标的主成分,然后通过主成分的大小进行排序。

1.利用SPSS进行因子分析

表2和表3分别是特征根(方差贡献率)和因子载荷阵的信息。

表2 特征根和方差贡献率表 Total Variance Explained Component 1 2 3 4 5 6 Total 2.155 1.566 1.230 .617 .258 .174 Initial Eigenvalues % of Variance 35.917 26.093 20.507 10.280 4.299 2.904 Cumulative % 35.917 62.010 82.517 92.797 97.096 100.000 Extraction Sums of Squared Loadings Total 2.155 1.566 1.230 .617 .258 .174 % of Variance 35.917 26.093 20.507 10.280 4.299 2.904 Cumulative % 35.917 62.010 82.517 92.797 97.096 100.000 Extraction Method: Principal Component Analysis.

表3 因子载荷阵

Component Matrix a X1 X2 X3 X4 X5 X6 1 .770 .857 .246 .633 .605 -.019 2 .444 .113 .839 -.396 -.642 .286 Component 3 4 5 .039 -.186 .210 -.210 .345 -.120 6 .293 -.219 -.164 .012 -.005 .115 -.349 -1.476E-5 -.208 .291 .359 .275 .881 .356 -.282 -.519 .164 .337 Extraction Method: Principal Component Analysis. a. 6 components extracted.

2.利用因子分析结果进行主成分分析 ⑴.表4是特征向量的信息

表4 特征向量矩阵 z1 z2 z3 z4 z5 z6 x1 0.52 0.35 (0.31) (0.00) 0.08 0.70 x2 0.58 0.09 (0.19) 0.45 (0.37) (0.53) x3 0.17 0.67 0.26 (0.36) 0.41 (0.39) x4 0.43 (0.32) 0.32 (0.66) (0.41) 0.03 x5 0.41 (0.51) 0.25 0.21 0.68 (0.01) x6 (0.01) 0.23 0.79 0.43 (0.24) 0.28

⑵.利用主成分得分进行综合评价时,从特征向量可以写出所有6个主成分的具体形式:

Y1=0.52X1+0.68X2+0.17X3+0.43X4+0.41X5-0.01X6

Y2=0.35X1+0.09X2+0.67X3-0.32X4-0.51X5+0.23X6 Y3=-0.31X1-0.19X2+0.26X3+0.32X4+0.25X5+0.79X6 Y4=0.00X1+0.45X2-0.36X3-0.66X4+0.21X5+0.43X6 Y5=0.08X1-0.37X2+0.41X3-0.41X4+0.68X5-0.24X6 Y6=0.70X1-0.53X2-0.39X3+0.03X4-0.01X5+0.28X6

⑶.以特征根为权,对6个主成分进行加权综合,得出各地区的综合得分及排序,具体数据见表5.

综合得分的计算公式是

?1?6Y?Y1???Y6

??i??i

表5 各地区主成分得分及排序 综合排得分 序 北京 86.804 61.274 88.811 7.843 2.223 33.573 67.90 3 河北 86.210 67.708 84.367 2.057 1.797 36.052 67.72 2 天津 88.645 65.957 83.670 (2.384) 5.975 34.164 67.71 4 山西 83.828 63.281 77.128 4.871 4.179 27.999 67.66 16 内蒙古 76.367 56.960 67.594 0.269 8.748 27.221 67.48 30 辽宁 84.470 63.399 80.960 3.708 3.390 30.906 67.41 11 吉林 78.285 57.689 73.007 2.389 4.917 30.296 67.40 25 黑龙江 78.751 54.356 72.700 3.497 5.150 29.586 67.33 26 上海 87.533 63.658 86.518 8.855 (2.357) 29.375 66.39 1 地区 Y1 Y2 Y3 Y4 Y5 Y6 江苏 87.611 67.826 82.389 (4.338) 6.306 37.047 66.06 6 浙江 87.422 66.393 83.255 0.034 4.188 36.439 65.33 5 安徽 82.702 64.711 76.591 0.247 5.816 30.570 65.26 18 福建 86.738 65.375 84.692 2.163 2.877 33.046 65.10 8 江西 84.005 64.118 79.841 0.821 6.363 29.318 64.90 14 山东 86.911 68.384 83.694 (6.371) 7.992 35.853 64.78 7 河南 74.411 58.086 65.066 8.216 9.700 24.894 64.32 31 湖北 83.544 64.812 78.131 2.916 4.937 31.799 64.12 15 湖南 79.793 62.873 74.671 4.741 6.041 30.593 63.86 21 广东 85.038 64.089 83.309 1.382 5.433 31.053 63.65 10 广西 81.864 64.043 78.129 0.733 3.274 30.594 63.34 19 海南 75.525 59.280 71.518 1.548 7.181 28.274 62.39 27 重庆 81.811 60.443 80.853 2.155 4.275 26.876 61.36 20 四川 77.372 58.915 73.137 3.620 5.878 29.257 60.48 24 贵州 73.548 58.813 64.507 13.891 11.451 23.167 60.01 29 云南 76.960 61.756 68.992 9.605 11.556 27.051 59.86 23 西藏 76.209 61.864 71.331 12.490 11.022 39.060 59.19 22 陕西 83.243 64.328 78.951 5.183 7.726 33.495 58.91 13 甘肃 73.988 60.063 65.402 7.243 9.671 26.142 57.88 28 青海 82.759 62.680 80.006 9.319 7.242 38.160 57.86 12 宁夏 83.583 63.043 77.074 (0.085) 12.530 32.060 57.69 17 新疆 85.268 65.488 81.461 4.039 3.177 34.389 57.51 9 三、结果说明

从表5可以看出,北京、天津。上海等地区的综合评价排在前列,原始数据也反映出这些地区存在明显的规模优势,另外,从前三个主成分得分上看,这些地区也排在前列;而对比可得,排在后面的有河南、内蒙古、贵州等地区。

明显看出,直辖市、东部沿海的地区城市设施水平高于面积大、人口多、中西部偏远等省份,由此可知,经济较发达的地区城市设施水平较高,发展较完善。

但对比上海和河南的综合得分可以看到,二者的分数相差3分左右(极差),总体分布比较集中,即总体水平相差并不大。

四、建议与意见

1. 加大偏远省区的城市水平建设,提高当地的城市燃气普及率,用水普及

率,加大公共设施建设。

2. 对于人口较多的省份,如河南,要努力提高人均水平。 3. 加强道路建设。 4. 促进地区发展平衡,发达地区带领不发达地区,促进设施水平共同提高。

联系合同范文客服:xxxxx#qq.com(#替换为@)