实验:主成分分析

发布时间 : 星期二 文章实验:主成分分析更新完毕开始阅读

数理经济学分析方法 实验报告2:主成分分析

1. 采用数据student.txt,对六个变量做协方差矩阵和相关系数矩阵。 我在做主成分分析之前对student.txt进行90%的随机抽样,然后根据抽样后的数据,利用spss计量分析软件对六个变量做协方差矩阵和相关系数矩阵如下。

(1)协方差矩阵

项间协方差矩阵 VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00001 95.117 86.638 81.622 -78.737 -49.277 -51.975 VAR00002 86.638 196.094 101.140 -80.705 -48.619 -54.245 VAR00003 81.622 101.140 180.663 -79.275 -46.809 -52.245 VAR00004 -78.737 -80.705 -79.275 177.724 111.933 117.244 VAR00005 -49.277 -48.619 -46.809 111.933 106.063 88.028 VAR00006 -51.975 -54.245 -52.245 117.244 88.028 112.574 (2)相关系数矩阵

项间相关性矩阵

VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006

VAR00001

1.000 .634 .623 -.606 -.491 -.502 VAR00002

.634 1.000 .537 -.432 -.337 -.365 VAR00003

.623 .537 1.000 -.442 -.338 -.366 VAR00004

-.606 -.432 -.442 1.000 .815 .829 VAR00005

-.491 -.337 -.338 .815 1.000 .806 VAR00006

-.502 -.365 -.366 .829 .806 1.000

2. 采用数据student.txt,先对六个变量做标准化,然后求协方差矩阵和相关系数矩阵。观察步骤1和步骤2的结果,并做说明。

运用spss计量分析软件对六个变量做标准化后,得出协方差矩阵和相关系

数矩阵如下。

(1)标准化后协方差矩阵

项间协方差矩阵 Zscore(VAR0000Zscore(VAR000021) Zscore(VAR00001) Zscore(VAR00002) Zscore(VAR00003) Zscore(VAR00004) Zscore(VAR00005) Zscore(VAR00006) 1.000 .634 .623 -.606 -.491 -.502 ) .634 1.000 .537 -.432 -.337 -.365 Zscore(VAR00003) .623 .537 1.000 -.442 -.338 -.366 Zscore(VAR00004) -.606 -.432 -.442 1.000 .815 .829 Zscore(VAR00005) -.491 -.337 -.338 .815 1.000 .806 Zscore(VAR00006) -.502 -.365 -.366 .829 .806 1.000 (2)标准化后相关系数矩阵

项间相关性矩阵 Zscore(VAR00001Zscore(VAR00002Zscore(VAR00003Zscore(VAR00004Zscore(VAR00005Zscore(VAR00006) Zscore(VAR00001) Zscore(VAR00002) Zscore(VAR00003) Zscore(VAR00004) Zscore(VAR00005) Zscore(VAR00006) 1.000 .634 .623 -.606 -.491 -.502 ) .634 1.000 .537 -.432 -.337 -.365 ) .623 .537 1.000 -.442 -.338 -.366 ) -.606 -.432 -.442 1.000 .815 .829 ) -.491 -.337 -.338 .815 1.000 .806 ) -.502 -.365 -.366 .829 .806 1.000

解释说明:步骤1是原始数据未经过标准化处理得到的协方差矩阵和相关系数矩阵,而步骤2是经过标准化处理后得到的协方差矩阵和相关系数矩阵。从表格中,我们可以发现,标准化以后的协方差矩阵和相关系数矩阵对应相等,并且与未经标准化处理的相关系数矩阵对应相等,唯独与未经标准化处理的协方差矩阵对应不相等。这表明在进行主成分分析时,一般采用相关系数矩阵进行分析,因为相关系数就是标准化以后的协方差,它可以消除量纲的影响,从而避免了由于量纲影响而导致的分析误差。

3. 用数据student.txt,分别采用协方差矩阵和相关系数矩阵进行主成分分析,并解释模型输出结果。

做主成分分析之前对student.txt进行90%的随机抽样后,利用spss计量分析软件得到模型分析结果如下表: (1)基于相关系数矩阵的主成分分析:

解释的总方差 成份 合计 1 2 3 4 5 6 3.740 1.127 .463 .319 .195 .156 初始特征值 方差的 % 62.329 18.785 7.718 5.322 3.243 2.603 累积 % 62.329 81.114 88.832 94.154 97.397 100.000 合计 3.740 1.127 提取平方和载入 方差的 % 62.329 18.785 累积 % 62.329 81.114 提取方法:主成份分析。

成份矩阵

a

1

VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006

成份

2 .351 .527 .515 .303 .445 .414 -.808 -.673 -.674 .893 .823 .840 从“解释的总方差”一表中可以得出相关系数矩阵的特征值为:

λ1=3.740;λ2=1.127;λ3=0.463;λ4=0.319;λ5=0.195;λ6=0.156 前两个成份的特征值都大于1,并且累计贡献率达到81.116%。

将“成份矩阵”表中每一列值分别除以特征值的开方,就得出了每一个特征值对应的特征向量,由此可以得出第一、第二主成分表达式:

F1=-0.417X1-0.348X2-0.348X3+0.461X4+0.425X5+0.434X6

F2=0.331X1+0.496X2+0.485X3+0.285X4+0.419X5+0.389X6

(2)基于协方差矩阵的主成分分析: 解释的总方差 1 2 原始 4 5 6 1 2 重新标度 4 5 6 34.534 24.221 19.805 4.247 2.979 2.436 3 34.534 24.221 19.805 472.538 171.953 90.060 4.247 2.979 2.436 58.115 21.148 11.076 3 成份 合计 472.538 171.953 90.060 初始特征值 方差的 % 58.115 21.148 11.076 累积 % 58.115 79.262 90.338 94.586 97.564 100.000 58.115 79.262 90.338 94.586 97.564 100.000 合计 472.538 171.953 a提取平方和载入 方差的 % 58.115 21.148 累积 % 58.115 79.262 3.517 1.219 58.613 20.316 58.613 78.929 提取方法:主成份分析。 a. 分析协方差矩阵时,初始特征值在整个原始解和重标刻度解中均相同。 成份矩阵a 原始 成份 1 VAR00001 VAR00002 VAR00003 VAR00004 -7.360 -9.464 -9.236 11.279 2 1.998 6.961 6.245 5.472 1 -.787 -.701 -.700 .864 重新标度 成份 2 .214 .516 .473 .419

联系合同范文客服:xxxxx#qq.com(#替换为@)