PM2.5的主成分分析

发布时间 : 星期日 文章PM2.5的主成分分析更新完毕开始阅读

信息与计算科学专业学年论文

论文题目 PM2.5的相关因素分析 姓名 学号 黄坤兰 3111342127 指导教师 谢海

中文摘要 为了研究PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物(PM10)等5项分指标及其对应污染物(含量)之间的相关性及其关系。对武汉市2013年1月-8月份的PM2.5质量浓度、影响因素数据资料进行整理统计,运用典型相关分析及其MATLAB分析PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物之间的相关性及其关系,结果显示:PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的相关系数为0.8336,可见相关系数比较接近于1,说明PM2.5和二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的复相关性很强,这五项分指标对PM2.5的质量浓度影响还是很大的;而对于这五项污染物指标进行了主成分分析,并运用spss软件进行了详细的相关性分析,得出贡献率,并算出每个变量的累计贡献率,然后根据累计贡献率所占的百分比,分出第一主成分和第二主成分;然后用spss计算出第一主成分的值、第二主成分的值和综合主成分的值,进而得出各个变量的排名情况,从而知道二氧化硫对PM2.5的影响比较大,从而可以推测出PM2.5形成的机理与这几个变量的紧密相关程度。

桂林理工大学理学院信息与计算科学专业学年论文(2011级)

PM2.5的相关因素分析

学生姓名:黄坤兰 学号:3111342127 指导教师:谢海

摘 要:为了研究PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物(PM10)等5项分指标及其对应污染物(含量)之间的相关性及其关系。对武汉市2013年1月-8月份的PM2.5质量浓度、影响因素数据资料进行整理统计,运用典型相关分析及其MATLAB分析PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物之间的相关性及其关系,结果显示:PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的相关系数为0.8336 ,可见相关系数比较接近于1,说明PM2.5和二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的复相关性很强,这五项分指标对PM2.5的质量浓度影响还是很大的;而对于这五项污染物指标进行了主成分分析,并运用spss软件进行了详细的相关性分析,得出贡献率,并算出每个变量的累计贡献率,然后根据累计贡献率所占的百分比,分出第一主成分和第二主成分;然后用spss计算出第一主成分的值、第二主成分的值和综合主成分的值,进而得出各个变量的排名情况,从而知道二氧化硫对PM2.5的影响比较大,从而可以推测出PM2.5形成的机理与这几个变量的紧密相关程度。 关键词:PM2.5;相关性;相关系数;主成分分析

1前言

由于工业的发展越来越迅猛,进而产生了一系列环境问题,尤其是近年来空气质量越来越严重,所以有部分专家专注研究这方面,找出这些问题的产生的因素。发现细颗粒物影响空气质量也占了很大一部分。细颗粒物是指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物,也称PM2.5、可吸入肺颗粒物。它能较长时间悬浮于空气中,其在空气中含量(浓度)越高,就代表空气污染越严重。虽然PM2.5只是地球大气成分中含量很少的组成,但它对空气重量和能见度等有重要的影响。与较粗的大气颗粒物相比,PM2.5粒径小,表面积大,活性强,易附带有毒、有害物质,且在大气中的停留时间长,输送距离远,因而对人体健康和大气环境的影响更大。而可吸入颗粒物也叫PM10,是指空气动力学直径小于10微米的细颗粒。戴海夏等的研究表明城区中大气PM2.5日平均浓度与居民日死亡数之间存在明显关联,浓度上升总死亡数上升。最近这几年,城市PM2.5的研究日益引起公众的广泛关注。已有研究表明,我国大陆城市大气中PM2.5约占PM10的50%~70%,已成为影响环境空气质量的主要污染物之一。

有研究表明,AQI监测指标中的二氧化硫,二氧化氮,一氧化碳是在一定环境条件下形成PM2.5前的主要气态物体。所以为了了解PM2.5(含量)与其它5项分指标及其对应污染物(含量)之间的相关性及其关系进行分析。对武汉2013年1月-8月份的二氧化硫、一氧化碳、二氧化氮、臭氧、PM2.5、可吸入颗粒物这六个变量的质量浓度进行分析。而我们根据贡献率的大小,然后分析各个变量的影响大小。对于贡献率的概念,即贡献率是分析经济效益的一个指标。它是指有效或有用成果数量与资源消耗及占用量之比,即产出量与投入量之比,或所得量与所费量之比。计算公式:贡献率(%)=贡献量(产出量,所得量)/投入量(消耗量,占用量)×100%贡献率也用于分析经济增长中各因素作用大小的程度。

2 典型相关分析分析PM2.5与这五项分指标关系

2.1典型相关分析思想

在相关分析中,当考察的一组变量仅有两个时,可用简单相关系数去衡量;当考察的一组变量有多个,研究一个随机变量之间的线性相关关系,可用复相关系数去衡量,然后,在样本数量庞大所面临的复杂研究中,多数都是想要找出一个以上的反应变量与一组解释变量的关系。这种用于探讨一组解释变量与一组反应变量间的关系的分析方法既是典型相关分析法,典型相关分析可以说是复相关分析的延伸。

- 1 -

桂林理工大学理学院信息与计算科学专业学年论文(2011级)

这个模型的基本思想就是运用典型相关分析,分别在两组变量中选取若干个有代表性的综合变量,每一综合变量都是这组变量的一个线性组合,而且综合变量之间是互相关的,称这种综合变量为典型相关变量。然后,通过这一组典型相关变量的相关关系研究。在实际上,只须着重研究相关关系较大的那几对典型相关变量。 2.2典型相关分析的数学模型

设随机向量为X?(X1,...,Xp)与另一组变量(Y1,...,Yq),而我所要研究的是当p?1,q?1时,p维

1??XX?XY??X??YX??XX?XY随机向量X?(X1,...,XP),设?为?,则称R??Y??~NP?1(?,?),????? ???YY????YXYYY与X1,X2,...,XP的全(复)相关系数,全相关系数用于度量一个随机变量Y与另一组随机变量

X1,X2,...,XP的相关关系。

复相关系数的求法:

假设Y~NP(?,?),其中,??0。将Y,?和?分别剖分为Y???Y??,???????,

?2??2??y1???1???11?12???????21 ?22? ,变量y1与向量变量Y2之间的复相关系数是基于简单相关系数来定义的。构造向

?1p-1???量变量Y2的线性组合a'Y2,其中,a?RP?1。变量y1与变量a'Y2之间的简单相关系数为

ρy1,a'Y2?Cov(y1,a'Y2)Cov(y1,Y2)a?12a??,变量y1与向量变量Y2之间

Var(y1)Var(y2)?11a'Var(Y2)a?11a'?22ap-1的复相关系数ρy1,Y2被定义为在a?R时,变量y1与变量a'Y2之间的简单相关系数ρy1,a'Y2的最大值

ρy1,Y2?supρy1,a'Y2?a?Rp?11?12a,考虑到这个最大值一定是非负(至少是0)的,所以supσ11a?Rp?1a'?22aρy1,Y21?σ11(?12a)2(?12a)21,根据关于二次型极值的性质,有sup??12??sup22?21,

a'?22aa'?22aa?Rp?1a?Rp-1?1并且在a??22?21的时候取得最大值。所以变量y1与向量变量Y2之间的复相关系数ρy1,Y2被定义

ρy1,Y2被定义为ρy1,Y21?12??22?21,其中,?11?Var(y1),?22?Cov(Y2),?12?Cov(y1,Y2)。显?σ11然0?ρy1,Y2?1。ρy1,Y2越大,意味着变量y1与向量变量Y2之间的复相关性越强。

- 2 -

桂林理工大学理学院信息与计算科学专业学年论文(2011级)

2.3 MATLAB编码符号说明 2.3.1 通用符号

A、X PM2.5 B 二氧化硫 C 一氧化碳 D 二氧化氮 E 臭氧

F 可吸入颗粒物

Y B、C、D、E、F进行线性组合,构造向量变量 ALL 连接X和Y这两个矩阵 DXY 计算ALL的协方差

V11 取ALL矩阵中第1-5行和第1-5列的元素构成的矩阵

V12 取ALL矩阵中第1-5行和第6列的元素构成的矩阵 V21 取ALL矩阵中第6行和第1-5列的元素构成的矩阵

V22 取ALL矩阵中第6行和第6列的元素构成的矩阵 R 计算变量X与向量变量Y之间的复相关系数

2.3.2 常用函数符号

zscore() 将矩阵进行标准化 cov() 求矩阵的协方差函数 inv() 求矩阵逆的函数

2.4 结果与分析

表1 协方差矩阵

PM2.5 二氧化硫 一氧化碳 二氧化氮 臭氧 可吸入颗粒物

PM2.5 1.0000 0.7241 0.8216 0.7324 0.3549 0.7787

二氧化硫 0.7241 1.0000 0.6570 0.8051 -0.1815 0.6779

一氧化碳 0.8216 0.6570 1.0000 0.6245 -0.3830 0.5860

二氧化氮 0.7324 0.8051 0.6245 0.0000 -0.0646 0.7275

臭氧 0.3549

可吸入颗粒物 0.7787

-0.1815 0.6779 0.3830 0.0646 1.0000

0.5860 0.7275 -0.0685

-0.0685 1.0000

运用MATLAB编辑软件进行编码得到了协方差矩阵和最终的结果复相关系数为0.8336,结果比较接近于1,说明了PM2.5与二氧化硫、一氧化碳、二氧化氮、臭氧、可吸入颗粒物的复相关性很强,也就意味着PM2.5的浓度的增大或者变化,很大一部分是由这五个变量影响的。

3 主成分分析五项分指标的关系

3.1主成分分析的基本原理

主成分分析法是一种降维的统计方法,它借助于一个正交互换,将其分量相关的原随机向量转化成其分量不相关的新的随机向量,这在代数上表现将原随机向量的协方差阵变换成对角形矩阵,在几

- 3 -

联系合同范文客服:xxxxx#qq.com(#替换为@)