信息统计分析期末论文

发布时间 : 星期一 文章信息统计分析期末论文更新完毕开始阅读

信 息 统 计 论 文

论题:分地区农村居民消费支出 姓名:吴文洁 学号:A01214035 专业:12信息与计算科学

分地区农村居民消费支出

—SAS和MATLAB的相关应用

摘要:近年来, 各类真人秀节目纷纷到农村取景,这让我们了解到农村的现状。关于拉近城乡距离,首先要从经济方面着手。农村居民消费十分准确的反映了这一经济状况。消费、投资和净出口被誉为拉动经济增长的“三驾马车”,在这三驾马车中,消费的作用是最主要的,因为无论是发达国家还是发展中国家,消费在一国的国内生产总值中所占的份额均最大。已有研究表明,中国居民消费率大大低于国际水平,其主因是中国农村消费市场疲软。因此,扩大内需其实重点是要扩大农村居民消费需求。特别是在全球金融危机仍然蔓延的时候,提高农村居民的消费需求显得尤为重要。利用SAS软件对我国各分地区农村居民消费情况进行分析,进一步了解消费情况,做出重要的决策。 关键字:消费支出 聚类分析 正文:

扩大国内需求,最大潜力在农村;实现经济平稳较快发展,基础支撑在农业;保障和改善民生,重点难点在农民。扩大消费尤其是扩大居民消费,无疑是中国。经济在今后相当长时期内最重要的命题之一。在中国,居民消费占GDP的比重低且不断降低,一个非常重要的原因就在于占总人口50%以上的农村居民消费严重滞后。如果农村居民消费能伴随农民收入增长而快速增长,消费占GDP的比重将稳步提升,国民经济发展必将具备更坚实的微观基础。因此有必要对各地农村居民的综合消费水平做个评价,以其为今后的经济发展提供参考。

各个地区的农村居民的消费指标主要是衣食住行支出、家庭设备及用品支出、交通通信、文教娱乐、医疗保健和其他支出等。本文通过利用SAS软件对我国31个省市消费指标进行了分析,提出了各地区的差异及相关的评价。全国31个省、自治区、直辖市附近的农村居民各消费支出作为样本,设x1为食品支出,x2为衣着支出、x3为居住支出、x4为家庭设备及用品支出、x5为交通通信支出、x6为文教娱乐支出、x7为医疗保健支出、x8为其他商品支出。相关数据来源于中国统计年鉴(2013),该表格见附件1.xls。

一、 分析方法理论的介绍

聚类分析实质上是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类。常用的聚类统计量有距离系数和相似系数两类。距离系数一般用于对样品分类,而相似系数一般用于对变量聚类。距离的定义很多,如马氏距离、明考斯基距离、兰氏距离、切比雪夫距离以及常见的欧氏距离等。相似系数有相关系数、夹角余弦、列联系数等。 下面以样品聚类为例介绍系统聚类法。 1.系统聚类法的基本思想:

设有n个样品,每个样品测得m项指标(见表7-1)。系统聚类方法的基本思想是:首先定义样品间的距离(或相似系数)和类与类之间的距离。一开始将n个样品各自自成一类,这时类间的距离与样品间的距离是等价的;然后将距离最近的两类合并,并计算新类与其他类的类间距离,再按最小距离准则并类。这样每次减少一类,直到所有的样品都并成一类为止。这个并类过程可以用谱系聚类图形象地表达出来。 2.数据变换

为了便于比较或消除量纲的影响,在作聚类之前常常首先要对数据进行变换。变换的方法有中心化变换、标准化变换、极差标准化变换、极差正规化变换、对数变换等。最常用的标准化变换为:其中j = 1,2,?,m。变换后的数据,每个变量的样本均值为0,标准差为1,而且标准化变换后的数据{ }与变量的量纲无关

聚类方法分为以下几种:

重心法:重心法(Centroid Method)用两个类重心(均值)之间的(平方)欧氏距离定义类间距离。

最长距离法:用 最长距离法(Complete Method)用两类观测间最远一对观测的距离定义类间距离。

最短距离法: 最短距离法(Single Linkage) 用两类观测间最近一对观测的距离定义类间距离。

二、 对不同地区人均消费水平进行聚类分析

1.使用最短距离法和最长距离法对不同地区居民消费情况做聚类分析,程序见附件1.m

31个地区农民消费情况聚类分析图

不同聚类方法分组情况如下所示: ? 最短距离法聚类的结果: group11 = 3(河北) 4(山西) 5(内蒙古) 6(辽宁)

7(吉林) 8(黑龙江) 12(安徽) 13(福建) 14(江西) 15 (山东) 16 (河南) 17(湖北) 18(湖南) 19(广东) 20 (广西) 21(海南) 22(重庆) 23(四川) 24(贵州) 25(云南) 26 (西藏) 27(陕西) 28(甘肃) 29(青海) 30(宁夏) 31(新疆)

group12 = 2(天津) 10 (江苏) 11 (浙江)

group13 = 1 (北京) group14 =9(上海) ? 最长距离法聚类的结果: group21 =26(西藏)

group22 = 3 (河北) 4 (山西) 5 (内蒙古) 6 (辽宁) 7 (吉林) 8 (黑龙江) 12(安徽) 14 (江西) 15 (山东) 16 (河南) 17 (湖北) 18(湖南) 20 (广西) 21 (海南) 22 (重庆) 23 (四川) 24 (贵州) 25 (云南) 27 (陕西) 28(甘肃) 29(青海) 30 (宁夏) 31(新疆) group23 =1 (北京) 9(上海) group24 = 2 (天津) 10 11 1 3 19(广东)

结果分析:从聚类结果可以看出, 第一类地区主要在西部,发展较为缓慢,农村居民的消费水平较低;第二类主要集中在中东部地区,经济发展中等,

联系合同范文客服:xxxxx#qq.com(#替换为@)