探析大数据时代政府统计工作的机遇与挑战 联系客服

发布时间 : 星期六 文章探析大数据时代政府统计工作的机遇与挑战更新完毕开始阅读

研究生课程考核答卷

学期 科目 年级 专业 学号 姓名 2015 至2016 学年第一学期 应用统计分析 2015级 企业管理 2015005094 胡媛媛 教师(签字):

得分

探析大数据时代政府统计工作的机遇与挑战

胡媛媛

[内容摘要] 伴随着“Internet+“技术的发展,“大数据”时代已经正式到来。它是一种运输数据、应用数据的社会化数字形态。作为一种以大量数据应用著称的方法论,政府统计工作在“大数据”时代也面临着机遇与挑战。通过借力“大数据”对信息化建设的优势,从优化统计机构设置、推进统计业务数据化,提高数据挖掘分析能力、完善统计数据发布等方面加快推进政府统计的改革。文章从介绍大数据的起源切入,简要阐述了大数据时代下政府统计的优势,对大数据时代政府统计工作面临的机遇与挑战展开分析,并在此基础上就如何紧随大数据的时代潮流,深化政府数据改革创新提出一些建议和看法。旨在为相关人员基于大数据时代政府统计的优势的大数据时代政府统计的机遇与挑战研究适用提供一些思路。 [关键词]大数据 政府统计 数据分析

Abstract With the development of the \It is a socialization digital form which can transportation and application data. As a kind of methodology famous for its large amounts of data application, the government statistical work is faced with both opportunities and challenges in the era of \statistics accelerated through from the advantage of \optimization statistical institutions. Article expounds the advantages of government statistics in the time of \origin of big data, and then analyzes the opportunities and challenges facing to the government statistical work under the era of big data, then article puts forward some suggestions and views on the basis of the data,to provide some ideas which based on the advantage of the era of big data statistics. Key words Big data Government statistics The data analysis

现阶段,政府统计工作在我国得到越来越高的重视,尤其是在建设、健全我国特色社会主义市场经济大环境下,受体制、经济架构和思维挂念等急剧转变影响下,政府统计工作的普及势必会转变为一种发展趋势。在大数据时代下,就政府统计发展来说,即面临着挑战,又存在着机遇,挑战指的是当前政府统计各类方法难以有效适用大数据,机遇指的是基于统计学,大数据展开数据处理、分析,实现大数据具备可视化特性[1]。因此,需要在“大统计”的世界里学习、掌握、比较、选择、运用和创新统计理论和统计方法,以适应大数据时代的发展及其带来的挑战。大数据将促进“大统计”,而“大统计”也应该在大数据时代为人类社会的发展和进步作出新的贡献。

一、大数据理论概述

(一)“大数据”的起源

1

在医学领域面对心脏病的风险监控,Massachusetts Institute of Technology(MIT)、密歇根大学联合一家心脏病医院创建了一个计算机的基于大型数据库的模型,完成对心脏病患者的风险监控。模型覆盖了在该医院就诊的心脏病患者所有时期心电图数据,通过对大量的数据进行分析,可以预测患者未来时期(如一年内)心脏病病发几率。[2]对比过去医生只通过不到一分钟的时间分析患者心电图数据,这一模型预测的准确度远超过去,较少的数据会使医生对心脏病患者的再度发病率缺乏判断能力。而现在通过计算机模型对大量累积数据的分析,提升对导致心脏病患者再度发病率的高风险指标判断力,以达到高效预防心脏病患者再次发病。

以上是关于应用“大数据”的一个例子,预示着“大数据”离现实生活并不遥远。“大数据”的应用就在我们身边,比如我们利用互联网进行在线交易时,我们的购买记录、偏好、乃至付款常用银行卡、家庭电话等私人日常相关数据都将在数据库中以二进制符号的形式存储。在这种背景下,“大数据”统计开始引起越来越多的关注。对比以前无法用系统全面数据进行量化的人类行为,如今互联网+时代下社交网络上的消费者所有行为在网上都有记录数据,如果能获取这些符号化的数据,便可量化、预测大众的行为模式以及偏好特点。

所谓“大数据”并不是简单的存储的海量数据,而是对伴随着互联网加时代下出现的大量社会化数据(非结构化、半结构化数据)的结构处理分析的方法论。 作为一种以“数据”为主的方法论,特别要注意“大数据”的核心价值并不体现在数据量多少。如果没有“大数据”的分析,生活中的海量数据本身简单的罗列并没有太大意义。我们要利用“大数据”就是通过使用分析关系、计算、预测等方法对数据进行深度挖掘,通过社交网络提供的海量数据寻找有价值信息,从而帮助消费者更好的认识自己的行为,并为生产者更好的了解用户需求,寻找市场提供新路径。

(二)大数据的特点 1、海量数据(Volume)

数据量如今已经从TB跃升至EB。例如,一份来自互联网数据中心的报告称,预计到2020年,全球数据量将达到之前的50倍。我们用一个形象的例子来证明EB的数据存储量到底有多大:截止至目前为止,历史上所有人类说过的所有的话语的数据总量大约是5EB。然而如今的大数据规模仍在不断增长变化,数据来源、范围多种多样。

2、多样化数据类型 (Variety)。

我们普遍认为大数据多样性主要是由于互联网的搜索记忆功能,这一说法比较片面。造成多样化的海量数据类型主要因素有很多,诸如:更新的多结构数据、

2

社交媒体通讯工具数据记录、互联网搜索等。如今的数据由于数据多样化也可以分为结构化、非结构化数据两类,其中又以非结构化数据为主。单一文本形式的数据几乎不存在了。

3、处理数据速度快(Velocity)

作为大数据显著区别于传统数据分析的特征,大数据分析近乎实时处理,移动创建数据速度快,同时基于优化的计算机软件性能,可以通过创建实时数据流,提升处理数据的效率。

4、数据价值利用率低 (Vcracity)

虽然大数据数据量大,但随着而来的是大量无用信息。如路口安装的视频监控在公安民警需调取所拍摄录像办案工作时,大部分由录像所呈现的片段都与案件无关,虽然有用数据转瞬即逝,但却对办案具有很大作用。我们可以说是大浪淘沙却又弥足珍贵,如何从海量数据中选取利于自己的数据是一门艺术与学问。

二、我国政府统计工作在大数据时代下优势

(一)高价值数据可供利用

一般情况下,政府统计数据的来源有两种:一类是来源于各地统计机构通过普查、抽样调查等手段收集再经由加工处理转换为各类官方的信息资料。另一类则是一些行政记录来源于不同部门、机构乃至个人。政府统计的历史久远,过去很长时间政府都采取由手工统计,经由几代人的努力,如今互联网时代下,如今电子计算机进行的统计工作分类明确,使统计部门得到科学的、庞大的记录社会发展的数据。大数据中经日积月累的月统计、季度统计以及年度统计获得的数字是大数据的基础。而政府统计部门通过大规模的系统普查、各式各样的抽样调查以及数据信息共享等收录了大量精确的暗示国民经济动向的信息数据。大数据时代的到来,为政府统计带来了大量高利用率的数据。

(二)可持续更新维护的数据

现阶段,政府统计体系包含:作为主体地位的定期抽样调查、周期性调查,辅以全面采调查、重点调查等方法,同时结合有效行政记录等信息。周期性普查又包含:全国人口普查(十年)、全国农业普查以及全国经济普查(五年);定期抽样调查内容则包含:人口、企业绩效监测、餐饮住宿记录、劳动力数量等;全面系统调查报表应用范围包含:零售商类、工业、邮电业、建筑业、房地产开发业等一系列统计调查行业[2]。由此可以看出现阶段我国政府统计在专业调查规模之上形成了一种特定的政府采集工作模式,也就是利用互联网将采集的原始数据向全国数据中心直接传输,与此同时统计部门中的各个层级可同步共享各项数据。大数据时代的到来,使政府统计有可持续更新维护数据的能力。

(三)数据拓展空间大

3