统计学考点总结 - 图文

发布时间 : 星期三 文章统计学考点总结 - 图文更新完毕开始阅读

第4章 统计指数

指数的概念:指数本质上是对变异的一种度量。 指数有广义和狭义之分。

广义:表明现象数量变动程度或差异程度的相对数。

狭义:表明复杂现象综合变动的相对数。如物价指数、股价指数、石油指数、钢铁指数等。所谓复杂现象是指包含多种因性质不能直接相加或不能直接对比的个体组成的总体。(复杂现象的特点:有两个或以上的因素)

指数的种类(填空题)

1.按其反映的对象范围的不同,可以分为个体指数和总指数

2.按其所反映的社会经济现象特征的不同,分为数量指标指数和质量指标指数 3.按其采用基期的不同,分为定基指数和环比指数 4.按其对比内容的不同,分为动态指数和静态指数

5.按常用的计算总指数的方法或形式,可以分为综合指数和平均指数。

指数的作用(3个作用)

1.指数能够综合反映事物的变动方向与变动程度。 2.指数能够对复杂的社会经济现象进行因素分析。 3.指数可以研究事物在长时间内的变动趋势。

第5章 抽样与抽样分布

抽样调查概述

抽样调查是指按照一定的规则从总体中取出一部分单位组成一个样本,并收集样本的数据资料的过程,简称为抽样。 常用的随机抽样方法:

(思考题3:抽样调查有哪几类方法?它们各自的特点是什么?) 1.简单随机抽样

(思考题1:什么是简单随机抽样) 简单随机抽样是从总体中抽取n个单位作为样本时,使得每一个总体单位都有相同的机会(概率)被抽中,也称纯随机抽样。

(思考题2:什么是重复抽样和非重复抽样)

简单随机抽样有两种抽取单位的具体方法,即重复抽样和不重复抽样。 重复抽样是指从总体中抽取一个单位,然后把这个单位放回到总体中再抽取第二个单位,直到抽取n个单位为止,又称为有放回的简单随机抽样。

不重复抽样是指一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,又称为无放回的简单随机抽样。 2.分层抽样

分层抽样也称分类抽样,是按一定标志将总体分为互不重叠的子总体,即层(或类),然后分别在每个层中进行简单随机抽样,得到样本。 3.系统抽样

系统抽样是指将总体中所有单位按某一标志进行排列,并在规定的范围内随机抽取起始单

位,然后每隔一定的间隔抽取一个单位,直到抽取n个单位为止,又称等距抽样或机械抽样。 4.整群抽样

整群抽样是指将总体分为若干互相不重叠的群,然后从其中随机抽取部分群,对中选的群进行全面调查的抽样组织方式。 分层抽样和整群抽样的区别:

两种方式恰好相反,分层抽样中层内应该是同质的,而整群抽样中群内应该是异质的。

(思考题8:抽样误差有哪几种类型,它们的含义是什么?) 抽样误差是抽样估计过程中要重点控制的对象,主要分为三种:抽样实际误差、抽样平均误差和抽样极限误差。

抽样实际误差是指某一具体抽样中,样本统计量的值与总体参数真实值之间的偏差。 抽样平均误差是指样本统计量的所有可能取值与总体指标之间的平均差异程度。 抽样极限误差是指一定概率下抽样误差的可能范围,说明样本统计量在总体参数周围变动的范围,记作△,又称为允许误差。

3个分布的概念和区别

(思考题9:简述总体分布、样本分布和抽样分布的含义)

1.总体分布是指被研究对象中所有观察值所形成的分布。若将我们研究的现象设为随机变量X,则X的概率分布就是总体分布。总体分布通常是未知的,但也是唯一的、确定的。 2.样本分布是指一个样本中n个观察值形成的分布,也称为经验分布。当样本容量n逐渐增大时,样本分布逐渐趋近于总体分布。注意,样本分布是随机的,每抽取一个样本就对应着一个样本分布。样本分布和总体分布的误差就是抽样误差。

3.抽样分布是由来自某总体样本的n个观测值计算出来的统计量的概率分布,是从同一个总体中重复选取容量为n的样本时,由该统计量的所有可能取值形成的概率分布。

(思考题4:什么是样本统计量)

样本统计量是根据样本资料计算出来的,它的值随着样本的不同而变化,是一个关于样本的随机变量。

(思考题7:什么是参数) 总体的数量特征称为总体参数,简称为参数。总体参数一般是未知的常数。

第6章 参数估计

什么是参数、样本统计量,区别。

参数:统计学中的参数是总体(或一个模型)的数值特征,是一个非随机的、确定的值,但却是未知的。

(思考题1:为什么样本统计量是随机变量)

样本统计量:指的是利用样本所获得的一些数量特征来估计总体参数。(即参数估计)样本统计量是根据样本资料计算出来的,它的值随着样本的不同而变化,样本的选取是随机的,所以样本统计量是一个关于样本的随机变量。

(思考题2:点估计和区间估计各自的作用是什么?) 点估计:指直接用估计量来估计未知的总体参数。 区间估计的含义

区间估计:利用实际样本资料,构造出一个基于点估计的区间,用这个区间来表明总体参数可能存在的范围,同时给出这个区间估计相应的概率保证程度(置信水平)。

(思考题3:评价估计的优良性有哪些标准。) 估计量优劣的评价标准

1.无偏性:指估计量的期望值(平均数)等于被估计的总体参数。

2.有效性:作为优良估计量的方差应该比其他估计量的方差小。方差小的更有效。 3.一致性:当样本容量达到充分大的时候,样本统计量也会越来越接近总体参数。

第7章 假设检验

(思考题1:什么是原假设和备择假设,如何确定原假设和备择假设) 原假设和备择假设的含义: 原假设 : 有“=” 备择假设:无“=”

一般地,原假设是要进行检验的假设,用一个等式或≥、≤式来表示,通过样本观测信息,以获得量化的分析结果来推断它是否成绩。

如果原假设不成立,就要拒绝原假设,需要在另一个假设中做出选择,这个假设称为备择假设。

(思考题2:什么是第一类错误,什么是第二类错误)

简答题:当进行假设检验时,存在两类可能的错误。(弃真取伪)

第一类错误(弃真)是原假设正确却拒绝它。第二类错误(取伪)是当原假设不正确时却未能拒绝。我们把发生第一类错误的概率记为α,通常它也被称作显著性水平。第二类错误发生的概率记为β。发生错误的概率α和β是相反的关系,这就意味着任何尝试减少某一类错误的方法都会使另外一类错误发生的概率增加。 P(第一类错误)=α P(第二类错误)=β 只有增大样本容量,才是使两类风险同时减少的唯一途径。实际中往往考虑由选定的显著性水平α来控制犯第一类错误的概率。

简答题:什么是小概率原理? 假设检验的原理是?(小概率原理)

假设检验的基本思想是基于小概率原理,即小概率事件在一次试验或观察中不会发生。事件发生的概率小,说明事件出现的可能性小,那么这样的事件在一次或少量观察中,往往是不会出现的。假设检验是依据这一原理,对提出的假设做出拒绝与否的判断。

简答题:叙述假设检验的步骤 1.确定原假设与备择假设 2.构造检验统计量

3.根据样本数据,计算检验统计量的数值

4.给出显著性水平,确定检验统计量的临界值与拒绝域 5.判断或决策

第9章 相关与回归分析

变量之间的依存关系可分为两种:函数关系和相关关系。 两种关系的区别

函数关系指的是变量直接存在的严格的确定的关系。而相关关系则是指变量之间的不确定性的依存关系。

实际上,两种关系通常并不存在严格的界限。由于有测量误差等原因,函数关系在实际中往往通过相关关系表现出来;反之,当对现象之间内在本质规律了解清楚透彻时,相关关系也可能转化为函数关系。因此,相关关系一般可以用一定的函数关系表达式来近似描述。

相关关系的种类

按照相关关系的密切程度划分: 完全相关、不完全相关和不相关

完全相关:一个变量的值完全由另一个变量的值所决定,即函数关系(例如圆的周长和半径之间的关系L=2πR)

不相关:两个变量各自独立,互不影响(例如小孩身高和房子外面小树的高度之间,一般是不相关的) 不完全相关:介于完全相关和不相关之间,一般统计中的相关分析就是指对这种不完全相关的分析。

按相关的方向划分: 正相关和负相关

正相关:自变量的数值增加,因变量的数值也基本随之增加。(例如商品价格上升,供给也上升)

负相关:反之(例如商品价格上升,需求下降)

相关分析与回归分析(含义、区别和联系) 相关分析:是研究变量之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法,其主要目的在于分析现象间相关关系的形式和密切程度以及依存变动的规律性。

回归分析:是对两个或两个以上变量间相互依赖的定量关系的一种统计分析方法。

区别:相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量和因变量。(相关系数)

而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。(回归方程)

联系:回归分析是以变量之间存在相关关系为基础的,若变量没有相关关系,则也无从存在回归分析。

第10章 时间序列分析

时间序列的概念(有哪些应用)

所谓时间序列就是将某一指标在不同时间上的数值,按照时间的先后顺序记录,并排列而成的数列,也称为动态数列。

例如,股价指数、物价指数、GDP和某城市的月用电量等等。时间序列分析在电力工程、信息工程、物理学、天文学、海洋学和气象科学等领域有着广泛的应用。

时间序列的种类

时间序列按照其数量指标的性质和表现形式,可以分为绝对数时间序列、相关数时间序列和平均数时间序列。 绝对数时间序列:将同类总量指标值在不同时间上的数值按时间的先后顺序排列所形成的时间序列,反映了社会经济现象达到的绝对水平。

根据时间的特点,绝对数时间序列又可分为时期序列和时点序列。 时期序列和时点序列的特点对照:

1.时期序列中各时间上的指标值可以直接相加,其和为现象在更长时间内的总量水平,而时点序列中各时间上的指标直接相加没有实际意义。

2.时期序列的指标值的大小与所属的时间的长短有直接关系,而时点序列的指标值的大小与所属时间的长短并无直接关系。

3.时期序列中各指标值反映了现象在一段时间内的发展变化的总量,因而必须将这段时间内,现象发生的数量逐一登记,并加以累计得到相应的指标值,所以时期序列的指标值一般采用连续登记的方式获得。而时点序列中的指标值反映的是现象在某一时刻上的总量水平,只需在相应时间点上统计即可,所以时点序列的指标值一般采用间断登记的方式获得。 相对数时间序列和平均数时间序列:

将同类相对指标或平均指标在不同时间上的数值按时间的先后顺序排列所形成的时间序列。

影响时间序列的主要因素:

(影响时间序列的主要因素有哪些,分别解释含义) 1.长期趋势

指客观现象在一段相当长的时期内,由某种根本性的支配因素导致的上升、下降或水平的趋势,通常记为Tt。 2.季节变动

指时间序列受季节性因素引起的,在一年内有规律的,以一定时间为周期(年、季、月、周、日)的周期性变动,通常记为St。 3.循环变动

指周期长短不固定且长度超过一年的周期性变动,通常记为Ct。 4.不规则变动

指时间序列除去长期趋势、季节变动、循环变动,通常记为It。不规则变动是由那些影响时间较短的、不可预测的和不重复出现的众多偶然因素引起的,呈现为无规律的随机变动。

联系合同范文客服:xxxxx#qq.com(#替换为@)