社会统计学期末复习题与答案整理 联系客服

发布时间 : 星期六 文章社会统计学期末复习题与答案整理更新完毕开始阅读

22.散点图 P165 散点图

散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。

散点图是描述变量关系的一种直观方法,从散点图中直观的看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关系强度则需要相关系数来判断。

23.相关系数 P170

相关系数就是对变量之间相关关系程度和方向的度量。当研究两个变量之间的相关关系时我们称之为简单相关系数。总体相关系数用ρ表示,样本相关系数一般用r表示。

24.最小二乘法 P180

对于变量x和y的观察值,有多条直线可以描述,其中距离各观测值最近的一条直线对x与y之间的关系的描述与实际的误差最小。最小二乘法是使因变

??量的观察值与估计值之间的离差平方和达到最小来求参数?0合?1的方法,即使得:

????x??n?2???yi????yi?y01i2?最小

25.独立样本与配对样本 P207,P203 独立样本

独立样本(independent sample)是指我们得到的样本总体之间是相互独立的。比

如我们要研究一个地区百姓的生活水平,要同时考察家庭的子女数x,父母的教育水平y,这就可以看做是独立样本。两个样本容量当总体标准差

n1和n2都小于30,或其中一个小于30的两独立样本为独立小样本。

?1和?2未知时,独立小样本均值之差的检验采用t检验。

配对样本

配对样本(matched sample)就是一个样本中的数据与另一个样本中的数据相对应的两个样本。配对样本可以消除由于样本指定的不公平造成的差异。在选择配对样本时,可以将两种同质对象分别接受两种不同的处理。

26. 组内均方 P218

组内误差的自由度为全部观察值个数减去因素水平个数,即n-k,其中n为全部观察值个数,k为因素水平的个数。SSE的均方记作MSE,称为组

9

内均方。其计算公式为:

MSE=

组内平方和SSE? n?k自由度

三、简答题

1.举例简要说明社会研究过程。 P4

系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程:提出问题、形成假设、收集数据、分析数据、检验假设。 1、提出问题:是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的是什么。 2、形成假设:研究问题往往是无法直接检验的,而是要把研究问题形成假设才可以进行检验。也就是对两个变量间关系进行尝试性回答。 3、收集数据:是社会研究的关键步骤。 4、分析数据:对收集的原始数据进行系统的审核、整理、归类、统计和分析。 5、检验假设:完成对数据的统计分析后,我们要开始进行最后一步——根据对数据的分析来检验我们之前的假设和理论。

2.按测度水平,变量可分为哪几类?并举例说明。 P7

变量分类(按测度水平): (1)定类变量

当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。定类变量是最低层次的变量。在社会调查中,定类变量有很多,如性别、婚姻状态、民族、地区、职业.等。 性别可以分为男、女两类,我们可以用1表示男性,用2表示女性。民族可以分为汉族和少数民族,我们可以用1表示汉族,用2表示少数民族。 (2)定序变量

当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。社会调查中,受教育程度是定序变量,可以分为文盲、小学、初中、高中、大专及以上等;人们对某种制度的态度可以分为非常同意、同意、中立、不同意、非常不同意等。 我们也可以用不同的数值1、2、3等表示不同的类别,但是这时候1、2、3等是包含大小的比较意义的,例如,用“1”表示文盲,用“2”表示小学,用“3”表示初中,用“4”表示高中,用“5”表示大专及以上。此处,数字1、2等不仅仅表示文化程度的分类,还表示文化程度的高低,1还代表最低的文化程度,2表示的文化程度要高于1,5表示最高的文化程度。 (3)定距变量

当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。定距变量具有

10

测量单位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性。智商、温度等都是定距变量。 定距变量的变量值是用数值表示的,同一度量单位之间我们可以准确的计算出个体之间的差值。例如,地区甲的温度是0°,地区乙的温度是8°,则甲的温度比乙的温度低8°,而在定类和定序变量中则不能这样。在定距变量中,0的选取只是为了方便或习惯,0只表示一个数值,而不表示该现象不存在。如地区乙的温度=0°,并不是说地区乙没有温度;一个人的智商=0,并不是说这个人没有智商。 (4)定比变量

除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。定比变量是最高层次的变量。在社会调查中,很多情况下我们使用的都是定比变量,例如身高、年龄、收入、一个地区的人口数、某产品的生产量等。 定比变量的变量值也是用数值表示,但是与定距变量相比,两者的唯一区别是,定比变量有绝对零点,即定比变量中的“0”是有实际意义的数值。例如,一个人的身高是0米,则表示这个人不存在;一个人的收入是0元,则表示这个人没有收入。同样,由于定比变量中有绝对零点,除可以进行“=”或“≠”、“>”或“<”比较外,它还可以进行“+”、“-”、“×”、“÷”运算。例如,职工甲每月收入是7500元,职工乙每月收入是2500元,我们可以说职工甲比职工乙每月多收入5000元,也可以说职工甲每月的收入是职工乙的3倍。

3.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)网络供应商的姓名 定性变量

(2)每月的网络服务费 定量变量 连续变量 (3)每月上网时间 定量变量 连续变量 (4)上网的主要目的 定性变量

(5)上周收到的电子邮件数量 定量变量 离散变量 (6)每月用于网上购物的金额 定量变量 连续变量 (7)上月网上购物的次数 定量变量 离散变量 (8)使用的电脑的品牌 定性变量 (9)上网是否玩游戏 定性变量

(10)电脑是否带有光盘刻录机 定性变量

4.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)考研辅导班参加者的姓名 定性变量 (2)家庭月消费 定量变量 连续变量 (3)温度 定量变量 连续变量 (4)上个月外出吃饭的次数 定量变量 离散变量 (5)产品等级 定性变量

5.举例说明什么是自变量和因变量,二者之间是什么关系? P10

变量分类(按变量间关系)——自变量与因变量

11

两个变量之间,如果一个变量的变化能引起其他变量变化则称之为自变量,而将由于其他变量的变化而导致自身发生变化的变量称为因变量。

自变量与因变量之间的关系既有时间上的先后关系,即现因后果,同时还有因果关系,即因变量的变化是以自变量的变化为前提。例如我们常说的“小树长高,

我也长高”,但是不能说“我长高”是因变量,“小树长高”是自变量,两者只是有时间上的先后关系,而没有必然联系。自变量与因变量之间还必须是例如,受教育程度增加,收入增加,这两者就是因果关系,受教育程度是自变量,收入是因变量。

6.举例说明什么是离散变量和连续变量。 P10

(1)离散变量

如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。例如,某人兄弟姐妹数、结婚次数、工厂生产产品的数量等,其变量值的取值是0,1,2,3?。离

散变量的取值是有限个值,而且其取值都是以整数位断开的,是有最小计量单位的。例如,某人的兄弟姐妹数,只能是1个、2个、3个等,而不能是1.3个、2.5个等。

(2)连续变量

如果一个变量的变量值是连续不断的,即可以取无数多个数值,这种变量称为连续变量。例如,年龄、温度、灯泡的寿命等,它们的取值是连续不断的。连续变量可以取无数

多个值,其取值是连续不断,不可以一一列举的,而且,它们没有最小计量单位。例如,年龄可以是1岁整,也可以是1.2岁、1.45岁、2.544岁等。

7.概率抽样方法主要包括哪几种?

答:概率抽样主要的方式有:简单随机抽样、系统抽样、分层抽样、整群抽

样、多阶段抽样等。

8.调查方法主要包括哪几种?简要说明各种方法的优缺点。 P16

(1)问卷法

问卷法是调查者根据一定的目的和要求,采用事先设计好的问卷,向被调查者了解情况,征询意见的一种方法。问卷法广泛应用于社会学、人口学、教育学、管理学、心理学等领域中。 (2)访谈法

访谈法是指由调查员直接对被调查员进行访问和交谈,并记录调查结果的方法。访谈法是以口头语言为中介、调查者与被调查者面对面的交谈和互动的过程。

(3)观察法

观察法是指研究者深入到所要研究对象的生活背景中,在实际参与研究对象的日常生活的过程中直接记录研究对象的有关资料的方法。

12