调查问卷中多项选择题处理方法探讨

发布时间 : 星期六 文章调查问卷中多项选择题处理方法探讨更新完毕开始阅读

调查问卷中多项选择题处理方法探讨

Treatment Method Discussions Of Multiple-choice Questions In The Questionnaire

湖南商学院信息系 (410205) 李灿

[内容摘要] 在各类问卷调查中,多项选择题应用十分普遍,所以对多项选择题如何进行录入和分析就显得十分重要。本文将从实用的角度举例分析对多项选择题答案如何进行数据编码和变量设置,并说明如何使用SPSS统计软件的多重应答处理方法,并对其分析方法加以深入剖析。

Abstract: In all kinds of questionnaire investigations, it is very general that multiple-choice questions are used, so how to input and analyze that seems very important to multiple-choice questions. This text analyzes how to set up digital codings and variables for example in terms of practicality, explains how to use multiple response method with SPSS software, and analyzes its analytical method thoroughly .

[关键词] 多项选择题;多重应答处理过程;多重二分法;多重分类法 Keywords: Multiple-choice questions,Multiple Response,Multiple dichotomy method,Multiple category method

在各类问卷调查中,多项选择题(或复选题)应用十分普遍。多项选择题的备选项较多,可以多重选择,被调查者的回答结果种类千差万别,这就给调查数据的处理带来了一定难度。在SPSS统计软件中有多重应答处理过程(Multiple Response),即多项选择题处理过程,但有关专著对多项选择题数据文件的建立与分析方法论述得较少或不够实用。本文将从实用的角度举例分析多项选择题答案如何进行数据编码和变量设置,并说明如何使用SPSS统计软件的多重应答处理方法,并对其分析方法加以深入剖析。 一、 多项选择题的特点

所谓多项选择题,就是指对同一个问题可能有多个候选答案,受访者可以选择其中的若干个,也可以全选或不选,属于多元响应变量资料。本文以在某次婚恋观念调查的两个问卷项目为例来进行介绍: 项目1、您的性别:1-男 2-女

项目2、您想选择哪些择偶标准(任选三项)

1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品 6-家庭收入 7-其他

项目2是一个典型的多项选择题,受访者可以选择其中的一项或多项答案。很显然,几个选项反映的是同一个问题的不同侧面。 二、 多项选择题的数据编码和变量设置

对于多项选择题,根据选择项目的多少和分析目的,一般可以采取以下5种数据编码和变量设置的方法:

1、问题只设置1个字符变量。如对项目2只设置1个字符变量a,宽度为7。如某人择偶条件选择了相貌、气质风度和人品,可在变量a中输入字符1010100。如果选择项较多,这种方法不但增加了输入的工作量,而且分析也不方便。

1

2、将几种答案常出现的组合列出来,如项目2只有选择文化水平、志同道合和人品,相貌、文化水平和家庭收入……等。只设置1个数值变量,用1、2、3等分别表示各种组合。这种方法虽然可减少数据输入时的工作量,但在输入前要重新对多选答案编码,也不便于用SPSS统计软件灵活作各种统计分析。

3、将该问题只设置1个字符变量,但字符变量的宽度和字符变量值的输入方法与上述第1种方法不同。对上述项目2择偶条件选择,可设置一个字符变量。如某人择偶条件同时选择文化水平、志同道合和人品,则可输入字符变量值:245。字符变量值的宽度不一定和多选项的数目一致。如上述择偶条件选择,当调查对象中最多只会同时选择五项,则字符变量值的宽度设置为5。用这种方法建数据文件,可减少输入数据的工作量和差错。如多选题的选择项超过10,可用英文字母表示10以后的选择项。在数据输入完毕后,为了符合不同研究目的和统计方法的要求,可用SPSS for Windows统计软件中的数据转换(Compute)过程和子串选择函数(SUBSTR),将字符串变量中的每个变量值拆开,即每个答案设置一个变量,变量值为0和1。这种数据转换在SPSS统计软件中容易实现。但是此种方法可以用第4方法直接代替,所以本文不作详细介绍。

4、多重二分法(multiple dichotomy method),对于多项选择题的每一个选项看作一个变量来定义。0代表没有被选中,1代表被选中。这样,多项选择题中有几个选项,就会变成几个单选变量,这些单选变量的选项都有两个,就是选中和未选,即0或1。如项目2有7个多选项,可将7个选项分别设置1个变量,即该问题分解为7个变量,每个变量设置变量值0和1。0表示“无”,1表示“有”。如上述某人择偶条件,可设置数值变量:a1、a2、a3……a7(见表1)。若某人择偶条件同时选择文化水平、志同道合和人品,可在变量a2、a4和a5中分别输入1,a1、 a3、a 6和a7中输入0;也可在变量a1、 a3、a 6和a7中不输入任何数值,当缺失值处理。数据全部输入完毕后,通过变量转换,将缺失值转换为0。如果选择项较多,而被调查者最多只选择其中少数几项时(如项目2),这种方法就有点烦琐,输入数据时容易出错。

表1 多项二分法编码表

变量名 a1 a2 a3 a4 a5 a6 a7 变量标签 相貌 文化水平 气质风度 志同道合 人品 家庭收入 其他 编码方案 0-不选 1-选 0-不选 1-选 0-不选 1-选 0-不选 1-选 0-不选 1-选 0-不选 1-选 0-不选 1-选 5、多重分类法(multiple category method),多项选择题中有几个选项,就定义几个单选变量。每个变量的选项都一样,都和多项选择题的选项相同。每个变量代表被调查者的一次选择,即记录的是被选中的选项的代码。由于被调查者可能不会全部都选,在数据录入时,一般从这些变量的靠左边的变量开始录入,右边的变量自然就是缺失值。当被调查者对多项选择题中的选项全部选择时,这些变量中都有一个选项代码,此时没有缺失值。如项目2您想选择哪些择偶条件(任选三项),有3个多选项,可将3个选项分别设置3个变量,即该问题分解为3个变量b1、b2、b3,每个变量设置变量值1、2、3、4、5、6和7(见表2)。若某

2

人择偶条件同时选择文化水平、志同道合和人品,可在变量b1输入2、b2中分别输入4, b3中输入5。

表2 多重分类法编码表

变量名 b1 b2 b3 变量标签 第一选项 第二选项 第三选项 编码方案 1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品 6-家庭收入 7-其他 1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品 6-家庭收入 7-其他 1-相貌 2-文化水平 3-气质风度 4-志同道合 5-人品 6-家庭收入 7-其他 以上介绍的几种方法,第4和第5种方法是SPSS统计软件中对多项选择题的标准记录方式。

三、多项选择题的数据处理分析过程

在SPSS统计软件的多重应答处理过程Multiple Response子菜单包括三个过程,分别是Define Sets,Frequencies和Crosstabs过程。如图1所示。

图1 Multiple Response子菜单

1、Define Sets过程,用于多项选择题的定义,它的主对话框如图2所示。

图2 Define Sets主对话框

其中Set Definition框中列出文件所有的数值型变量,其中的根据多项选择题选项定义的变量,用于多项选择题变量集。

其中Variables in Set框是选入需要加入同一个多项选择题变量集的变量系列,这些变量必须为多分类,并按照相同的方式来编码。项目2把Set Definition框中的a1、a2、a3……a7放入Variables in Set框。

其中Variables Are Coded As单选框组是选择变量集中的变量的编码方式。有两种方式可以选择,分别是dichotomies(多重二分法编码方式)和categories(多重分类法编码方式)。要根据预定义时使用的方法,选择相应的编码方式。若选择dichotomies方式,某个数值表示选中时,相应的数值在右侧框中输入。若选择

3

categories方式,则需要设定取值范围,在该范围内的记录值纳入分析。一般的取值范围是该多项选择题选项的最大和最小代码。项目2应用的是dichotomies(多重二分法编码方式),所以在它右侧框中输入1。

其中Name框是输入多项选择题变量集的名称,项目2用的是ZOBZ。 其中Lable框是多项选择题变量集定以一个名称标签,项目2用的是择偶标准。 其中Mult Response Sets框是已定义好的多项选择题变量集列表,可定义多个,它左侧的三个按钮Add、Change和Remove,分别用于添加、修改和移出变量集的定义。本例项目2单击Add钮,Mult Response Sets框就出现变量集$ZOBZ。 最后单击Close按钮,相应的多项选择题变量集就定义完成了。在SPSS统计软件中的多重应答处理过程(Multiple Response),最多可以定义20个多项选择题变量集。

2、Freqencies过程,Multiple Response菜单里的Freqencies过程比较简单,为多 项选择题生成频数表,它的主对话框如图3所示。把多项选择题变量集择偶标 图3 Freqencies过程主对话框

准($ZOBZ)从左边的Mult Response Sets框移入右边的Table for框,其他默认,单击OK钮,多项选择题的频数表就生成了。如表3所示。在本次调查中,对170名受访者的调查结果为:在择偶标准中,居于前三位的分别为:a5(人品)被选率最高29.4%,其次是a3(气质风度)为20.2%,再次是a4(志同道合)为18.0%。

表3 多项选择题的频数表$zobz Frequencies

a1-相貌 择 偶 标 准 a2-文化水平 a3-气质风度 a4-志同道合 a5-人品 a6-家庭收入 a7-其他 Total N 49 67 103 92 150 40 10 511 Responses Percent 9.6% 13.1% 20.2% 18.0% 29.4% 7.8% 2.0% 100.0% Percent of Cases 28.8% 39.4% 60.6% 54.1% 88.2% 23.5% 5.9% 300.6% a Dichotomy group tabulated at value 1. 0 missing cases 170 valid cases

3、 Crosstabs过程,是多重反应列联表分析(Multiple ResponseCrosstabs),可以 产生多重交叉列联表,而且可以对单元格进行很细致的分析,它的主对话框如图4所示。

其中Mult Response Sets框,显示已经定义好得多项选择题变量集。下方的Define Ranges钮,用于为相应的变量设置取值范围。本例把变量集$ZOBZ放入Colums框,把变量sex放入Rows框,并对性别要定义变量值的范围,单击Define

4

联系合同范文客服:xxxxx#qq.com(#替换为@)