理论与方法
关于多选题和排序题的SPSS 处理
笪
王宣承
张
利
张敏强
问卷调查法是市场研究中常用的一种研究手段。研究者将所要研究的问题编制成问题表格,以邮寄、当面作答或者追踪访问方式填答,从而了解被试者对某一现象或问题的看法和意见。该方法有很多优点,它成本低,可大规模施测,而且可以突破空间的限制进行远距离的调查,大大节省了时间、人力和物力。问卷调查的结果经过量化,可进一步进行统计处理和数据挖掘。
问卷调查法对于调查问卷的设计要求较高,设计者不仅要在内容上了解相关专业的知识背景和被访者的心理行为规律,而且在形式上要合理的搭配各种题型,做出美观的布局设计。这样做一方面可以提高被访者的答题兴趣,缓解厌烦情绪;另一方面也可以从多个不同角度挖掘所研究问题的答案。
在问卷设计中,常见的题型包括单选题、多选题、排序题和问答题。其中单选题是最常见的题型,实践中可通过频数统计,箱型图及各种高级统计方法对其进行分析,流行的统计软件SPSS 中也包含多个用于处理单选题的模块。问答题作为主观题,通常不进行编码和统计分析,只作为定性研究来处理。多选题和排序题是两种常见的题型,多选题的优势是它可以广泛的搜集被访者的态度信息,探索不同人群的态度组合,为进一步编制或修订量表提供依据。排序题可以同时测查被访者对多个选项的态度倾向。
同的编码和处理方式。
1. 不定项多选题
这是最常见的多选题方式,即一道题目有多个选项,每个选项都可以勾选或者不选。
例1:你在选购电子产品时,会考虑以下哪些因素:
A 价格D 保修
B 性能E 外观
C 质量F 品牌
编码:对于这种题型,通常的采用“0-1”编码进行处理,即为每个选项单独设立一个变量,本例可设定a1_1,
a1_2到a1_6共6个变量,它们代表从A 、B 到F 共6个备
选选项。如果被试的选择为ABD ,则在a1_1,a1_2和a1_4中输入1,其他变量输入0。其他学者也提出了用某些函数或编程方法快速实现数据的录入,但最终都要转换为“0-
1”编码的形式。
分析:完成编码后,使用SPSS 中的Analyse ———Mul -
tiple Response 命令,再通过Define Sets 来将多个选项合
并定义为一个多选题,如例1中可将6个变量共同定义为——Multiple Response ———Fre -$a1。然后选择Analyse —
——quencies 可对多选题进行频数统计,选择Analyse ———Crosstables 可进行交叉列联表分Multiple Response —析。
2. 定项多择题
与不定多选择题相比,唯一区别是固定了要选出的答案个数。
例2:你认为在选购电子产品时,最重要的3个影响因素是什么?
SPSS 中虽然有处理多选题的模块“Multiple Response ”,但
是其功能相对简单,只能对多选题进行一般的频数统计和列联表分析。有些学者(余益兵,2005;陶维东等,2008)对多选题的数据编码提出了改进方法,提高了数据录入转换的效率,但是对多选题如何进行分析处理研究得不够深入。以下内容将讨论多选题和排序题的分类,以及如何在
1(A )A 价格D 保修
2(B )3(D )B 性能E 外观
C 质量F 品牌
SPSS 中实现它们的编码和分析过程。
编码:将题目中的3个括号定义为3个变量,如
一、多选题的处理方法
多选题可分为不定项多选题和定项多选题,它们有不
a2n1,a2n2和a2n3,他们代表最终选出的3个答案。6个
备选项也要重新编码,如1、2、3、4、5、6分别代表A 、B 、C 、
D 、E 、F 。如果被试的选择为ABD ,则在a2n1, a2n2和a2n3
2009
■
市场研究
趮趦
理论与方法
分别输入1、2和4。图1显示的是7个被试答题后的编码情况。
图1
定项多选题案例数据
记次数;例2的处理方法,其思路是先定次序,后填选项。前者是多选题通用的处理方式,包括不定项多选题、定项多选题,甚至一些不常用的限定条件的多选题(如规定答案不能超过3项)等;后者是针对定项选择题的一种特殊的分析方法,具有简便高效的特点,但是通常不适用于其他题型。
二、排序题的处理方法
1. 排序题要求将若干选项按照一定的标准依次排列,
可测查被试群体的态度倾向
例3:下列是选购电子产品时需要考虑的若干因素,请按照重要性对他们进行排序。
分析:完成编码后,使用SPSS 中的Analyse ———Mul -
A 价格D 保修
(③)
(⑤)
B 性能E 外观
(①)
(②)
C 质量F 品牌
(④)
(⑥)
tiple Response 命令,再通过Define Sets 将a2n1,a2n2和a2n3共同定义为$a2,在编码方式(Variable are coded as )
中选择分类编码(Categories ),类别从1到5。然后选择——Multiple Response ———Frequencies 可对多选Analyse —
题进行频数统计。结果如图2所示:
图2
定项多选题案例处理结果
编码:将题目中的6个选项定义为6个变量,如
a3_1,a3_2到a3_6,它们代表从A 、B 到F 共6个备选选
项。如果某个被试在题中括号内填写的结果为“3,5,1,2,
4,6”,即他认为从重要到不重要的次序是:质量、外观、价
格、性能、保修、品牌。那么在编码处理时,应将3、5、1、2、
4、6依次填入a3_1,a3_2到a3_6的6个变量中。
首先根据各个次序的重要性(权重)对数据进行二次编码,例如次序1、2、3、4、5、6的重要性依次是10、7、5、2、——Recode into Same 1,0,则选择SPSS 中的Transform —
Variables 命令,将所有变量选入Variables 对话框,点击Ole and New values ,将1填入旧数值,将10填入新数值,
表示排名第一的选项具有10个单位的重要性,准备对“1-10”这一组编码的转换。然后单击Add 健继续对余下的“2-7”、“3-5”、“4-2”、“5-1”、“6-0”五组编码进行输入,
小结:例1所用的处理方法,其思路是先定选项,后
图3
单击Continue ———Ok 可一并完成各组的转换过程。
分析:
排序题案例数据
■■
理论与方法
经过二次编码后,选择Date ———Transpose 命令,对全部数据进行行列转换。再选择Transform ———Compute
图4
Variables 命令,定义新变量Sum=sum(Var001to Var007) ,
即可求出各个备选选项的重要性排序。结果如图4所示:
排序题计算结果
结果显示:各选项的重要性排序为:BACDEF 。A 价格D 保修
(③)
()
B 性能E 外观
(①)
(②)
C 质量F 品牌
()
()
2. 选择排序题
这种题型结合了多选题和排序题的优点,先从若干备选选项中提取出若干个最重要的选项,然后再进行排序。与多选题相比,在答案中增加了顺序信息,因此内容更丰富。
例4:你认为在选购电子产品时,最重要的3个影响因素是什么?请选出并按重要性对它们进行排序:
分析:方法与例3相同,只是未被选中的选项将不参与二次编码,因为在排序重要性计算中,它们的权重为0。
排序题和选择排序题分析思路基本相同:先定选项,后定次序,最后通过编码将次序转化为权重。
以上列举的各种多选题、排序题分析方法,是个人在实践学习中总结出来的比较高效、简练的处理方式,文中所用的案例也是较为简单的。在实际问卷分析过程中,情况可能是复杂的,统计方法也是灵活多变的,一个题目很可能有多种方法来分析处理。笔者仅希望通过本文起到抛砖引玉的作用,引起更多人研究探讨数据处理的方法,促使更多研究者用好用对统计方法和计算软件。笙
A 价格D 保修
B 性能E 外观
C 质量F 品牌
第1位(C )第2位(D )第3位(A )
编码:与例3的方式很相似,但由于未被选择的题项无法参加排序,因此对它们要进行一些处理。将题目中的
6个选项定义为6个变量,如a4_1,a4_2到a4_6,它们代
表从A 、B 到F 共6个备选选项。如果某个被试的排序的结果为C 、D 、A ,即依次选出的最重要3个因素是:质量、保修、价格。那么在编码处理时,应将3、0、1、2、0、0依次填入a3_1,a3_2到a3_6的6个变量中。也就是说:对于被选中并排序的选项,在它对应的变量里面填它的次序;对于未被选中的选项,在它对应的变量里面填0。
实际上,本例中答案选择的结果可表示为另一种更直观的形式,它类似于例3的样子。
例4:你认为在选购电子产品时,最重要的3个影响因素是什么?请选出并按重要性对它们进行排序:
参考文献:
[1]郑文标. 关于顺序问题的设计、分析及SPSS 处理. http://www.lookinto.cn/method/558/,2007-4-19[2]余益兵. 复选题的SPSS 数据编码技巧分析[J].统计
教育,2005,(7):7-8
[3]陶维东,陶晓丽,谢超香,孙晓青. 在SPSS 中实现多
选题录入、转换的新方法[J].问题探讨,2008(1):19-21
[4]项泾渭.SPSS 中多项选择题的处理[J].市场研究, 2007,(4):37-39
(作者单位:华南师范大学教育科学学院)
2009
■
市场研究
趰趦
理论与方法
关于多选题和排序题的SPSS 处理
笪
王宣承
张
利
张敏强
问卷调查法是市场研究中常用的一种研究手段。研究者将所要研究的问题编制成问题表格,以邮寄、当面作答或者追踪访问方式填答,从而了解被试者对某一现象或问题的看法和意见。该方法有很多优点,它成本低,可大规模施测,而且可以突破空间的限制进行远距离的调查,大大节省了时间、人力和物力。问卷调查的结果经过量化,可进一步进行统计处理和数据挖掘。
问卷调查法对于调查问卷的设计要求较高,设计者不仅要在内容上了解相关专业的知识背景和被访者的心理行为规律,而且在形式上要合理的搭配各种题型,做出美观的布局设计。这样做一方面可以提高被访者的答题兴趣,缓解厌烦情绪;另一方面也可以从多个不同角度挖掘所研究问题的答案。
在问卷设计中,常见的题型包括单选题、多选题、排序题和问答题。其中单选题是最常见的题型,实践中可通过频数统计,箱型图及各种高级统计方法对其进行分析,流行的统计软件SPSS 中也包含多个用于处理单选题的模块。问答题作为主观题,通常不进行编码和统计分析,只作为定性研究来处理。多选题和排序题是两种常见的题型,多选题的优势是它可以广泛的搜集被访者的态度信息,探索不同人群的态度组合,为进一步编制或修订量表提供依据。排序题可以同时测查被访者对多个选项的态度倾向。
同的编码和处理方式。
1. 不定项多选题
这是最常见的多选题方式,即一道题目有多个选项,每个选项都可以勾选或者不选。
例1:你在选购电子产品时,会考虑以下哪些因素:
A 价格D 保修
B 性能E 外观
C 质量F 品牌
编码:对于这种题型,通常的采用“0-1”编码进行处理,即为每个选项单独设立一个变量,本例可设定a1_1,
a1_2到a1_6共6个变量,它们代表从A 、B 到F 共6个备
选选项。如果被试的选择为ABD ,则在a1_1,a1_2和a1_4中输入1,其他变量输入0。其他学者也提出了用某些函数或编程方法快速实现数据的录入,但最终都要转换为“0-
1”编码的形式。
分析:完成编码后,使用SPSS 中的Analyse ———Mul -
tiple Response 命令,再通过Define Sets 来将多个选项合
并定义为一个多选题,如例1中可将6个变量共同定义为——Multiple Response ———Fre -$a1。然后选择Analyse —
——quencies 可对多选题进行频数统计,选择Analyse ———Crosstables 可进行交叉列联表分Multiple Response —析。
2. 定项多择题
与不定多选择题相比,唯一区别是固定了要选出的答案个数。
例2:你认为在选购电子产品时,最重要的3个影响因素是什么?
SPSS 中虽然有处理多选题的模块“Multiple Response ”,但
是其功能相对简单,只能对多选题进行一般的频数统计和列联表分析。有些学者(余益兵,2005;陶维东等,2008)对多选题的数据编码提出了改进方法,提高了数据录入转换的效率,但是对多选题如何进行分析处理研究得不够深入。以下内容将讨论多选题和排序题的分类,以及如何在
1(A )A 价格D 保修
2(B )3(D )B 性能E 外观
C 质量F 品牌
SPSS 中实现它们的编码和分析过程。
编码:将题目中的3个括号定义为3个变量,如
一、多选题的处理方法
多选题可分为不定项多选题和定项多选题,它们有不
a2n1,a2n2和a2n3,他们代表最终选出的3个答案。6个
备选项也要重新编码,如1、2、3、4、5、6分别代表A 、B 、C 、
D 、E 、F 。如果被试的选择为ABD ,则在a2n1, a2n2和a2n3
2009
■
市场研究
趮趦
理论与方法
分别输入1、2和4。图1显示的是7个被试答题后的编码情况。
图1
定项多选题案例数据
记次数;例2的处理方法,其思路是先定次序,后填选项。前者是多选题通用的处理方式,包括不定项多选题、定项多选题,甚至一些不常用的限定条件的多选题(如规定答案不能超过3项)等;后者是针对定项选择题的一种特殊的分析方法,具有简便高效的特点,但是通常不适用于其他题型。
二、排序题的处理方法
1. 排序题要求将若干选项按照一定的标准依次排列,
可测查被试群体的态度倾向
例3:下列是选购电子产品时需要考虑的若干因素,请按照重要性对他们进行排序。
分析:完成编码后,使用SPSS 中的Analyse ———Mul -
A 价格D 保修
(③)
(⑤)
B 性能E 外观
(①)
(②)
C 质量F 品牌
(④)
(⑥)
tiple Response 命令,再通过Define Sets 将a2n1,a2n2和a2n3共同定义为$a2,在编码方式(Variable are coded as )
中选择分类编码(Categories ),类别从1到5。然后选择——Multiple Response ———Frequencies 可对多选Analyse —
题进行频数统计。结果如图2所示:
图2
定项多选题案例处理结果
编码:将题目中的6个选项定义为6个变量,如
a3_1,a3_2到a3_6,它们代表从A 、B 到F 共6个备选选
项。如果某个被试在题中括号内填写的结果为“3,5,1,2,
4,6”,即他认为从重要到不重要的次序是:质量、外观、价
格、性能、保修、品牌。那么在编码处理时,应将3、5、1、2、
4、6依次填入a3_1,a3_2到a3_6的6个变量中。
首先根据各个次序的重要性(权重)对数据进行二次编码,例如次序1、2、3、4、5、6的重要性依次是10、7、5、2、——Recode into Same 1,0,则选择SPSS 中的Transform —
Variables 命令,将所有变量选入Variables 对话框,点击Ole and New values ,将1填入旧数值,将10填入新数值,
表示排名第一的选项具有10个单位的重要性,准备对“1-10”这一组编码的转换。然后单击Add 健继续对余下的“2-7”、“3-5”、“4-2”、“5-1”、“6-0”五组编码进行输入,
小结:例1所用的处理方法,其思路是先定选项,后
图3
单击Continue ———Ok 可一并完成各组的转换过程。
分析:
排序题案例数据
■■
理论与方法
经过二次编码后,选择Date ———Transpose 命令,对全部数据进行行列转换。再选择Transform ———Compute
图4
Variables 命令,定义新变量Sum=sum(Var001to Var007) ,
即可求出各个备选选项的重要性排序。结果如图4所示:
排序题计算结果
结果显示:各选项的重要性排序为:BACDEF 。A 价格D 保修
(③)
()
B 性能E 外观
(①)
(②)
C 质量F 品牌
()
()
2. 选择排序题
这种题型结合了多选题和排序题的优点,先从若干备选选项中提取出若干个最重要的选项,然后再进行排序。与多选题相比,在答案中增加了顺序信息,因此内容更丰富。
例4:你认为在选购电子产品时,最重要的3个影响因素是什么?请选出并按重要性对它们进行排序:
分析:方法与例3相同,只是未被选中的选项将不参与二次编码,因为在排序重要性计算中,它们的权重为0。
排序题和选择排序题分析思路基本相同:先定选项,后定次序,最后通过编码将次序转化为权重。
以上列举的各种多选题、排序题分析方法,是个人在实践学习中总结出来的比较高效、简练的处理方式,文中所用的案例也是较为简单的。在实际问卷分析过程中,情况可能是复杂的,统计方法也是灵活多变的,一个题目很可能有多种方法来分析处理。笔者仅希望通过本文起到抛砖引玉的作用,引起更多人研究探讨数据处理的方法,促使更多研究者用好用对统计方法和计算软件。笙
A 价格D 保修
B 性能E 外观
C 质量F 品牌
第1位(C )第2位(D )第3位(A )
编码:与例3的方式很相似,但由于未被选择的题项无法参加排序,因此对它们要进行一些处理。将题目中的
6个选项定义为6个变量,如a4_1,a4_2到a4_6,它们代
表从A 、B 到F 共6个备选选项。如果某个被试的排序的结果为C 、D 、A ,即依次选出的最重要3个因素是:质量、保修、价格。那么在编码处理时,应将3、0、1、2、0、0依次填入a3_1,a3_2到a3_6的6个变量中。也就是说:对于被选中并排序的选项,在它对应的变量里面填它的次序;对于未被选中的选项,在它对应的变量里面填0。
实际上,本例中答案选择的结果可表示为另一种更直观的形式,它类似于例3的样子。
例4:你认为在选购电子产品时,最重要的3个影响因素是什么?请选出并按重要性对它们进行排序:
参考文献:
[1]郑文标. 关于顺序问题的设计、分析及SPSS 处理. http://www.lookinto.cn/method/558/,2007-4-19[2]余益兵. 复选题的SPSS 数据编码技巧分析[J].统计
教育,2005,(7):7-8
[3]陶维东,陶晓丽,谢超香,孙晓青. 在SPSS 中实现多
选题录入、转换的新方法[J].问题探讨,2008(1):19-21
[4]项泾渭.SPSS 中多项选择题的处理[J].市场研究, 2007,(4):37-39
(作者单位:华南师范大学教育科学学院)
2009
■
市场研究
趰趦