韦氏儿童智力量表能否测量第3因子

作者:杨志明张雷

心理科学 2003年06期

  1 引言

  韦氏儿童智力量表(Wechsler Intelligence Scale for Children,WISC,1949)[1]中国修订本(WISC-CR)[2]是在美国1974年修订本(WISC-CR)基础上于1986年出版的。通常,该量表被作为两因子量表来使用。即,它除了提供一个总智商外,还同时报告言语智商和操作智商。不过,有大量的研究表明,该量表含有三个因子:言语理解、知觉组织和不分心或抗干扰因子[3,4,5]有的甚至认为它还包含有第4和第5个因子等[3,6]。

  本研究所感兴趣的问题是:证实该量表含有3个或更多个因子是否意味着可以用它来测量这些因子?研究的方法是一种与传统方法很不相同的,能够同时估计测验总分和各因子分数测量信度的多元概化理论(Multivariate Generalizability Theory,MGT)[7-10]方法

  2 原理与方法

  2.1 MGT简述

  MGT是由克龙巴赫(Cronbach et al,1972)[8]等人最先提出来的当今最有影响的测验理论之一。它在处理那些含有多个潜在能力因子,而且这些潜在能力因子之间又具有相关关系的测量问题时,具有独到的作用。

  在国外,Shavelson、Chang和Jarjoura等人[11-13]对该理论作过一些理论和应用研究,但我国在这方面的研究却很少[14-15]。

  MGT解决问题的过程分为G研究和D研究两步[7-8]。G研究的主要任务是:确定研究设计、分解测验总分变异。内容包括确认测量目标和测量侧面及其关系、估计各种效应在各个亚能力因子上的方差与协方差分量矩阵等。D研究的主要目的是:根据研究计划,考察概化系数与测量目标或各测面等因素之间的变化关系,准确地评估各种决策下测量结果的信度,为改进测验设计、提高测验质量提供依据。其主要内容为:先分别估计被试在各个潜在能力因子上的全域分数(能力值θ[,i])及其相应的相对误差或绝对误差、概化系数或可靠性指数等,再用协方差贡献度等方法确定各因子全域分数的权系数,合成一个全域总分θ(Composite Universe Score),并估计其相应的相对误差、绝对误差、概化系数和可靠性系数等。最后根据估计结果作出决策。

  2.2 研究设计

  本研究为多元pxi随机测量模式。测量目标为被试者、测量侧面为分测验。在两因子模型中,分测验1(常识)、2(类同)、3(算术)、4(词汇)和5(理解)属言语能力因子、分测验6(填图)、7(排列)、8(积木)、9(拼图)和10(译码)属操作能力因子[2]。在三因子模型中,分测验1、2、4和5属言语理解因子,分测验6、7、8和9属知觉组织因子,分测验3和10属抗干扰因子[5]。本研究样本为长沙市麓山国际实验学校一年级6至7岁的小学生201人(1995年至1998年)。数据处理是以10个分量表原始得分为基础,用布瑞南研制的mGENOVA软件[16]进行的。

  3 结果与讨论

  3.1 G研究 表1和表2分别是2因子和3因子模型的G研究结果。

  表1 2因子模式下的方差与协方差分量估计

  

  注:主对角线元素为各效应在相应因子上的方差分量估计,线以下为因子间协方差分量估计,线以上为因子间相关系数的估计。

  由表1可知,被试在两个量表上的得分相关较大,协方差分量也较大,这说明将两类分测验进行合成估计测验总分是可行的。又因为各分测验本身的方差分量较大,而被试与分测验间的交互影响相对较小,所以可以初步认定WISC-CR仅宜作为常模参照性测验使用。表2也能得到表1类似的结论。

  表2 3因子模式下的方差与协方差分量估计

  

  注:主对角线元素为各效应在相应因子上的方差分量估计,线以下为因子间协方差分量的估计,线以上为因子间相关系数的估计。

  3.2 两因子模式的D研究 表3是WISC-CR两因子模式下的D研究结果。

  表3 两因子模式的D研究结果

  

  由表3可知,当WISC-CR被作为常模参照性测验来使用时,全域总分及其言语和操作能力因子的测量信度(概化系数)都比较高,但若将它作为标准参照性测验来用,则三者的测量信度(可靠性指数)均远远低于可接受的水平。

  通过比较测验总分与亚因子能力分的测量信度还可以发现,几个信度较低的分测验是可以合成一个信度较高的成套测验的。因此我们在研究和使用量表时,不能仅仅满足于总测验有较高的信度,而必须仔细考察其分测验的信度,否则,在解释测量结果时会高估测量误差,得到错误的结论。

  3.3 三因子模式的D研究 表4是WISC-CR三因子模式下的D研究结果。

  与两因子模式类似,表4显示WISC-CR被作为常模参照性测验时具有较高的信度,但作为标准参照性测验来用则信度太低、误差较大。

  与两因子模式不同的是:尽管整套测验的信度基本不变,但在用该量表评估被试抗干扰能力因子时,测量误差大得惊人(概化系数仅为0.1293)。这就是说,尽管有证据表明WISC-CR整体信度较高,而且能够测到人的抗干扰能力,但我们却不可以用它来评估抗干扰能力,因为该工具对这个能力因子的测量误差太大。

  换句话说,证实了该量表涉及到很多因子并不等于能用它来准确地测量这些因子。这使得过去关于该量表内部结构的许多精细研究、尤其是那些关于该量表能够测量到4个、5个甚至更多个因子的研究的实用价值大打折扣。

  表4 被试在3个因子及总分上全域分方差分量和概化系数等D研究结果

  

  3.4 提高测量第3因子信度的D研究

  为了提高第3因子(抗干扰能力)的测量信度,在D研究中考察了测量第3因子的分测验数量与测量信度之间的关系,其结果见表5所示。

  表5 抗干扰因子样本容量与概化系数关系的D研究(其它因子样本容量固定)

  

  由表5可知,随着第3因子样本容量的增加,测量第3因子的信度也在不断增大。但是,与第1和第2因子测量信度相比(见表4),同样容量(4个分测验)下第3因子的测量信度是很低的,只有0.2289。更为吃惊的是,即使将第3因子的样本容量扩大6倍(用12个分测验测第3因子),其测量信度仍然只有0.4711,远低于前两个因子的信度估计值。这可能是测量第3因子的相对误差方差分量过大之故(表4)。

  另外,表5还显示,当分测验个数小于3时,总分的信度会随着测量第3因子分测验个数的增加而减小。仅当样本容量大于3后,分测验个数增加才能提高测验总分的信度,但提高的幅度十分有限。这说明分测验3和10与总测验之间可能存在一定的不一致性。

  由上可知,要想提高第3因子的测量信度,仅仅靠增加测量第3因子分测验的个数的行不通的。一个可能的办法是改进测量第3因子的分测验3和10,使得被试者的分数的方差分量增大,被试者与分测验之间的交互效应减小。即,减少测量第3因子的相对误差的方差分量。

  4 结论

  4.1 WISC-CR的整体信度较高,但仅能用做常模参照性解释,不宜用作标准参照性解释。

  4.2 尽管WISC-CR能够测到人的抗干扰能力,但其测量信度低到了不可接受的程度。这说明一个信度很高的测验在评估其中某个亚能力因子子测量误差有可能达到不能接受的程度。同时也表明,对测量量表内部结构过分的精确研究不一定是有价值的。

  4.3 要想提高测量抗干扰能力因子的信度,增加与算术和译码同质的分测验个数并不是最佳方法。今后可以考虑的策略是:改进分测验3和10、提高其分数变异中被试者的方差分量、降低被试者与这两个分测验之间的交互效应。

  4.4 多元概化理论创立了更加切合现实的多元信度观和多元信度估计方法,使得人们可以根据测验的不同用途(包括结果解释的不同角度与推论范围的不同大小等),对同一个测验估计多个测量信度。这对测验量表的编制和使用者来说具有十分重要的意义。

  4.5 本研究的样本为6至7岁儿童,其它年龄儿童在韦氏量表上的表现是否与的结论相一致,尚有待进一步的研究。

作者介绍:杨志明 香港中文大学教育心理学系,香港 张雷 湖南师范大学心理学系,长沙,410006

作者:杨志明张雷

心理科学 2003年06期

  1 引言

  韦氏儿童智力量表(Wechsler Intelligence Scale for Children,WISC,1949)[1]中国修订本(WISC-CR)[2]是在美国1974年修订本(WISC-CR)基础上于1986年出版的。通常,该量表被作为两因子量表来使用。即,它除了提供一个总智商外,还同时报告言语智商和操作智商。不过,有大量的研究表明,该量表含有三个因子:言语理解、知觉组织和不分心或抗干扰因子[3,4,5]有的甚至认为它还包含有第4和第5个因子等[3,6]。

  本研究所感兴趣的问题是:证实该量表含有3个或更多个因子是否意味着可以用它来测量这些因子?研究的方法是一种与传统方法很不相同的,能够同时估计测验总分和各因子分数测量信度的多元概化理论(Multivariate Generalizability Theory,MGT)[7-10]方法

  2 原理与方法

  2.1 MGT简述

  MGT是由克龙巴赫(Cronbach et al,1972)[8]等人最先提出来的当今最有影响的测验理论之一。它在处理那些含有多个潜在能力因子,而且这些潜在能力因子之间又具有相关关系的测量问题时,具有独到的作用。

  在国外,Shavelson、Chang和Jarjoura等人[11-13]对该理论作过一些理论和应用研究,但我国在这方面的研究却很少[14-15]。

  MGT解决问题的过程分为G研究和D研究两步[7-8]。G研究的主要任务是:确定研究设计、分解测验总分变异。内容包括确认测量目标和测量侧面及其关系、估计各种效应在各个亚能力因子上的方差与协方差分量矩阵等。D研究的主要目的是:根据研究计划,考察概化系数与测量目标或各测面等因素之间的变化关系,准确地评估各种决策下测量结果的信度,为改进测验设计、提高测验质量提供依据。其主要内容为:先分别估计被试在各个潜在能力因子上的全域分数(能力值θ[,i])及其相应的相对误差或绝对误差、概化系数或可靠性指数等,再用协方差贡献度等方法确定各因子全域分数的权系数,合成一个全域总分θ(Composite Universe Score),并估计其相应的相对误差、绝对误差、概化系数和可靠性系数等。最后根据估计结果作出决策。

  2.2 研究设计

  本研究为多元pxi随机测量模式。测量目标为被试者、测量侧面为分测验。在两因子模型中,分测验1(常识)、2(类同)、3(算术)、4(词汇)和5(理解)属言语能力因子、分测验6(填图)、7(排列)、8(积木)、9(拼图)和10(译码)属操作能力因子[2]。在三因子模型中,分测验1、2、4和5属言语理解因子,分测验6、7、8和9属知觉组织因子,分测验3和10属抗干扰因子[5]。本研究样本为长沙市麓山国际实验学校一年级6至7岁的小学生201人(1995年至1998年)。数据处理是以10个分量表原始得分为基础,用布瑞南研制的mGENOVA软件[16]进行的。

  3 结果与讨论

  3.1 G研究 表1和表2分别是2因子和3因子模型的G研究结果。

  表1 2因子模式下的方差与协方差分量估计

  

  注:主对角线元素为各效应在相应因子上的方差分量估计,线以下为因子间协方差分量估计,线以上为因子间相关系数的估计。

  由表1可知,被试在两个量表上的得分相关较大,协方差分量也较大,这说明将两类分测验进行合成估计测验总分是可行的。又因为各分测验本身的方差分量较大,而被试与分测验间的交互影响相对较小,所以可以初步认定WISC-CR仅宜作为常模参照性测验使用。表2也能得到表1类似的结论。

  表2 3因子模式下的方差与协方差分量估计

  

  注:主对角线元素为各效应在相应因子上的方差分量估计,线以下为因子间协方差分量的估计,线以上为因子间相关系数的估计。

  3.2 两因子模式的D研究 表3是WISC-CR两因子模式下的D研究结果。

  表3 两因子模式的D研究结果

  

  由表3可知,当WISC-CR被作为常模参照性测验来使用时,全域总分及其言语和操作能力因子的测量信度(概化系数)都比较高,但若将它作为标准参照性测验来用,则三者的测量信度(可靠性指数)均远远低于可接受的水平。

  通过比较测验总分与亚因子能力分的测量信度还可以发现,几个信度较低的分测验是可以合成一个信度较高的成套测验的。因此我们在研究和使用量表时,不能仅仅满足于总测验有较高的信度,而必须仔细考察其分测验的信度,否则,在解释测量结果时会高估测量误差,得到错误的结论。

  3.3 三因子模式的D研究 表4是WISC-CR三因子模式下的D研究结果。

  与两因子模式类似,表4显示WISC-CR被作为常模参照性测验时具有较高的信度,但作为标准参照性测验来用则信度太低、误差较大。

  与两因子模式不同的是:尽管整套测验的信度基本不变,但在用该量表评估被试抗干扰能力因子时,测量误差大得惊人(概化系数仅为0.1293)。这就是说,尽管有证据表明WISC-CR整体信度较高,而且能够测到人的抗干扰能力,但我们却不可以用它来评估抗干扰能力,因为该工具对这个能力因子的测量误差太大。

  换句话说,证实了该量表涉及到很多因子并不等于能用它来准确地测量这些因子。这使得过去关于该量表内部结构的许多精细研究、尤其是那些关于该量表能够测量到4个、5个甚至更多个因子的研究的实用价值大打折扣。

  表4 被试在3个因子及总分上全域分方差分量和概化系数等D研究结果

  

  3.4 提高测量第3因子信度的D研究

  为了提高第3因子(抗干扰能力)的测量信度,在D研究中考察了测量第3因子的分测验数量与测量信度之间的关系,其结果见表5所示。

  表5 抗干扰因子样本容量与概化系数关系的D研究(其它因子样本容量固定)

  

  由表5可知,随着第3因子样本容量的增加,测量第3因子的信度也在不断增大。但是,与第1和第2因子测量信度相比(见表4),同样容量(4个分测验)下第3因子的测量信度是很低的,只有0.2289。更为吃惊的是,即使将第3因子的样本容量扩大6倍(用12个分测验测第3因子),其测量信度仍然只有0.4711,远低于前两个因子的信度估计值。这可能是测量第3因子的相对误差方差分量过大之故(表4)。

  另外,表5还显示,当分测验个数小于3时,总分的信度会随着测量第3因子分测验个数的增加而减小。仅当样本容量大于3后,分测验个数增加才能提高测验总分的信度,但提高的幅度十分有限。这说明分测验3和10与总测验之间可能存在一定的不一致性。

  由上可知,要想提高第3因子的测量信度,仅仅靠增加测量第3因子分测验的个数的行不通的。一个可能的办法是改进测量第3因子的分测验3和10,使得被试者的分数的方差分量增大,被试者与分测验之间的交互效应减小。即,减少测量第3因子的相对误差的方差分量。

  4 结论

  4.1 WISC-CR的整体信度较高,但仅能用做常模参照性解释,不宜用作标准参照性解释。

  4.2 尽管WISC-CR能够测到人的抗干扰能力,但其测量信度低到了不可接受的程度。这说明一个信度很高的测验在评估其中某个亚能力因子子测量误差有可能达到不能接受的程度。同时也表明,对测量量表内部结构过分的精确研究不一定是有价值的。

  4.3 要想提高测量抗干扰能力因子的信度,增加与算术和译码同质的分测验个数并不是最佳方法。今后可以考虑的策略是:改进分测验3和10、提高其分数变异中被试者的方差分量、降低被试者与这两个分测验之间的交互效应。

  4.4 多元概化理论创立了更加切合现实的多元信度观和多元信度估计方法,使得人们可以根据测验的不同用途(包括结果解释的不同角度与推论范围的不同大小等),对同一个测验估计多个测量信度。这对测验量表的编制和使用者来说具有十分重要的意义。

  4.5 本研究的样本为6至7岁儿童,其它年龄儿童在韦氏量表上的表现是否与的结论相一致,尚有待进一步的研究。

作者介绍:杨志明 香港中文大学教育心理学系,香港 张雷 湖南师范大学心理学系,长沙,410006


相关内容

  • 中国中小学生积极心理品质量表编制报告
  • <中国特殊教育>2009年第4期(总第106期) ChineseJournalofSpecialEducation(Monthly) () 中国中小学生积极心理品质量表编制报告 官 群 孟万金 1 233 3 JohnKeller 3 (1.北京师范大学教育学部,北京,100875;美国 ...

  • 心理测量与评估(所有重点)
  • 第一章 绪论 第一节 心理测量与评估的基本概念 1.测量--测量是按一定规则,给所考察的对象在某种性质的量度系统上指定值的活动:或说测量是按一定规则,用某种性质的量度系统上的数值来描述所考察对象特性的活动. 2.四种性质不同的量度系统:(四种水平的数据) (1)名义量表(称名数据)--表示类别名称的 ...

  • 自学考试--心理测量与评估
  • 第一章 绪论 一.测量活动结构:由主测者.被测对象.规则.测值 二.测量是按一定规则,给所考察对象在某种性质的量度系统上指定值的活动 三.量度系统:名义量表.顺序量表.等距量表.比例量表 四.心理测量及其特点 1. 心理测量就是按规则给所考察对象的心理特性,在一定性质的量度系统,即量表上指定 值的活 ...

  • 2011年社会实践优秀团队奖申报材料(修改1)
  • 武汉理工大学"践行卓越"暑期社会实践队 新生代农民工人力资源能力与幸福感关系调查研究 2011年社会实践优秀团队奖申报表 学院名称: 武汉理工大学管理学院 团队名称: "践行卓越"暑期社会实践队 是否申报省级优秀: 是 前 言 2010年6月11日至9月1日, ...

  • 儿童心理行为发育及评价
  • 儿童心理行为发育及评价 教学目的:1.了解儿童神经心理发育的特点及神经反射检查的方法: 2.了解儿童运动发育的里程碑及运用运动发育对儿童神经心理的评价: 3.熟悉儿童认知.情绪.社会性及个性发育: 4.熟悉CBCL对儿童行为的评价: 5.掌握DDST的操作及评价过程. 学时:3学时 第一节 儿童神经 ...

  • 共同方法偏差的统计检验与控制方法_周浩
  • 心理科学进展 2004,12(6):942~950 Advances in Psychological Science 共同方法偏差的统计检验与控制方法 ∗ 周 浩 龙立荣 (华中师范大学心理学系,武汉 430079) 摘 要 共同方法偏差是心理学研究中一个越来越被关注的课题,但国内心理学界对其的介 ...

  • 心理卫生评定量表概论
  • 心理卫生评定量表概论 第一节 心理卫生评估的任务.手段和作用 当代心理卫生工作始于本世纪初,至今已有近百年的历史,其基本宗旨为:"完全从事慈善的.科学的.文艺的.教育的活动,致力于维护世界各国人民的心理健康,增强对精神疾病与心理缺陷的研究.治疗和预防,增进全人类的幸福"(第一届国 ...

  • 高等专科教育大学生顾客感知价值维度的实证分析
  • 第15卷第2期 工会论坛 Vol. 15No. 22009年3月 Trade Unions 'Tribune Mar. 2009 高等专科教育大学生顾客感知价值维度的实证分析 李 霞 (山东省工会管理干部学院, 山东济南250100) [摘 要]本文以改编的SERVQUAL 量表为基础, 通过文献回 ...

  • 心理健康与兴趣的关系研究
  • 第6卷第4期 湖 北 职 业 技 术 学 院 学 报 No.4 Vol.6 2003年12月 Journal of Hubei Vocational-Technical College Dec.2003 [文章编号] 1671-8178(2003)04-0070-04 心理健康与兴趣的关系研究 刘卫 ...