搜档网
当前位置:搜档网 › 概化理论研究综述

概化理论研究综述

概化理论研究综述

作者:敖勇前, AO Yong-qian

作者单位:华东师范大学,心理系,上海,200062

刊名:

皖西学院学报

英文刊名:JOURNAL OF WEST ANHUI UNIVERSITY

年,卷(期):2008,24(2)

被引用次数:0次

参考文献(11条)

1.金瑜心理测量 2001

2.杨志明.张雷测评的概化理论及其应用 2003

3.陈社育.余嘉元经典真分数理论与概化理论信度观评析[期刊论文]-心理学动态 2001(03)

4.杨志明标准参照测验及其等级线信度的概化理论分析[期刊论文]-心理学探新 2003(03)

5.杨志明.张雷韦氏儿童智力量表能否测量第3个因子[期刊论文]-心理科学 2003(02)

6.杨志明.张雷改进普通话测试的概化理论分析[期刊论文]-湖南师范大学教育科学学报 2003(01)

7.张雷.侯杰泰.何伟杰普通话测试的录音评分可行性,信度及经济效率[期刊论文]-心理学报 2001(02)

8.彭平根.艾平评价中心测评的评分误差分析研究[期刊论文]-心理科学 2004(04)

9.杨秀君.苏永华概化理论在国家公务员面试评分中的应用研究[期刊论文]-人类工效学 2001(01)

10.罗发友.刘伶俐.刘友金概化理论在高校教师教学水平测评中的应用研究[期刊论文]-内蒙古农业大学学报(社会科学版) 2002(04)

11.秦磊.袁登华概化理论在绩效评估中的应用[期刊论文]-心理科学 2005(03)

相似文献(9条)

1.期刊论文何宁.苗丹民.霍涌泉.HE Ning.MIAO Dan-min.HUO Yong-quan透析GT信度观及其存在的问题-应用心理学2007,13(1)

概化理论(GT)与经典测验理论(CTT)是随机测量模型下信度评量的重要理论来源.本文将重复测量作为理解概化理论产生与建构的切入点,剖析了GT在测验假设、全域分思想与误差观三方面的特点,提出了目前GT在理论与应用方面存在的若干问题与不足.

2.期刊论文葛都一种超越经典测验理论的新型量化研究模式--《测评的概化理论及其应用》评介-教育发展研究2004,24(7)

随着20世纪70年代兴起的新一代统计分析理论及方法的发展与推广,长期以来在心理与教育测量领域中应用最广泛的"经典测验理论"(Classical Testing Theory,CTT)和以其为基础的标准化技术已无法满足现代测量的多样化需要.于是,在很大程度上弥补了传统经典测量理论不足的"概化理论"(Generalizability Theory,GT)逐渐受到众多研究者的关注和青睐,成为当前国际上非常盛行的新型测量理论.

3.期刊论文吴静CTT、IRT和GT三种测验理论之比较-黑龙江教育学院学报2008,27(12)

当前经典测量理论(CTT)、项目反应理论(IRT)与概化理论(GT)这三种心理测量派别理论并存,并各有优点与不足.随着测量理论的进一步发展,未来我国的测验理论发展的新趋向将是以IRT为主体,其他理论并存的一种局面.

4.期刊论文范晓玲.龚耀先.FAN Xiao-ling.GONG Yao-xian4-6年级多重成就测验的编制Ⅱ:信度考验-中国临床心理学杂志2006,14(6)

目的:以CTT和GT作4-6年级MATs的信度检验.方法:重测信度161例,复本信度180例,重测复本信度200例.项目有效样本2002例,其中A本1004例,B本

998例.结果:A、B本分量表和总量表重测信度0.91~0.95,复本信度0.87~0.94,重测复本信度0.82~0.89,分半信度0.79~0.90,系数0.90~0.96,评分者信度0.94~0.98,真分数变异0.82和0.86;概化研究表明分测验条目15个左右为宜,分量表与总量表条目量50与100即可.结论:各种信度考验结果基本符合测量学的计量标准.

5.期刊论文刘远我关于概化理论应用中几个问题的探讨 --与李伟明等的商榷-心理学报2001,33(5)

概化理论是经典测验理论与方差分析相结合而产生出来的当今最有影响的三大测验理论之一.它通过改进经典测验理论的数学模型、引进方差分析技术等方法,把分数变异细分为多种来源,为测验决策提供了系统的理论和方法.

6.期刊论文杨志明标准参照测验及其等级线信度的概化理论分析-心理学探新2003,23(3)

在测量工作中,误用经典测验理论方法估计标准参照性测验的整体信度和等级线决策信度的情况非常突出.如,无论测量设计是交叉的还是嵌套的,也无论测验结果是做常模参照性解释,还是做标准参照性解释,测验工作者往往只报告克龙巴赫α系数或经典测验理论中的其它少数几个信度指标,而误把整体信度作为等级线信度的现象则更加普遍,这是十分不妥的.本文借用概化理论中的可靠性指数φ和φ(λ)公式,分别针对交叉设计和嵌套设计,就标准参照性测验的整体信度和等级分数线决策信度的估计问题进行了探讨.用数据演示的方法比较了交叉设计与嵌套设计在估计标准参照性测验整体信度方面的差异,展示了等级决策分数线决策信度的估计方法.

项目反应理论(Item Response Theory,IRT)是继经典测验理论(Classical Test Theory, CTT)和概化理论(Generalizability Theory, GT)之后的又一新测验理论.IRT的产生可追朔到20世纪40年代,最早由丹麦学者Rasch提出,后经Lord等人的发展始具理论轮廓.由于此方面的研究需要复杂的计算过程,因此在计算机出现后才有更多学者在20世纪70年代末期投入到这方面的领域,到了80至90年代迅速蓬勃发展,使之成为当前心理学领域内极为引人瞩目的一类测量理论.国内精神病学家对这一理论知道的并不多,这固然有这一理论自身的原因,也有精神病学家对这一理论重视不够的原因.本文就IRT运用于抑郁量表临床测验的一些方面作一综述.

8.会议论文杨志明.张雷试论普通话水平测试的信度估计方法2003

文章针对普通话水平测试的特点,以非常实用的方式分别展示了经典测验理论和概化理论的常见信度估计方法,发现可靠性指数法是普通话信度估计的最佳方法,并成功地解决了普通话三级六等切割分数线的信度估计问题。

9.学位论文景建民研究生学位课程考试有效性分析2010

考试是教学活动中的一个重要环节,考试的主要目的是考察学生掌握知识的水平和程

度,评价教学效果,督促学生完善课程学习上的不足,为改进教学方式和手段,提高教育

教学质量提供参考依据。而要客观准确地实现考试的各项功能和作用,绝不仅仅依赖于卷

面分数,更重要的是运用教育测量原理和统计学方法对试卷进行科学的分析,评价试卷本

身及试题的质量。同时,试卷分析结果还可反馈于教学活动的各个方面,有效地促进教学

工作各环节质量的提高,有助于提高试题库的质量和水平,从而提高考试的规范化和科学

化。

当前,评价考试的指导理论主要有三种:一是以真分数理论为代表的经典测验理论

(Classical Test Theory,CCT),二是概化理论(Generailizability Theory,GT),三是项目反

应理论(Item Response Theory,IRT)。经典测验理论以分数的真值理论为基础,发展了信度、

效度、难度以及区分度等概念系统,用以衡量一个测量工具或考试题目的质量。与经典测

验理论相比,概化理论和项目反应理论的优点是模型精准,与样本及测验项目无关,能为

测验的编制、测验分数的报告和解释提供更多便利。其缺点是理论建立在复杂的数学模型

之上,计算方法复杂,工作量大,常借助于计算机技术,妨碍其大范围的推广。

本文首先介绍了教育测验理论的发展历程,随后介绍了难度、区分度、信度、效度等

经典测验理论各个基本概念的指标含义及计算方法,并以山西医科大学2008级硕士研究

生《医学统计学》考试试卷为例,使用EXCEL、SPSS、LISREL软件进行定量分析,计算

出试题的难度、区分度和试卷的信度、效度,并根据经典测验理论对结果加以分析,以期

对该课程的教学和考试具有一定的指导作用,同时对其他课程的评价分析提供一定借鉴意

义。

本文运用验证性因子分析方法评价试卷效度,以题型为潜变量,以小题为可观测变量

构建验证性因子分析模型,既可以通过模型评价,反映问卷的整体有效性,也可以通过因

子载荷评价每个试题的区分度和贡献。

分析结果是,考试成绩呈右偏态分布。在20个客观题中,有17个项目的难度大于0.7,

占客观题的85%;在6道主观题中,0.7难度以上的项目有2个,占主观题的33.33%。结

合本次测验目的,并非为选拔少数能力高的被试,故此难度适中。在全部26个项目中,

所有的简述题和分析计算题的区分度指数达到0.40以上,是非常优良的项目,占总题数

的23.08%;判断题1、2、9、选择题1、9这5个项目的区分度在0.30~0.39之问,是合

格、如能修改更好的项目,占总题数的19.23%;判断题3、4、5、6、8、选择题3、4、5、

6、8,这10个项目的区分度在0.20~0.29之间,是尚可、仍须修改的项目,占总题数的

38.46%;有4个项目的区分度在0.19以下,是劣、必须修改的项目占总题数的15.38%。

选择题2的区分度为-0.307,D<0,为消极区分,意思是高分段考生的通过率低,低分段

考生的通过率高,此类题目不适合参加测试。本次测试的信度α系数为0.666,说明此次

考试是可信的。试卷的结构效度方面,RMSEA、AGFI、CFI与GFI等拟合指数提示模型

与数据的吻合程度较好,说明此试卷具有较好的结构效度,模型无需修正。除判断题4、7、

10,选择题1、3、5、8、10外,其它各小题设置较合理;其中选择题3尤其低,建议改

进。第3、5、6、8、9项判断题设置较合理;第4、7项判断题不合理,建议改进。第3

项选择题因子载荷略微偏低,建议改进。两个简述题设置都较合理。第2项分析计算题设

置不合理,建议改进;第1、3、4项计算分析题设置合理。

总体来说,此次考试学生成绩相对较好,试题难度适中,区分度良好,试卷可信、有

效。

关键词:考试评价 难度 区分度 信度 效度

本文链接:https://www.sodocs.net/doc/7110958523.html,/Periodical_wxxyxb200802016.aspx

授权使用:华南师范大学(hnsfdx),授权号:549c27d8-2216-4f3c-8df2-9e3700e6c903

下载时间:2010年11月23日

相关主题