搜档网
当前位置:搜档网 › 沉浸倾向问卷的中文版修订及信效度检验

沉浸倾向问卷的中文版修订及信效度检验

沉浸倾向问卷的中文版修订及信效度检验
沉浸倾向问卷的中文版修订及信效度检验

Advances in Psychology 心理学进展, 2015, 5, 386-392

Published Online June 2015 in Hans. https://www.sodocs.net/doc/5e8735737.html,/journal/ap

https://www.sodocs.net/doc/5e8735737.html,/10.12677/ap.2015.56050

Validation and Reliability of the Chinese

Version of Immersed Tendency

Questionnaire

Yu Tian, Yulong Bian, Peiguo Han, Xiaoyue Li, Peng Wang, Fengqiang Gao*

School of Psychology, Shandong Normal University, Jinan Shandong

Email: *gaofengqiang@https://www.sodocs.net/doc/5e8735737.html,

Received: Jun. 3rd, 2015; accepted: Jun. 26th, 2015; published: Jun. 29th, 2015

Copyright ? 2015 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

https://www.sodocs.net/doc/5e8735737.html,/licenses/by/4.0/

Abstract

Background: The purpose of this study was to determine a factor structure for the immersed ten-dency questionnaire (ITQ) under the background of Chinese culture. The 14 items comprising the ITQ originally derived from Witmer and Michael’s immersed tendency questionnaire (1998). Me-thods: Data from 360 university students were subjected to exploratory factor analysis (EFA) and 440 university students were subjected to confirmatory factor analysis (CFA). Results: CFA con-firmed that ITQ was a 4-factor structure. EFA explained 50.65% of the variance through a 19-item, 4-factor structure (game immersed, state involvement, focus, and emotional involvement). Adding the total score, Cronbach’s alpha coefficients were 0.512 - 0.789. ITQ had satisfying structure va-lidity (χ2/df = 2.736, NNFI = 0.91, IFI = 0.93, CFI = 0.93, RMSEA = 0.064) and criterion validity (r =

0.575, p < 0.001). Conclusions: The revised ITQ had a satisfying structure validity and reliability;

the 4-factor had a significantly better fit, and could be used in the related fields of research.

Keywords

Immersed Tendency Questionnaire (ITQ), Chinese Revised Version, Reliability, Validity

沉浸倾向问卷的中文版修订及信效度检验

田雨,卞玉龙,韩丕国,李晓岳,王鹏,高峰强*

山东师范大学心理学院,山东济南

Email: *gaofengqiang@https://www.sodocs.net/doc/5e8735737.html,

沉浸倾向问卷的中文版修订及信效度检验收稿日期:2015年6月3日;录用日期:2015年6月26日;发布日期:2015年6月29日

摘要

目的:按照问卷修订基本流程对Witmer等人1998年编制的沉浸倾向问卷(ITQ)进行中文版修订及信效度检验。方法:选取360名大学生进行项目分析和探索性因素分析;另外抽取440名大学生进行验证性因素分析、同质性信度检验、结构效度检验,并以网络游戏沉浸问卷得分为效标进行效标关联效度检验。结果:探索性因素分析显示问卷包括四个因子,分别命名为游戏沉浸、状态卷入、专注和情感卷入,四因子解释方差50.65%。总量表的Cronbach α系数为0.78,四个因子的α系数在0.512~0.789。验证性因素分析显示问卷具有较好的结构效度(χ2/df = 2.736, NNFI = 0.91, IFI = 0.93, CFI = 0.93, RMSEA = 0.064),效标效度检验结果表明修订后的问卷具有较好的效标效度(r = 0.575, p < 0.001)。结论:修订

后的中文版沉浸倾向问卷具有较好的信效度,能够应用于相关领域的研究。

关键词

沉浸倾向问卷,中文版修订,信度,效度

1. 引言

沉浸感(Immersion)是一种心理状态,其特征是感觉到自己被包围,被封闭在环境中,并且与提供连续刺激流和体验的环境互动(Witmer, et al, 1998)。个体所沉浸的环境可以是当前从事的活动、自身的想象,也可以是设计者所设计的虚拟情境,沉浸的程度受到个体感知觉以及知识经验的影响。当个体处于“沉浸状态”时,不仅表现出注意力的高度集中,还伴随着情感的卷入。简言之,“沉浸状态”是人们从事工作、学习或其他活动时的最佳状态。不同的人产生“沉浸状态”的难易程度有所不同,被称为沉浸倾向(Immersion tendency),在相同条件下沉浸倾向高的个体能够体验到更多的沉浸感。

国内外已有部分关于沉浸感的研究。从对活动结果的影响来看,沉浸感有普遍的积极作用。沉浸感理论的创始人Csikszentmihalyi (1992)在象棋、体育运动、视觉艺术等众多领域中研究沉浸感时,发现沉浸感和表现结果呈正相关。这种积极效应在学习活动中也得到充分验证,陶侃(2009)认为沉浸感可以使学习者注意力高度集中于学习目标上。Sedig (2007)的研究显示增加儿童在数学学习时的沉浸感,可以提高儿童的数学理解力,支持了这一结论。网络学习的研究结果提供了更多支持,Kickmeier-Rust和Albert (2010)发现具有高沉浸感的教学游戏更有利于学生的学习,Ho (2010)和Skadberg (2004)的研究结果也均表明了沉浸感对网络学习结果的积极影响。Shin (2006)在研究网络课程情境中的沉浸状态时还发现沉浸也是网络课程满意度的一个重要指标,可以激发学生在远程学习中的内在动机。沉浸也会产生一些消极效应,例如Sarah R?misch等(2014)研究发现沉浸感高的妇女更容易沉浸在创伤性事件。此外,有研究者考察了沉浸的影响因素,马颖峰等(2009)人思考了“非玩家控制角色”(NPC)与沉浸感的关系,他认为NPC能够将学习者的隐形需求显性化,有利于学习者在游戏中的沉浸。Jeeyun Oh等(2014)研究发现过多的用户控制能够降低观众在电影中的沉浸和娱乐程度。这些研究结果都表明,更深入地开展沉浸感的研究是非常有必要的。

Hua Qin等(2009)研究表明个体的沉浸感可以通过对游戏的描述进行测量;但目前最常用的测量方式是自陈式沉浸量表。其中使用最广泛的沉浸感量表是Jackson等(1996)人编制的沉浸状态量表(Flow State Scale, FSS),FSS最初是用来研究各种体育运动中个体所体验到的沉浸感,现在其他领域的沉浸感研究也

沉浸倾向问卷的中文版修订及信效度检验

使用该量表。之后Trevino (1992)、Hoffman (1996)、Chen等(2006)人先后编制了沉浸感测量量表,并考察了参与虚拟活动中的沉浸感体验。我国的庄宗元(2007)、马芳(2010)也编制了中文版的沉浸感量表。需要说明的是,张宏宇(2010)曾检验了简版沉浸量表(SRRS),但是该量表所测量的沉浸(rumination)是指一个人把注意集中于抑郁症状以及这些症状的原因和结果的思想和行为,更多强调的是不断重复地在关注一个人发生的抑郁等状态,而本文当中的沉浸对象是当前活动和情境,两个概念的内涵有所不同。因此沉浸倾向问卷的修订是很有必要的。

综上可知,虽然研究者开发了诸多沉浸的测量工具,但大都是对沉浸体验进行的测量,少有工具测量沉浸倾向。目前为止仅有的沉浸倾向的测量工具是Witmer等人在1998年编制了沉浸倾向问卷,他们对沉浸进行了理论建构,认为专注和卷入是沉浸的两个主要结构,并在这个二维理论模型的基础上进行沉浸倾向问卷的编制。Witmer等人在问卷编制过程中又添加了游戏因子,最终形成了包含三个因子的沉浸倾向问卷(ITQ),分别为卷入、专注和游戏因子。国内对沉浸感的研究较少,更缺乏对沉浸倾向的测量工具;为了便于今后开展对沉浸感的研究,本研究将对Witmer等人1998年编制沉浸倾向问卷(ITQ)进行中文版修订。沉浸感不仅在现实活动的研究中有重要应用,而且更重要的是在网络和虚拟现实活动的研究中也具有重要价值(Witmer, 1998)。

2. 研究方法

2.1. 预测问卷的确定

2.1.1. 翻译、回译和校正

首先把Bob G. Witmer等人1998年编制沉浸倾向问卷(ITQ)翻译成中文版的沉浸感问卷,然后由英语专业的老师由中文回译成英文,发现没有显著差异,最后再由团队当中的6位硕士和2位博士对预测问卷进行表述纠错,以避免项目有歧义、难以理解、表述不够简练等问题,最终获得中文版问卷。

2.1.2. 项目补充

原量表共16个题目,含专注、卷入和游戏三个因子,其中专注因子含7个题目,卷入因子含7个题目,游戏因子含2个题目。此次修订在原问卷的基础上进行,保留原问卷所有题目,并且进行了一些补充。首先,补充了两个原问卷编制过程中与总分有高相关,却未被分配到特定因子中的题目,分别是“你能多好地将注意力集中在喜欢的活动上?”和“当观看运动或比赛时,你曾经因太投入以至于自己的反应好像就是其中一员吗?”。其次,由于原量表中游戏因子题目太少(2个项目),因此对该因子进行项目扩充。选取20名大学生进行深入访谈,对访谈内容进行转录并对转录的内容进行编码分析。根据开放式访谈内容编码的结果,将筛选出来的词条和短语形成4个疑问性游戏因子的题目(“你常常因为专注地玩一个手机游戏,以至于忽视了其他事情吗?”;“你曾经因为专注于一个游戏而忘记了时间吗?”;“玩游戏时,你能将注意力持续地集中在游戏中吗?”;“你经常因为太投入一个游戏,以至在游戏失败时感到生气或沮丧吗?”)。最终形成包含22个题目的初测问卷。

2.2. 预测

从山东省某高校4个年级中随机整群抽取了不同专业的8个班级,统一在课堂上施测,共发放问卷360份。回收有效问卷350份,其中男生112人,女生238人;理工科171人,文科99人,艺术体育专业90人;年龄16~24岁,平均19.2 ± 2.0岁;网龄1~12年,平均6.2 ± 2.4岁。

2.3. 正式问卷的确定

通过项目分析删除两个题目,通过探索性因素分析删除题目一个题目9(因子载荷小于0.4),最终获

沉浸倾向问卷的中文版修订及信效度检验

得包含19个题目的正式问卷,共包括四个因子,分别被定义为游戏沉浸、状态卷入、专注及情感卷入。采用1 (完全不符)~5 (完全符合)点计分,得分愈高表明沉浸倾向愈高。

2.4. 正式施测

从山东省某高校4个年级中随机整群抽取了不同专业的10个班,统一在课堂上施测,共发放问卷440份。回收有效问卷431份,其中男生175人,女生256人;理工科205人,文科119人,艺术体育专业107;年龄16~24岁,平均19.8 ± 1.9岁;网龄1~12年,平均6.3 ± 2.3岁。

2.5. 统计方法

采用SPSS 16.0进行描述统计、相关分析、探索性因素分析和信度分析。采用Liseral 8.70进行验证性因素分析。

3. 结果

3.1. 项目分析

首先对初测问卷进行项目分析,项目分析的原则为:计算各题目与总分的相关,并剔除相关r < 0.3的题目(平凡等,2012)。结果,删除r < 0.3的题目2个(6、7题)。剩余20个题目与总分的相关在0.32~0.61之间,Ps < 0.01,沉浸倾向问卷得分描述统计见表1。

3.2. 探索性因素分析

为了检验数据是否适合做因素分析,首先对预测样本(n = 350) 的数据取样适当性进行检验。对项目分析后的20个题目进行探索性因素分析,使用主成分、正交旋转法抽取因素,生成特征根大于1的因子4个,累积方差解释率为50.65%。KMO = 0.836,Baralett球形检验χ2 =1982.30,p <0.001,说明适合做因素分析。

根据研究者编制问卷的实际经验,项目删减的原则是:①共同度低于0.3;②因素负荷小于0.4 (删除题目9);③存在双重负荷(双重负荷均在0.3以上且负荷之差小于0.3) (平凡等,2012)。依据这些标准对初始问卷的项目进行删减,每次删除一个项目,重新进行探索性因素分析,并依据重新分析的结果确定下一次删除的项目。在本研究中用主成分分析法抽取特征值大于1的因素,经正交旋转,共得到4个因子,方差累积贡献率为50.65%,题目9由于因子载荷小于0.4而被删除。由于原问卷由三个因子构成,通过探索性因子分析限定3个因子,获得三因子模型,三个因子与原问卷的三个因子基本一致。对四因子模型和三因子模型的取舍将通过验证性因素分析对比考察两个模型的拟合程度来决定。四因子模型各条目因子载荷见(表2)。

3.3. 验证性因素分析

使用正式样本(n = 431)进行验证性因素分析。使用结构方程模型分别对沉浸倾向4因子结构和3因子结构进行验证性因素分析。根据温忠麟等(2006)提出的结构方程模型检验的拟合指数指标,NNFI和CFI 的临界值为0.90,RMSEA的临界值为0.08,因此本研究中四因子模型符合要求,三因子模型基本符合要求(表3)。

由于四因子模型和三因子模型不是嵌套模型,所以按照非嵌套模型的比较方法对其进行比较。在非嵌套模型中通常使用交叉拟合指数(CVI)作为模型选择的依据,ECVI为CVI数学期望的估计值。在一般情况下,介于二者之间的模型的ECVI值愈接近饱和模型的ECVI值,拟和愈好;愈接近独立模型的ECVI 值,表示拟和愈差(柳恒超等,2007)。结果,四因子模型△ECVI (ECVI-EC-VI饱和)指数均为0.24,三因

沉浸倾向问卷的中文版修订及信效度检验

Table 1. The descriptive statistics of the immersed tendency questionnaire

表1.沉浸倾向问卷得分描述统计

项目M SD r项目M SD r项目M SD r

1 2.1 0.8 0.43**9 2.4 0.9 0.55**17 1.6 0.8 0.56**

2 2.9 0.7 0.32**10 1.8 0.7 0.50**18 2.0 0.7 0.43**

3 2.3 0.6 0.32**11 2.0 0.7 0.53**19 1.7 0.7 0.60**

4 2.4 0.9 0.48**12 2.3 0.8 0.58**20 1.7 0.8 0.57**

5 2.3 0.9 0.35**13 2.1 0.8 0.58**21 2.2 0.9 0.45**

6 2.8 0.

7 0.22**14 1.9 0.

8 0.56**22 2.0 0.8 0.52**

7 2.4 0.7 0.23**15 2.1 0.7 0.44**

8 2.3 0.8 0.40**16 2.4 0.9 0.36**

注:*p < 0.05,**p < 0.01,r代表各项目与总分的相关系数。

Table 2. The factor loading of the immersed tendency questionnaire

表2.沉浸倾向问卷因子载荷值

因子一因子二因子三因子四题目载荷题目载荷题目载荷题目载荷

17 0.646

18 0.773

19 0.774

20 0.779

21 0.780

22 0.715

9 0.348 (删除)

10 0.616

11 0.631

12 0.669

13 0.738

14 0.612

1 0.518

2 0.669

3 0.418

8 0.536

4 0.496

5 0.632

15 0.564

16 0.732

子模型△ECVI (ECVI-EC-VI饱和)指数均为0.32。说明四因子模型更趋近饱和模型,拟合更好,因此接

沉浸倾向问卷的中文版修订及信效度检验Table 3. The confirmatory factor analysis of the immersed tendency questionnaire

表3.沉浸倾向验证性因素分析

模型χ2Df χ2/df CFI NNFI IFI RMSEA 四因素模型383.04 140 2.736 0.93 0.91 0.93 0.064 三因素模型359.81 112 3.213 0.90 0.88 0.90 0.072

受四因子模型。

结合四因子模型中各个因子中的项目,最终将四个因子分别命名为游戏、状态卷入、专注和情感卷入。其中卷入指一种心理状态,当个体的精力和注意力集中在一套完整的刺激或者对活动和事件有意义的刺激中时,这种状态被体验到。本量表中,卷入被划分为情感卷入和状态卷入,情感卷入是指个体把自己的情感体验融入到当前活动和事件当中的倾向,状态卷入是指个体身心的活动状态充分参与到当前的活动和事件中的倾向。专注是指当一个人将注意力导向某些事情的时候,个体就处于专注状态,当经历一个新异情境时,人们一般有更多的唤醒,更多地专注于将要进行的任务或者要经历的情境。游戏沉浸是指个体的注意力、情感和身体状态容易投入到网络虚拟游戏或手机游戏等活动中的倾向。

3.4. 量表的信效度分析

信度检验结果显示,总问卷的Cronbach α系数为0.780,4个维度的Cronbach α系数为0.512~0.789,表明修订后问卷的内部一致性信度可以接受。效度分析结果表明:首先,验证性因素分析结果显示修订后的问卷具有较高的结构效度。其次,选取游戏沉浸感问卷为沉浸倾向问卷游戏沉浸维度的校标,该问卷是由Chio和Kim编制而成,后经张红霞和谢毅翻译和修订,该问卷具有良好的信度(Cronbach α= 0.70) (魏华等,2012)。分析结果显示游戏沉浸维度得分(11.06 ± 3.0)与网络游戏沉浸得分(11.49 ± 4.3)的相关非常显著(r = 0.58, p < 0.001),表明问卷具有较好的效标关联效度。

4. 讨论

本研究首次对沉浸倾向问卷进行了中文版的修订和信效度验证。修订后的问卷与Witmer等人的问卷基本一致。原问卷中未被分配因子的两个题目,在中文版沉浸倾向问卷中被分配到专注因子当中;而在原问卷中有三个被分到专注因子中的题目(题目6、7和9),在修订后的中文版问卷当中被删除。经分析发现,题目6是测量个体准备状态的而非沉浸感倾向,题目7存在着表述不当(“投入”代表个体已经进入沉浸状态,被试得分一致,不能进行有效的区分),而题目9当中存在社会赞许效应(问题当中的“追逐”和“打斗”与之后的“兴奋”和“刺激”能够影响被试如实作答)。

原问卷由卷入、游戏、专注三个因子构成,与原问卷相比,修订后四因素结构中,依然包含专注和游戏因子,与原问卷相一致。需要注意的是,修订后的问卷在卷入因子上与原问卷不同,修订版问卷中卷入因子被区分为情感卷入和状态卷入。验证性因素分析显示四因素模型的拟合程度更好,所以,将卷入因子区分为情感卷入和状态卷入能够更有效的对沉浸感进行测量。另外,原问卷中游戏因子仅包含两个题目,修订后的问卷将游戏因子的题目数扩充至7个,提高了该因子在测量沉浸倾向中的作用,这使得该问卷能更有效地应用于网络虚拟游戏沉浸和手机游戏沉浸等领域的研究中。

与已有的其他测量沉浸的工具相比,本问卷具有诸多优势。以往问卷往往测量沉浸状态(Jackson, & Marsh, 1996),而本问卷考察沉浸倾向。此外,以往的沉浸测量工具往往在适用情境上有较大限制(Trevino, 1992; Hoffman, 1996; Chen, 2006),相比以往的沉浸感问卷,本问卷既能考察一般活动情境,也能应用于网络游戏这一特殊活动情境。

修订后的ITQ的题目表达方式和答案选项更容易为被试理解。ITQ的问题当中未涉及反向计分项目,

沉浸倾向问卷的中文版修订及信效度检验

所以得分越高,个体的沉浸倾向越高。对多阶段随机抽取的大学样本数据进行分析,结果显示修订后的问卷有较高的信度。效度分析结果表明问卷也具有较高的结构效度和校标效度。修订后得出的四因子模型说明倾向于沉浸到某项任务、游戏或学习中的个体,不只是需要注意力的集中,还包括个体的情感以及状态上的卷入。修订后的中文版沉浸感问卷除了可以有效地应用于工作、学习、体育等一般活动中,更重要的是可以应用于网络学习、虚拟游戏、电子商务、立体电影等虚拟环境中活动的研究中。

基金项目

山东省应用基础型人才培养特色名校建设(应用心理学专业);山东省社会科学规划研究项目(立项编号:11CZXZ04);济南市科技发展计划项目(立项编号:201202007)。

参考文献(References)

柳恒超, 许燕, 王力(2007). 结构方程模型应用中模型选择的原理和方法. 心理学探新, 27期, 75-78.

马芳(2010). 中学生学习沉浸体验及其影响因素研究. 南京师范大学硕士学位论文.

马颖峰, 隋志华(2009). 教育网络游戏中NPC与学习者置入感的关系研究. 电化教育研究, 6期, 109-112.

平凡, 韩磊, 周宗奎(2012). 大学生网络交往问卷的初步编制及信效度检验. 中国心理卫生杂志, 26期, 709-714.

陶侃(2009). 沉浸理论视角下的虚拟交互与学习探究——兼论成人学习者“学习内存”的拓展. 远程教育杂志, 1期, 20-25.

魏华, 周宗奎, 田媛, 等(2012). 网络游戏成瘾:沉浸的影响及其作用机制. 心理发展与教育, 6期, 651-657.

温忠麟, 张雷, 候杰泰(2006). 有中介的调节变量和有调节的中介变量. 心理学报, 3期, 448-452.

张宏宇, 许艳(2010). 简版沉浸量表SRRS 在大学生中的信效度分析. 心理研究, 4期, 34-39.

庄宗元(2007). 在模拟情境设计历程中探讨学生沉浸经验对情绪创造力的影响. 硕士论文, 新竹: 国立交通大学.

Chen, H. (2006). Flow on the net-detecting Web users’ positive affects and their flow states. Computers in Human Behavior, 22, 221-233.

Csikszentmihalyi, M., & Csikszentmihalyi, I. S. (1992). Optimal experience psychological studies of flow in consciousness.

Cambridge: Cambridge University Press.

Ho, L. A., & Kuo, T. H. (2010). How can one amplify the effect of e-learning? An examination of high-tech employees’ computer attitude and flow experience. Computers in Human Behavior, 26, 23-31.

Hoffman, D. L., & Novak, T. P. (1996). Marketing in hypermedia computer-mediated environments: Conceptual foundations.

Journal of Marketing, 60, 50-68.

Jackson, S. A., & Marsh, H. W. (1996). Development and validation of a scale to measure optimal experience: The flow state scale. Journal of Sport and Exercise Psychology, 18, 17-35.

Kickmeier-Rust, M. D., & Albert, D. (2010). Micro-adaptivity: Protecting immersion in didactically adaptive digital educa-tional games. Journal of Computer Assisted Learning, 26, 95-105.

Oh, J., Chung, M. Y., & Han, S. Y. (2014). The more control, the better? The effects of user control on movie trailer immer-sion and enjoyment. Journal of Media Psychology, 26, 81-91.

Qin, H., Rau, P. L. P., & Salvendy, G. (2009). Measuring player immersion in the computer game narrative. Journal of Hu-man-Computer Interaction, 25, 107-113.

R?misch, S., Leban, E., Habermas, T., & D?ll-Hentschker, S. (2014). Evaluation, immersion, and fragmentation in emotion narratives from traumatized and non-traumatized women. Psychological Trauma: Theory, Research, Practice, and Policy, 6, 465-472.

Sedig, K. (2007). Toward operationalization of “Flow” in mathematics learnware. Computers in Human Behavior, 23, 2064- 2092.

Shin, N. (2006). Online learner’s “Flow” experience: An empirical study. British Journal of Educational Technology, 37, 705-720.

Skadberg, Y. X., & Kimmel, J. R. (2004). Visitors’ flow experience while browsing a website: Its measurement, contributing factors and consequences. Computers in Human Behavior, 20, 403-422.

Trevino, L. K. (1992). Flow in computer-mediated communication. Communication Research, 19, 539-573.

Witmer, B. G., & Singer, M. J. (1998). Measuring presence in virtual environments: A Presence Questionnaire. Presence: Teleoperators and Virtual Environments, 7, 225-240.

问卷的信度与效度

调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的

量表的信度效度检验

第六章量表的信度效度检验 我们采用含有多个项目的量表来测量人们的意见、态度、看法等、这样得到的结果是否准确、可靠,是否有适用性?这就需要评价量表的信度和效度。从理论的观点来看,一个良好的测量工具(量表)应具有足够的效度和信度。 一、信度检验 信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性\替换形式)和内在一致性系数(跨项目的一致性)。信度表示的方法主要有以下四种: 1、稳定性系数 稳定性系数是采用同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间内进行两次测量,用两次测量结果间的相关分析来评价量表信度的高低,连皮尔逊积差相关系数即是信度系数,也称为重测信度,或再测信度。 两次测量,如果间隔时间过长,调查对象容易受环境和个人经历的影响而发生态度的转变,如果间隔时间过短,则受到上次调查记忆的影响。适当的间隔时间是既不能让调查对象记住上一次测验的内容,也不能让其被测的主观特征在两次测验之间没有发生较大的变化。适合的间隔时间要视调查对象和测量内容不同而不同,一般来说,年幼儿童,间隔时间要小,年长者,间隔时间可以延长。并且调查对象在两次测量期间没有发生于相关的重大事件。在最后提交调研报告时,要对间隔时间加以说明,报告间隔的时间。 2、等值系数(复本信度) 用两个复本在最短时间内对同一组调查对象进行测量所得结果的一致性程度,复本信度系数等于两个复本测量所得分数的皮尔逊积差相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度,是等值系数。复本类似于考试中得A、B卷,如果一个人在A卷和B卷的得分相同,就说明考题具有信度;如果两者差异很大,则缺乏信度。 复本信度的使用前提是测量所用的两个复本必须是等效的,两个复本要满足以下几个条件:两个复本测量的是同一种特征。两个复本具有相同的内容和

毕业学位论文调查问卷信度效度检验--总结

毕业学位论文调查问卷信度效度检验 一、隗金水--博士论文运动员选材的选育结合理论与实证研究 1、问卷的效度问题。本研究的调查问卷是在大量阅读有关运动员选材和早期训练及管理等资料的基础上,结合运动选材和训练实际,同时考虑教练员和运动员的特殊性(时间问题,阅读能力问题,对理论研究的兴趣问题等)编制而成,内容方面力求全面反映选育现状,文字表达方面字斟句酌,反复修改,力求简单朴素,言简意赅.按照《体育测量评价》效度理论及《社会研究方法》中的概念操作化的方法(艾尔.巴比,2000),先对调查的基本内容进行纲要式的拟订、修改,并在征求专家意见的基础上,最后确定调查内容纲要细目表(见表2一1表2一),这样可以在结构上保证内容的全面性而避免遗漏重要内容,再根据细目表逐一进行问卷的编写,达到概念操作化的目的,即将抽象的概念转化为可观测的具体指标或题目。然后在小范围内进行预备测试,并结合教练员和运动员的意见进行反复修改,力争在内容效度和表面效度达到较高要求。 2、调查问卷的信度检验。调查问卷定稿后,以重测法在小范围内进行了信度检验。其中教练员问卷在以沁2年7月在教练员进修班(45名学员)中进行重测,其信度系数为091(P劝.01);运动员问卷在60名运动员(田径专项)中进行重测,其信度系数为0.87(P劝.01)。在问卷设计和正式实施调查的过程中,采取了下列措施以确保问卷信度,(l)问卷题目数量尽量少,控制在一张A4纸(正反面)内。(2)语言表达上尽量通俗、简单扼要,主要采用选择题型,极少数题目采用填空题型。(3)匿名填写问卷。(4)运动员问卷的发放和填写尽量避开教练员在现场。 二、宋秀丽博士论文新农村社区体育研究--以东尉社区为个案 1、问卷信度:笔者之所以能有这样的便利条件发放问卷,原因在于本人的爱人是当地市日报社的记者,长山镇是其常年负责宣传报道的乡镇之一,在2008年6月曾经为东尉社区写过整版宣传报道,并获得滨州市新闻媒体单位的精品工程"本人爱人的工作特点为本论文问卷的发放回收以及实地考察提供了极为便利的条件"问卷调查的对象之所以将56岁以上老年人排除在调查范围之外,原因在于两方面,一是东尉社区对老年人采用集中供养的方式,凡是年龄达56岁者其家庭每年向公寓交一定象征性的费用就可以入住东尉社区的老年公寓,在老年公寓有专门为老年人提供的各种文体活动场地设施;二是东尉社区老年公寓老人文化水平一般较低,问卷的填答对他们来说有相当的难度"所以,对于老年公寓老年人的体育活动开展状况多是采用访谈方式进行 2、效度检验:问卷制定之后,请8位专家对问卷的内容和结构效度进行了检验,有5位专家认为合理,3位专家认为基本合理,问卷具有较高的结构效度" 三、陈琦--博士论文从终身体育思想审视我国学校体育的改革与发展 1、信度检验:问卷设计完后请专家判定问卷的指标是否能够含盖研究主题是否合适从而进行效度检验学生问卷专家认定率为91.72%教师问卷专家认定率为90.41%市民问卷专家认定率95.56%参见表2-1

SPSS测量问卷信效度分析

测量问卷信效度分析 信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分析,才能确保我们的问卷有意义。 信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信。例如,我们用一把尺子测量一张桌子的高度,今天测量得高度与明天测量的高度不同,那么我们就会对这把尺子产生怀疑。因此,一张设计合理的调查问卷应该具有它的可靠性和稳定性。 目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。 信度分析是:“分析”——“度量”——“可靠性分析”,把所有主观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选中,得出先关维度的信度。 具体步骤:分析——度量——可靠性分析 模型选择a,点击确定即可。 结果分析: 分析各个维度和总量的信度后,将它们列出一个表格,其中每个维度的a信度系数都大于0.7,说明该量表信度较好,符合问卷调查。 效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结果越能显示其所 要测量的特征,反之,则效度越低。常用于调查问卷效度分析的方法主要有以下几种。 1、单项与总和相关效度分析 这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项

问卷信效度分析

问卷和量表的构建以及信度效度检验 在提出一个有趣的研究问题之后,我们还应该去寻找一种合理的方法去进行深入研究,使这个研究问题能够量化操作,这里面必不可少的会用到一些研究工具如问卷和量表等。在看了《不同主体层次中组织的知识转化结构及其形成机理》一文之后,使我对问题的可操作化研究有了进一步的认识。 1、问卷和量表的构建 我们在构建问卷时,可以首先从前人权威学者那里寻找相关的量表,然后再结合我们的实际研究问题进行调整编制。下面是关于问卷和量表构建的步骤: 第一步、确定研究目的。 第二步、确定受试对象。 第三步、编制访谈问题或调查问卷,并制作访谈内容或调查问卷分析表。 第四步、进行访谈或问卷调查,并回收访谈结果或调查问卷。 第五步、对访谈结果或调查问卷进行分析和统计,确定量表中的问题和量尺。 第六步、编制量表。 第七步、对量表进行预测试。 第八步、对预测试结果进行分析,修订量表。 第九步、确定最终的量表。 第十步、对量表进行测试,确定信度和效度。 2、量表信度和效度检验 一份好的量表必须具有相当的信度和效度。 所谓信度即是指可靠的程度,而效度则是指有效的程度。有信度的量表通常具有一致性(consistency)、稳定性(stability)、可靠性(dependability)、及可预测性(predictability)等。一份稳定可靠的量表,几次所得的结果一定是相当一致的,而且可透过此量表对受试者做预测用。

效度是指一个量表能够有效的测量到它所要测量的特质的程度,譬如一份有效的「成就动机量表」应该能确实反映出受试者的成就动机,高成就动机者在此量表的得分应该比低成就动机者的得分显着要高。 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。效度高,信度也必然高。因此,我们必须保证做到信度和效度都很好,这样才会具有说服力! 我们在进行信度和效度检验时,我们首先对我们的数据样本进行组内一致性检验判断数据的质量,然后再对我们的数据结果进行信度和效度的检验。在进行信度检验时,我们可以对同质信度、折半信度和再测信度三种方法分别进行测量,这样会提高数据的可信程度;效度检验采取内容效度、建构效度和效标关联效度三种方式来检验。 信效度分析 2010-06-08 07:57:11| 分类:教学方法及理论研 | 标签: |字号大中小订阅 一、信度分析 信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。信 度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值 系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四 种: 1、重测信度法 同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间进行两次测

问卷的信度与效度

?调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法

复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(r hh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式: 求出整个量表的信度系数(r )。 u 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数,其公式为: 其中,K为量表中题项的总数,为第i题得分的题方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析

问卷信度效度检验

从统计数据质量角度谈调查问卷的设计质量 一、引言 从保证统计数据质量的统计工作过程看,统计数据质量可以被划分为统计设计质量、统计调查质量、统计整理质量、统计分析质量以及数据发布传输质量等。统计设计质量是保证统计数据质量的首要环节,在统计数据质量保证体系中起着关键性作用。统计设计质量一般包括调查问卷设计质量与调查方案设计质量,其中调查问卷设计质量指的是:通过问卷测量得到的,反映调查对象客观现象的统计数据的准确性和有效性,即调查问卷设计质量的好坏,需要通过问卷测量能力的高低来检验。 在市场调查中,为了深入地研究一些本质的或理论性的现象,问卷调查法被广泛运用,除了调查时采用的抽样方法以及所抽取的调查对象是否具有代表性之外,调查者最关心的就是调查问卷的测量能力。问卷测量能力包含了两个方面的内容,即问卷测量结果的准确性和有效性。准确性和有效性是统计数据质量蕴涵的最主要的两个特性,一个好的调查问卷设计不仅可以保证在多次重复使用下得到可靠的数据结果,即准确性;也可以保证所得测量结果能够反映它所应该反映的客观现实,即有效性。 所以我们可以通过对问卷测量能力的分析来检验问卷的设计质量,对问卷设计进行质量控制,进而发现问卷设计中应注意的问题。在此基础上,通过不断改进问卷设计,提高其测量能力,最终将有助于我们得到高质量的调查数据。 二、调查问卷的设计质量检验 信度和效度的概念来源于心理测试中关于测验的可靠性和有效性研究,当建构和评估测量时,通常使用信度和效度这两个技术性指标。因此我们采用问卷的信度和效度分析来评估其测量能力,进而实现对问卷设计质量的检验。 1.问卷设计质量的信度检验 所谓问卷设计质量的信度检验,指的是对问卷测量结果准确性的分析,即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度,复本信度,折半信度,克朗巴哈信度,评分者信度等。国内外已经有很多关于这些信度分析方法介绍的文献,在这里,笔者不再一一详述,仅列出相关公式作为参考。 (1)重测信度,也叫稳定系数,对同一组调查对象采用同一调查问卷进行先后两次调 查,采用检验公式,其中为两次调查结果的协方差,为第一次调查结果 的协方差,为第二次调查结果的协方差。系数值越大说明信度越高。 (2)复本信度,也叫等值系数,对同一组调查对象进行两种相等或相近的调查,要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。检验公式同稳定系数公式,系数越大,说明两份问卷的信度越高,具体调查时使用哪一份都可以。 (3)折半信度,也叫内在一致性系数,将调查的项目按前后分成两等份或按奇偶题号分成两部分,通过计算这两部分调查结果的相关系数来衡量信度。当假定两部分调查结果得 分的方差相等时,检验用Spearman-Brown公式来表示:,其中表示折半信度系数;当假定方差不相等时,采用Flanagan 公式:,其中、分别 表示两部分调查结果的方差,表示整个问卷调查结果的方差。如果折半信度很高,则说明这份问卷的各项题之间难度相当,调查结果信度高。 (4)克朗巴哈信度,是对折半信度的改进,检验公式是:,其中

关于调查问卷的信度和效度检验

关于调查问卷的信度和效度检验 (一)信度 1、 信度的含义 测验的信度又称测验的可靠性 ,是指同一个测验对同一组被试施测两次或多次 ,所得结果 一致形程度。一个好的测验必须是稳定可靠的 ,多次使用所获得的结果是前后一致的。例 如,用直尺测量长度,其结果是稳定可靠的 ;用橡皮筋测长度则是不可靠的 ,前后测量 结果缺乏一致性。在测量理论中 ,信度被定义为:某次测验分数的真变异数与总变异数 ST2 (即实测分数)之比:R xx - S x 2 式中Rxx 表示测量的信度,ST -代表真分数的变异数 (方差),Sx -表示实得分数的变异 数(方差)。 For pers onal use only in study and research; not for commercial use 从上式可看出,(1)信度是指实测值和真值相差的程度 ,实测值是指对某物实际进行测 量时所获得值 ,也称实测分数 (X );真值是指被测事物的真实规模取值 ,也称真分数 (T )。由于各种原因,实得分数常不等于真分数 ,两者之差称为测量误差或误差分数 (E )。从理论上看,实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 (2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次 测验中,受测者所得分数或所处等级前后一致 ,则说明测验结果的信度较高 ;反之,两 次测验结果一致性低 ,说明测验结果的信度低。 For pers onal use only in study and research; not for commercial use 信度是任何一种测量的必要条件 (但不是唯一条件 ),只有测量值接近或等于真值 ,用同 一工具多次测量同一特性获得相同或相近的结果 ,才能认为这个测量结果是可靠的。 信度 对于教育测量尤其重要,只有信度高的教育测验才能成为教育工作者有用的工具 ,才能为 教育工作者提供可靠的信息,为教育预测和决策提供客观依据。 2、 信度的估计方法 测验的信度是用信度系数的大小来表示的 ,根据测量理论,信度系数 For pers onal use only in study and research; not for commercial use ST2 R xx S 2 但是在实际测量中,一般只能获得实得分数 (X )及实得变异数 (Sx 2 ),而真分数(T )及 真变异数(ST 2 )是不知道的,因此,依据上述公式还无法机算信度系数。在统计上 ,主 要采用相关分析的方法即机算两列变量的相关系数 ,用相关系数的大小来表示信度的高 低。主要用以下方法来求得信度 :

如何进行问卷效度与信度分析

如何进行问卷信效度分析 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 重测信度法:这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 复本信度法:复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 折半信度法:折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式,求出整个量表的信度系数(ru)。 α信度系数法:Cronbach α信度系数是目前最常用的信度系数。其中,K为量表中题项的总数,为第i题得分的题内方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析 效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型:内容效度、准则效度和结构效度。效度分析有多种方法,其测量结果反映效度的不同方面。常用于调查问卷效度分析的方法主要有以下几种: 单项与总和相关效度分析:这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算总分。 准则效度分析:准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著

NDI量表中文版的研制与信效度检验

NDI 量表中文版的研制与信效度检验 【摘要】目的:探讨制定一个可量化测定功能性消化不良患者生活质量的量表,并检验其信度和效度。方法:对英文版NDI 量表进行了规范的翻译,并运用其对功能性消化患者的进行现场调查。通过计算Cron bach s a系数考察量表的内部一致性;计算量表各个条目与各方面得分之间的Pearson相关系数r 来分析量表的内容效度;采用探索性因子分析和结构方程模型考察量表的结构效度。结果:Cronbach' s a 值在0.833 至0.960之间;相关性分析结果表明量表各条目与其所在领域紧密相关而和其他领域相关性差。结论:NDI 量表中文版符合中国的文化特点,并具有较好的信度和效度,可用于国内功能性消化不良的相关临床研究中。 【关键词】尼平消化不良指数;功能性消化不良;信度;效度 【中图分类号】R395.1 【文献标识码】A 【文章编号】1005-0019(2014)03-0467-01 Nepean Dyspepsia Inde(x NDI )量表是1998 年由 Nicholas J.Talley 等[1] 编制的,该量表在国外被作为

测定功能性消化不良(Functional Dyspepsia FC)患者 的生活质量的工具广泛应用于临床科研中。本研究在购买到英文版NDI 量表的使用权、征得源量表作者 Nicholas J.Talley的书面授权后,对量表进行了翻译和谨慎的修订,并对NDI 中文翻译版本的信度和效度进行了初步检验。 1中文版NDI 量表的建立 1.1源量表的选择:本研究选择了经认证的为非长版本(源量表作者为Nicholas J.Talley,量表生活质量部分为25 个条目)的NDI 量表为翻译的蓝本。 1.2量表的翻译、回译及谨慎修订:具体过程为:①由两名精通英语的消化内科医务人员对源量表进行独立翻译,然后对翻译稿中的问题进行讨论,最后达成一致形成初译稿;②请一位对源量表不知情的懂中文的英语教师对第二稿进行独立回译;③组织5 名FD 患者对经原版本、直译和回译版本的整合修改后的中文版本进行反应尺度试验;④经过谨慎的语言修改和跨文化调适,形成最终版。 2量表的信度与效度检验 2.1 调查对象与方法:以成都中医药大学附属医院、成都市第二人民医院、武汉市中西医结合医院、武汉市中医院、湖南中医药大学附属医院胃镜室、消化内科门诊为

如何使用spss进行问卷效度和信度分析

如何使用spss软件进行效度和信度分析 如果一个问卷设计出来无法有效地考察问卷中所涉及的各个因素,那么我们为调查问卷所作的抽样、调查、分析、结论等一系列的工作也就白做了。那么,我们如何来检验设计好的调查问卷是否有效呢?信度分析是评价调查问卷是否具有稳定性和可靠性的有效的分析方法。 二、信度分析的提出及分析方法 信度,又叫可靠性,是指问卷的可信程度。它主要表现检验结果的一贯性、一致性、再现性和稳定性。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信[1]。例如,我们用一把尺子测量一张桌子的高度,今天测量得高度与明天测量的高度不同,那么我们就会对这把尺子产生怀疑。因此,一张设计合理的调查问卷应该具有它的可靠性和稳定性。 调查问卷的评价体系是以量表形式来体现的,编制的合理性决定着评价结果的可用性和可信性。问卷的信度分析包括内在信度分析和外在信度分析。内在信度重在考察一组评价项目是否测量同一个概念,这些项目之间是否具有较高的内在一致性。一致性程度越高,评价项目就越有意义,其评价结果的可信度就越强。外在信度是指在不同时间对同批被调查者实施重复调查时,评价结果是否具有一致性。如果两次评价结果相关性较强,说明项目的概念和内容是清晰的,因而评价的结果是可信的。信度分析的方法有多种,有Alpha信度和分半信度等,都是通过不同的方法来计算信度系数,再对信度系数进行分析[2]。 目前最常用的是Alpha信度系数法,一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。我们可以通过目前比较流行的SPSS软件对调查问卷进行信度分析,这样我们就可以判断一个调查问卷是否具有稳定性和可靠性。 三、利用SPSS软件进行信度分析 下面就以兵团广播电视大学“人才培养模式改革和开放教育试点”毕业生追踪调查[3]中《电大教学效果评价》(毕业生用)这一调查量表进行分析。量表见下图。 (一)对量表进行纬度划分,将量表分为知识、能力、业绩三个纬度。其中,第1~4题划分到知识纬度,第5~12题划分到能力纬度;第13~15题划分到业绩纬度。通过每一纬度的Alpha系数来考察每一项得分间的一致性。 1、打开SPSS软件,调入930条记录的数据文件,进入SPSS主界面。 2、在知识纬度中,对项目(1)专业知识的掌握;(2)所学知识与工作岗位的实际需要;(3)知识面的拓宽;(4)专业水平的提高;进行内部一致性分析。 ①单击“分析”菜单中的“尺度分析”,再在“尺度分析”的子菜单中点击“可靠性”分析,打开“可靠性分析”的主对话框。 ②在左侧的源变量框中选择上述四个项目所对应的变量c1,c2,c3,c4加入到对话框右边的“项目”中,作为分析变量,再在对话框下面的“模型”中选择“Alpha”,进行Alpha信度分析。 ③点击对话框中的“统计量”按钮,打开相应的对话框,选择要输出的统计量、变量描述、方差分析,总结等。在这个例题中为了看的清楚,我们用默认方式,即只输出样本个数、项目个数和信度系数。 ④点击“继续”按钮,回到“可靠性分析”的主对话框,勾选“列出项目标签”,再单击“确定”

问卷信效度分析教程文件

问卷信效度分析

问卷和量表的构建以及信度效度检验 在提出一个有趣的研究问题之后,我们还应该去寻找一种合理的方法去进行深入研究,使这个研究问题能够量化操作,这里面必不可少的会用到一些研究工具如问卷和量表等。在看了《不同主体层次中组织的知识转化结构及其形成机理》一文之后,使我对问题的可操作化研究有了进一步的认识。 1、问卷和量表的构建 我们在构建问卷时,可以首先从前人权威学者那里寻找相关的量表,然后再结合我们的实际研究问题进行调整编制。下面是关于问卷和量表构建的步骤: 第一步、确定研究目的。 第二步、确定受试对象。 第三步、编制访谈问题或调查问卷,并制作访谈内容或调查问卷分析表。 第四步、进行访谈或问卷调查,并回收访谈结果或调查问卷。 第五步、对访谈结果或调查问卷进行分析和统计,确定量表中的问题和量尺。 第六步、编制量表。 第七步、对量表进行预测试。 第八步、对预测试结果进行分析,修订量表。 第九步、确定最终的量表。 第十步、对量表进行测试,确定信度和效度。 2、量表信度和效度检验 一份好的量表必须具有相当的信度和效度。 所谓信度即是指可靠的程度,而效度则是指有效的程度。有信度的量表通常具有一致性(consistency)、稳定性(stability)、可靠性(dependability)、及可预测性(predictability)等。一份稳定可靠的量表,几次所得的结果一定是相当一致的,而且可透过此量表对受试者做预测用。 效度是指一个量表能够有效的测量到它所要测量的特质的程度,譬如一份有效的「成就动机量表」应该能确实反映出受试者的成就动机,高成就动机者在此量表的得分应该比低成就动机者的得分显着要高。 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。效度高,信度也必然高。因此,我们必须保证做到信度和效度都很好,这样才会具有说服力! 我们在进行信度和效度检验时,我们首先对我们的数据样本进行组内一致性检验判断数据的质量,然后再对我们的数据结果进行信度和效度的检验。在进行信度检验时,我们可以对同质信度、折半信度和

SPSS信度和效度检验全套资料

关于调查问卷的信度和效度检验 (一)信度 1 、信度的含义 测验的信度又称测验的可靠性 , 是指同一个测验对同一组被试施测两次或多次 , 所得结果一致形程度。一个好的测验必须是稳定可靠的 , 多次使用所获得的结果是前后一致的。例如 , 用直尺测量长度 , 其结果是稳定可靠的 ; 用橡皮筋测长度则是不可靠的 , 前后测量结果缺乏一致性。在测量理论中 , 信度被定义为 : 某次测验分数的真变异数与总变异数 ( 即实测分数 ) 之比 :22 S R x xx ST = 式中 Rxx 表示测量的信度 ,ST 2 代表真分数的变异数 ( 方差 ),Sx 2 表示实得分数的变异数 ( 方差 ) 。 从上式可看出 , ( 1 )信度是指实测值和真值相差的程度 , 实测值是指对某物实际进行测量时所获得值 , 也称实测分数 (X); 真值是指被测事物的真实规模取值 , 也称真分数 (T) 。由于各种原因 , 实得分数常不等于真分数 , 两者之差称为测量误差或误差分数 (E) 。从理论上看 , 实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 ( 2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次测验中 , 受测者所得分数或所处等级前后一致 , 则说明测验结果的信度较高 ; 反之 , 两次测验结果一致性低 , 说明测验结果的信度低。 信度是任何一种测量的必要条件 ( 但不是唯一条件 ), 只有测量值接近或等于真值 , 用同一工具多次测量同一特性获得相同或相近的结果 , 才能认为这个测量结果是可靠的。信度对于教育测量尤其重要 , 只有信度高的教育测验才能成为教育工作者有用的工具 , 才能为教育工作者提供可靠的信息 , 为教育预测和决策提供客观依据。 2 、信度的估计方法 测验的信度是用信度系数的大小来表示的 , 根据测量理论 , 信度系数 2 2 S R x xx ST = 但是在实际测量中 , 一般只能获得实得分数 (X) 及实得变异数 (Sx 2 ), 而真分数 (T) 及真变异数 (ST 2 ) 是不知道的 , 因此 , 依据上述公式还无法机算信度系数。在统计上 , 主要采用相关分析的方法即机算两列变量的相关系数 , 用相关系数的大小来表示信度的高低。主要用以下方法来求得信度 : ( 1 )再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的 :2 12 1/21S S M M N X X R xx ?-= ∑ 式中 X 1 .X 2 为同一被试的两次测验得分 ,M1.M2 为两次测验的平均分数 ,S 1 .S 2 是两次测验的标准差 ,N 是被试人数。 用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。 用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适

问卷的信度和效度

第五章问卷的信度和效度 问卷是收集资料的工具,与其他的测量工具有很大不同,对其评价较为复杂,难一份优秀问卷应该是研究对象乐意接受的,能收集到所需要的数据,且所收集的数据是可信的。一般来说,评价一份问卷的质量,可从信度、效度、可行性和灵敏度四方面进行分析。 问卷的可行性是指问卷被研究对象接受的程度,包括是否参与调查、中断调查、完成问卷调查过程和拒绝调查的情况,常用参与率、拒答率、平均完成时间、调查中断率、问卷有效率等指标来说明。 灵敏度是指问卷应能及时反映出研究对象某些特征的变化,如健康量表的高灵敏性就是量表应对测量人群健康水平的微小变化都能及时地反映出来。下面将着重介绍问卷的两个最重要的特征:信度和效度。 问卷测验是测量答卷者对问卷题目主观认识的个体差异的工具。问卷测验的结果与问卷时的情景和测验时的条件有关。 问卷测验中测量误差对问卷结果的影响是不可避免的,误差通常来源于两个方面: 一是产生于问卷测验过程中的误差,称为测量误差(meas-urement error),也称为随机误差(random error); 二是由问卷的质量造成的误差,称为系统误差(system error)。与两类误差相对应,在问卷测验结果分析中引入了信度(reliability)和效度(validity)的概念,信度和效度是衡量问卷整体质量的重要指标,一份好的问卷应同时具有较高的信度和效度。 一、信度分析 无论是调查问卷,还是一次考试的试卷,还是对同一生物体进行重复测量,信度的高低都是评价其质量的重要指标。 (一)信度分析的意义 信度又称为问卷的可靠性,其主要是指问卷是否精准(precision)。 信度分析涉及了问卷测验结果的一致性和稳定性,其目的是如何控制和减少随机误差。 调查问卷的信度包含两层含义: 一是相同的个体在不同时间,以相同的问卷测验,或以复本测验,或在不同 的情景下测验,是否能得到相同的结果,

信度与效度分析步骤

如何用spss做问卷的结构效度分析? 问:因子分析里面Descriotives里面KMO和巴特利检验就可以了吗?除此之外,还要做什么啊?请高手赐教点简单易懂又能说明效度问题的,谢谢啦! 问题补充: 提取因子的个数怎么确定?是选特征值大于1的吗?还有,因子载荷怎么算?是在输出结果中直接可以看到吗?本人刚接触spss,请多多指教! 答: 首先必须要做KMO和Bartlett球形检验,这个你应该会了吧,如果这两个检验合格的话说明数据是适合做因子分析的。 然后提取因子后,看主因子解释总变异的百分比和个因子的因子载荷,主因子解释总变异一般若大于60%的和因子载荷大于0.6的话说明结构效度很好。 pS: ,如果题目没有规定就是选特征值大于1的,如果题目事先要提取几个因子,那么在操作的时候,用SPSS那个因子分析的选项里面有一个地方可以著名,因子载荷在输出的结果直接可以看到(rotated compoment matrpx),一定要是旋转后的因子载荷 用spss进行效度分析? 我要对我的问卷调查数据做一个信度和效度分析。信度分析我会了,就是看Cronbach’s Alpha 系数。效度分表面效度、准则效度和构建效度,前面两项只要说明一下,但是构建效度要用SPSS分析,我想是在因子分析里面吧?就是不知道哪个值代表效度。 答: 因子分析的效度分析主要的指标可以看,因子提取的方差累积贡献率,如果因子提取的越少且方差累积率又不低的话(一般如果2个因子达到40%以上的贡献率就算可以的了),就可以认为因子分析的效度还可以。 除此之外,你可以用因子分析里面Descriotives里面KMO和巴特利检验(battele,不知道是不是这样写的),KMO的值如果>0.5,则说明因子分析的效度还行,可以进行因子分析;另外,如果巴特利检验的P<0.001,说明因子的相关系数矩阵非单位矩阵,能够提取最少的因子同时又能解释大部分的方差,即效度可以。 问:问卷效度测验如何应用于SPSS 问卷效度测验如何应用于SPSS,然后因为做效度检验貌似要用皮尔逊相关还是因子分析,所以不懂如何把这些应用于SPSS,不想要变量,想要整体,一个整体。 用因子分析,就已经是在检验变量的整体了 因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计方法。 三、因子分析的SPSS过程 第一步:准备数据文件,打开对话框,加载观测变量。数据文件主要是由较多的(一般在10个以上)可观测变量组成,个案数应比较大。然后点击“Analyze” ,选择“Data Reduction” 中的“Factor”打开因子分析对话框,将参与分析的所有观测变量加载到“Variables”下边的方框中。 第二步:点击“Descriptives…”设置描述性统计要求。这里关键的是要求输出因子分析适合度的检验,一般要求输出:计算相关系数矩阵(选中Coefficients)、相关系数显著性水平矩阵(选中Significance levels)、反像相关矩阵检验 ( 选中Anti-image ) 、KMO 和巴特利特球形检验(选中KMO and Bartlett’s test of sphericity)。 第三步: 点击“Extraction”打开对话框设置因子提取方式。在界定因子提取方法中需要设置以下几个方面的参数: (1) 因子构造方法:大多数情况下认为因子是变量的线性组合,所以使用最多的是主成分分析法(Principal components);

前测数据分析__信度和效度分析

第二节信度和效度分析 一、信度分析 与预测试数据分析方法一样,为了确保问卷的可靠性,先进行信度分析,信度检验指标在前面已详细述,在此不再述。问卷信度分析如表4-2所示: 表4-2:量表信度检验结果

经过SPSS24.0数据统计软件分析得知个变量Cr onbach's α均大于0.6,且组合信度在0.792以上,说明所有问卷都具备可靠性,能够较好的反应变量的真实情况。 二、效度检验 (一)容效度 为了确保调研问卷容的有效性,问卷量表通过文献研究先初步圈定问卷容,所用量表大多采用国外已经开发出的成熟量表,对于这部分量表,本文给予直接采用的方式,其余量表则是在前人研究的基础上,根据本文的研究目的和方向进行谨慎的拟定。因此,本问卷具有容效度。 (二)结构效度 在测量结构效度时,通常采用探索性因子分析。在进行因子分析时,通常采用主成分分析法,主成分分析的目的在于利用变量间的线性组合来解释每个层面的方差,变量的第一个线性组合可以解释最大的变异量,以此类推,所以主成分分析法的步骤是,选取特征值大于1的因子,然后利用方差最大旋转法进行旋转,使得旋转后题目在各个因子的负荷量大小出现明显差异,大部分题目在每个公共因子中有一个差异较大的因子负荷量出现。但在因子分析之前需要进行KMO值和Bartlett球形检验,只有当KMO>0.5且Bartlett球形检验的Sig.值小于0.05时,

问卷才具有结构效度,才能够进行因子分析。本研究中对三个量表进行的结构效度分析具体情况如下。 (1)虚拟品牌社群价值的效度检测 1.1虚拟品牌社群价值的KMO值和Bartlett球形检验 在对虚拟品牌社群价值做因子分析之前,先做KMO值和Bartlett球形检验,检测结果如表4-3所示: 表4-3:虚拟品牌社群价值的KMO值和Bartlett检验 取样足够度的Kaiser-Meyer-Olkin度量.901 Bartlett的球形度检验近似卡方4892.820 df 186 Sig. .000 通过对虚拟品牌社群价值量表的14个题项进行KMO检验和Bartlett球形检验,发现虚拟品牌社群价值量表的KMO值为0.901,表明各个变量之间的相关系数非常高,适合做因子分析,同时Sig.值为0.000<0.05,达到显著性水平,综上可以得出虚拟品牌社群价值量表适合做因子分析。 1.2虚拟品牌社群价值因子分析 通过KMO值和Bartlett球形检验可知,虚拟品牌社群价值适合做因子分析,运用主成分提取法进行因子旋转后得到以下数据,如:表4-4所示: 表4-4:虚拟品牌社群价值旋转因子负荷值

相关主题