搜档网
当前位置:搜档网 › 关于SPSS在教育统计中的应用

关于SPSS在教育统计中的应用

关于SPSS在教育统计中的应用
关于SPSS在教育统计中的应用

关于SPSS在教育统计中的应用

§1.统计处理在教育技术学研究中的作用

在科学研究活动中,要得出定量的结论,必须运用数学语言。

在现代,数学分析方法已广泛地应用到各门学科的科学研究之中,不仅在自然科学,而且在社会科学、思维科学都已普遍使用数学,处于计量化的过程,产生了计量社会学、计量历史学、计量地理学、教育统计学、教育测量学等新的计量科学。教育技术学量的研究,离不开计量化的处理,同时也需要作数学分析处理。

科学研究的计量化过程,经历过三个主要发展阶段,即从精确数学到随机数学,到现代的模糊数学。

1.经典的精确数学,如数学分析、微分方程,它是用于研究必然现象或确定性的关系,主要用于自然科学领域。

2.随机数学,如随机过程理论、数理统计,它是用来研究偶然现象,从纷乱的、大量的偶然现象中去探索必然的规律,在社会科学领域中得到广泛的应用。

3.模糊数学,如模糊集合论,它是用来研究非精确现象,现在广泛地应用于社会科学和思维科学领域。

教育技术学研究的对象是学习过程和学习资源,包含大量的偶然现象和非精确现象。因此,要深入研究教育技术现象及其规律,必须运用统计描述、统计分析方法和模糊数学分析方法,才可能使这门学科达到真正完善的地步。教育技术学研究的现象多数是偶然的现象,又称随机现象,其变化发展往往具有几种不同的可能性,究竟出现哪一种结果,那是带有偶然性的,是随机的。这类偶然现象是遵循统计规律的,当随机现象是由大量的成份组成,或者随机现象出现大量的次数时,就能体现统计平均规律。因此,我们对数据资料作统计处理,就可以发现它们的内在规律,掌握现象的特征,检验研究的假设。在教育技术学研究中,统计处理主要包括有统计分布的描述,特征量数的计算,相关关系的分析,数量标志的统计检验,品质标志的统计检验等。

一、统计处理为教育技术学研究中的量的分析提供了支持与保障

教育技术学研究资料统计处理的对象主要是来自试验或实验中的数据。当数据表现为分数或频数这样的数量形式时,研究者通常会用适当的统计方法进行数据分析。统计分析一般和实验、准实验、调查研究的数据结果处理相联系。我们通常采用的定性研究分析是伴随着研究活动的进程而不断展开的,它的分析主要依靠归纳,而且所得结果,不是统计结果,而是一种描述、说明、解释。虽然统计分析可适用于定性研究中的部分数据分析,但它们毕竟不是定性研究中分析的主要部分。统计分析主要还是为以得到数据结果的量的研究服务的,并且由于计算机工作站和个人计算机的使用,使量的研究变得特别方便。马克思主义哲学告诉我们,世间一切事物都具有质和量两种规定性。质是事物的内在规定性,它是一切事物区别于其他事物的依据,质与事物是“直接同一”的,而且这种内在的质,又可“表现于外”,即在与其他事物的关联中表现出各种各样的“属性或特征”。量是事物所固有的、反映事物存在与发展的量方面特性的规定性(例如规模、程度、水平、速度、关系、结构比例、效率等)。这种量方面的规定性虽是客观存在地,但它与事物不具有“直接同一性”,即同一事物的量允许在一定范围内变动,而其“质”不会改变。由于事物的质与量统一于一定的“度”中,人类对事物的认识必须首先获得一定的质的认识,然后在此基础上,需要进一步去考察量,以求得对事物的“质”有更清晰、更准确的把握。这是认识的深化与精细化。只要我们对事物的量的规定性尚未达到精确程度之前,对质的认识都只能说是粗略的、不彻底的。我们认为,教育技术学研究资料统计处理的存在意义是通过对教育现象总体进行量的研究,以“量的规定性”去认识“质的规定性”。

二、统计处理为教育技术学研究提供了大量的数据与资料

教育技术学研究资料统计处理技术,有机地结合了统计方法和统计软件及其在教育技术学研究中的应用。过去,有人将统计方法(尤其是高级统计方法)称为统计处理技术,但我们认为统计处理技术应当包括实现统计方法的数值计算和绘制图表的统计软件,以及使用这些统计软件的操作指令或操作步骤。要把教育技术学研究过程中所采用的统计方法一个不漏的表述出来,几乎是不可能的。我们只要花上足够的时间去浏览一下国外、国内教育科研中所用到的统计方法,就会发现其数量大的惊人。信息时代发展到今天,知识传输快捷,有了什么样的统计方法,便有人试图将之应用到教育的各个领域进行数据分析。实际上,新的统计方法问世后,教育技术学领域的研究者认为合适,就拿过来进行消化吸收,来处理本学科领域内的一些研究资料,并为研究过程提供大量科学可靠的数据分析以及资料展示,而这些数据与资料正是在教育技术学研究过程中必不可少的,通过研究这些数字或图表可以更好地促进教育技术学科正常而又迅速的发展。统计处理能为教育技术学研究提供了大量的数据与资料,这还体现在数据的准确性、完整性与系统性上。通常我们利用统计处理技术,去除原始数据中的无效信息,在分析统计结果的基础上,确定关于某个研究问题的一般属性和特殊属性,从而去证实或证伪一个假设。

§2.SPSS统计软件概述

在教育技术学研究中,常常需要对大量的数据进行统计处理,这是一项细致而繁琐的工作,如果完全依靠手工来进行,工作量较大,且难以保证准确性,也得不到高的精度。为了减轻整理和计算大量数据的负担,提高工作效率,我们必须充分利用现代化的技术手段。随着计算机软件技术的发展,计算机在分析数据方面发挥了相当大的作用,它功能多、速度快、计算精确、较易利用,并且计算机统计软件可以完成更为精确系统的数据分析与统计计算。在教育技术研究资料统计处理中常采用的统计软件有SPSS INC公司的SPSS统计软件系统、SAS统计分析系统和Microsoft公司的Excel软件等。SPSS是Statistics Package for Social Sciences(社会科学统计软件包)的缩写,它是社会科学研究人员首选的统计软件,也是目前世界上最流行的统计软件之一。因而被广泛应用于社会科学和自然科学的各个领域中。

一、SPSS统计软件概况

SPSS是专业的通用统计软件包,它是一个组合式软件包,兼有数据管理、统计分析、统计绘图和统计报表功能,界面友好,使用简单,广泛用于教育、心理、医学、市场、人口、保险等研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。SPSS对硬件系统的要求较低,普通配置的计算机都可以运行该软件;对运行的软件环境要求宽松,有各种版本可运行在WINDOWS 3X、9X、2000环境下,现在较新的10.0版可运行在WINDOWS 2000中(SPSS早期版本运行于DOS下,这里不再进行介绍,本节以SPSS 10.0版本为例介绍的该软件的使用)。SPSS 10.0有英文版和汉化版两种版本,可运行在中英文平台上。SPSS统计软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如Dbase,Excel,Lotus等)。它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又下含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。SPSS采用Sax Basic引擎,允许用户使用类Basic的语言编制脚本,在SPSS中运行用户自定义的过程,增强了SPSS 的功能。

二、SPSS 统计软件的功能特点

自1985年SPSS INC公司推出的SPSS/PC V1.0以来,SPSS的版本不断更新,软件功能不断完善,操作越来越简便,与其他软件的接口也越来越多。现在的SPSS for Windows具有以下几种功能。

(一)SPSS的数据编辑功能。在SPSS的数据编辑器窗口中,不仅可以对打开的数据文件进行增加、删除、复制、剪切和粘贴等常规操作,还可以对数据文件中的数据进行排序、转置、拆分、聚合、加权等操作,对多个数据文件可以根据变量或个案进行合并。可以根据需要把将要分析的变量集中到一个集合中,打开时只要指定打开该集合即可,而不必打开整个数据文件。

(二)表格的生成和编辑。利用SPSS可以生成数十种风格的表格,根据功能又可有一般表、多响应表和频数表等。利用专门的编辑窗口或直接在查看器中可以编辑所生成的表格。在SPSS的高版本中,统计成果多被归纳为表格和(或)图形的形式。

(三)图形的生成和编辑。利用SPSS可以生成数十种基本图和交互图。其中基本图包括条形图、线图、面积图、饼图、高低图、帕累托图、控制图、箱图、误差条图、散点图、直方图、P-P概率图、Q-Q 概率图、序列图和时间序列图等,有的基本图中又可进一步细分。交互图比基本图更漂亮,可有不同风格的二维、三维图。交互图包括条形交互图、点形交互图、线形交互图、带形交互图、饼形交互图、箱形交互图、误差条形交互图、直方交互图和散点交互图等。图形生成以后,可以进行编辑。

(四)与其他软件的联接。SPSS能打开Excel、DaBase、Foxbase、Lotus 1-2-3、Access、文本编辑器等生成的数据文件。SPSS生成的图形可以保存为多种图形格式。现在的SPSS软件支持OLE技术和ActiveX技术,使生成的表格或交互图对象可以与其他同样支持该技术的软件进行自动嵌入与链接。SPSS 还有内置的VBA客户语言,可以通过Visual Basic编程来控制SPSS。

(五)SPSS的统计功能。SPSS的统计功能是SPSS的核心部分,利用该软件,几乎可以完成所有的数理统计任务。具体来说,SPSS的基本统计功能包括:

三、利用SPSS进行统计处理的基本过程

SPSS功能强大,但操作简单,这一特点突出地体现在它统一而简单的使用流程中。SPSS进行统计处理的基本过程如图6-1所示:

其基本步骤如下:

(一)数据的录入。将数据以电子表格的方式输入到SPSS中,也可以从其它可转换的数据文件中读出数据。数据录入的工作分两个步骤,一是定义变量,二是录入变量值。

(二)数据的预分析。在原始数据录入完成后,要对数据进行必要的预分析,如数据分组、排序、分布图、平均数、标准差的描述等,以掌握数据的基本特点和基本情况,保证后续工作的有效性,也为确定应采用的统计检验方法提供依据。

(三)统计分析。按研究的要求和数据的情况确定统计分析方法,然后对数据进行统计分析。

(四)统计结果可视化。在统计过程进行完后,SPSS会自动生成一系列数据表,其中包含了统计处理产生的整套数据。为了能更形象地呈现数据,需要利用SPSS提供的图形生成工具将所得数据可视化。如前所述,SPSS提供了许多图形来进行数据的可视化处理,使用时可根据数据的特点和研究的需求来进行选择。

(五)保存和导出分析结果。数据结果生成完之后,则可将它以SPSS自带的数据格式进行存贮,同时也可利用SPSS的输出功能以常见的数据格式进行输出,以供其它系统使用。

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

研究生应用统计学论文

浅谈主成分分析在SPSS中的操作应用 题目:浅谈主成分分析在SPSS中的操作应用 姓名:王震宇 指导老师: 学号:

浅谈主成分分析在SPSS中的操作应用 摘要:在各个领域的科学研究中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。多变量大样本无疑会为科学研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性而增加了问题分析的复杂性,同时对分析带来不便。如果分别分析每个指标,分析又可能是孤立的,而不是综合的。盲目减少指标会损失很多信息,容易产生错误的结论。因此需要找到一个合理的方法,减少分析指标的同时,尽量减少原指标包含信息的损失,对所收集的资料作全面的分析。由于各变量间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息。主成分分析就是这样一种降维的方法。 关键词:spss 主成分分析统计学 (一)主分成分析原理 主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。 (二)主成分分析数学模型 F1=a12ZX1+a22ZX2……+a p2ZX p …… F p=a1m ZX1+a2m ZX2+……+a pm ZX p 其中a1i, a2i, ……,a pi(i=1,……,m)为X的协方差阵Σ的特征值多对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z 标准化]。 A=(a ij)p×m=(a1,a2,…a m,),Ra i=λi a i,R为相关系数矩阵,λi、a i是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 。 (三)在城市经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求出主成分。表1是从《中国统计年鉴2007》摘录的省会城市和计划单列市主要经济指标(2006年),其中样品数n=35,变量数p=5。

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

SPSS在统计学中的应用

SPSS基础之一:数据挖掘与统计学应用 数据挖掘与统计学应用数据挖掘与统计学应用基本框架一、关键词与摘要数据挖掘与统计应用之间关系数据挖掘的发展前景二、简介数据挖掘与统计学有着共同目标,但分析方法和性质不同三、统计学的性质统计学决不是数学的分支,而是一门独立学科统计分析是以样本推断总体,而数据挖掘使用的往往是总体数据统计应用和数据挖掘中模型的差别数据挖掘接触到的大量数据中的偶然因素可以使统计方法失效统计分析之前需要准备大量数据,以期得到确定的目的;数据挖掘往往已有数据库,而目的也是不确定的四、数据挖掘的性质什么是数据挖掘——不同学者对数据挖掘的定义目前数据挖掘的主要软件当前数据挖掘软件的特点当前的数据挖掘软件包中被用到的统计分析过程数据挖掘和计算机科学的联系在统计科学中萌芽,但随后绝大部分又被统计学忽略的方法领域——数据挖掘是否也会如此?五、讨论对数据挖掘的认识的误区数据挖掘与统计应用的前景一、关键词和摘要关键词:统计学数据挖掘知识发现摘要: 1、数据挖掘与统计应用之间关系统计学和数据挖掘有很多共同点,但与此同时它们也有很多差异。本文讨论了两门学科的性质,重点论述它们的异同。数据挖掘,顾名思义就是从大量的数据中挖掘出有用的信息。DM(数据挖掘)是揭示存在于数据里的模式及数据间的关系的学科,它强调对大量观测到的数据库的处理。它是涉及数据库管理,人工智能,机器学习,模式识别,及数据可视化等学科的边缘学科。用统计的观点看,它可以看成是通过计算机对大量的复杂数据集的自动探索性分析。目前对该学科的作用尽管有点夸大其词,但该领域对商业,工业,及科学研究都有极大的影响,且提供了大量的为促使新方法的发展而进行的研究工作。尽管数据挖掘和统计分析之间有明显的联系,但迄今为止大部分的数据挖掘方法都不是产生于统计学科。这篇文章对这一现象作了一些解释,并说明了为什么统计学家应该关注数据挖掘。统计学可能会对数据挖掘产生很大影响,但这可能要求统计学家们改变他们的一些基本思路及操作原则。 2、数据挖掘的发展前景随着计算机应用的越来越广泛,每年都要积累大量的数据,运用数据挖掘技术在这些数据当中我们可以找出“金子”来。数据挖掘技术主要又分成“关联规则”,“时间序列”“聚集”,“分类”,“估值”等这几类. 据国外专家预测,在今后的5—10年内,随着数据量的日益积累以及计算机的广泛应用,数据挖掘将在中国形成一个产业。2000年7月IDC发布了关于信息存取工具市场的报告,其中估计1999年的数据挖掘的市场大概是7.5亿美元,估计在下个5年内市场的年增长率(Compound Annual Growth Rate)为32.4%,其中亚太地区为26.6%,并且预测此市场在2002年时会达到22亿美元。二、简介数据挖掘与统计学有着共同目标,但分析方法和性质不同统计学和数据挖掘有着共同的目标:发现数据中的结构。事实上,由于它们的目标相似,一些人(尤其是统计学家)认为数据挖掘是统计学的分支。这是一个不切合实际的看法。因为数据挖掘还应用了其它领域的思想、工具和方法,尤其是计算机学科,例如数据库技术和机器学习,而且它所关注的某些领域和统计学家所关注的有很大不同。统计学和数据挖掘研究目标的重迭自然导致了迷惑。事实上,有时候还导致了反感。统计学有着正统的理论基础(尤其

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与S P S S的应用(第五版)》(薛薇) 课后练习答案 第10章SPSS的聚类分析 1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求: 1)根据凝聚状态表利用碎石图对聚类类数进行研究。 2)绘制聚类树形图,说明哪些省市聚在一起。 3)绘制各类的科研指标的均值对比图。 4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。 采用欧氏距离,组间平均链锁法 利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成4类。 步骤:分析→分类→系统聚类→按如下方式设置…… 结果: 凝聚计划 阶段 组合的集群 系数 首次出现阶段集群 下一个阶段集群 1 集群 2 集群 1 集群 2 1 26 30 328.189 0 0 2 2 26 29 638.295 1 0 7 3 20 25 1053.423 0 0 5 4 4 12 1209.922 0 0 15 5 8 20 1505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 30 1 2 293834.503 0 29 0 将系数复制下来后,在EXCEL中建立工作表。 选中数据列,点击“插入”菜单→拆线图……

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

《统计分析与SPSS的应用(第五版)》课后练习答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------ ;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 体重变化情况 产品类型 明显减轻无明显变化 第一种产品27 19 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value )和系统缺失值(System Missing

Value )。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值 示,如“0”、“9”、“99” 来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表 等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了 “?”。在变量视 图中 为一个圆 点 非法的字符,计算机就把其界定为缺失值,这时的数据标记 定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在 SPSS中指定变量的计算尺度? 图中 变量类型包括:数值型(身 )、定序型(受教育程度)以及定类型(性别)。在变量视 高 定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转 成SPSS数据文件,并在 换 SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见E xcel文件的后半部分) 【文件 (F)】【打开(O)】【数据(A) 】文件类型选“Excel(*.xls, ?)”,文件名选“居 民储蓄调查数据.xls”【打开】选中“从第一行数据读取变量名”,在“范围”中输入 “A1:Q283 ”【确定】在“变量视图”窗口,调整A1 变量的宽度,输入变量名标签和变 量值标签在主菜单窗口选定【文件 (F)】【保存】选择保存路径,保存类型为“sav”,文 件名为“居民储蓄调查数据”【保存】 . 8、现有股民投资状况调查的文本数据, 文件名为“股民投资数据.txt ”。其中各变量的含义 文件“股民投资数据.xls ”。请将该文本数据读入SPSS,并定义变量名标签和变量 和编码见 中涉 明。(注:本调查问卷 值标签。其中各变量取值为9 的均为用户缺失值,请加以定义说 略 。) 及多选项问题,以及多选项问题的编码等,可先忽 【文件 (F)】【打开文本数据(D) 】【数据 (A) 】文件类型选“Text(*.txt, ?)”, ?”中 文件名选“股民投资数据.txt”,【打开】在“您的文本文件与预定义的格式匹配吗 部”中选“是”,【下一步】在“第一 选“否”,【下一步】在“变量名称是否包括在文件的顶 个数据个案从哪个行号开始”中输入“2,”其他默认,【下一步】【下一步】在“数据格 ”【下一步】默认各选项,【完成】 式”中输入“字符串”,接着在弹出的窗口输入“4, 在主菜单窗口选定【文件(F)】【保存】选择保存路径,保存类型为“sav”,文件名 为“股民投资数据”【保存】 . 9、现有两个SPSS数据文件,分别名为“学生成绩一.sav”和“学生成绩二.sav”,存放了关于

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

应用统计学实验报告(spss软件)

我国31个省市自治区第三产业发展状况分析 (数据来源:中宏统计数据库)2010年31个省市第三产业增加值 一、因子分析 1.考察原有变量是否适合进行因子分析 为研究全国各地区第三产业的发展状况,现比较其第三产业增加值的差异性和相似性,收集到2010年全国31个省市自治区各类第三产业包括交通运输、仓储和邮政业,批发和零售业,住宿和餐饮业,金融业,房地产业及其他产业的年增产值数据。由于涉及的变量较多,直接进行地区间的比较分析非常繁琐,因此首先考虑采用因子分析方法减少变量个数,之后再进行比较和综合评价。 表1-1(a)原有变量的相关系数矩阵

由表1-1(a)可以看到,所有的相关系数都很高,各变量呈较强的线性关系,能够从中提取公因子,适合做因子分析。 表1-1(b)巴特利特球度检验和KMO检验 由表1(b)可知,巴特利特球度检验统计量的观测值为295.349,相应的概率p接近0,。如果显著性水平a为0.5,由于概率p小于显著性水平a,应拒绝零假设,认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.860,根据Kaiser给出了KMO度量标准可知原有变量适合进行因子分析。 2.提取因子 首先进行尝试性分析。根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取特征根值大于1的特征根。 表1-2(a)因子分析的初始解(一) 表1-2(a)显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,表明对原有6个变量如果采用主成分分析法提取所有特征根(6个),那么原有变量的所有方差都可被解释,变量的共同度均为1。第二列是在按指定提取条件提取特征根时的共同度。可以看到,所有变量的绝大部分信息(大于84%)可被因子解释,这些变量的共同度均较高,变量的信息丢失较少,只有交通运输这个变量的信息丢失较多(近20%),因此本次因子提取的总体效果不理想。 重新指定特征根的标准,指定提取两个因子,结果如下:

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

2017年秋教育统计学答案(20200627082742)

综合作业20170802 1. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个元素都有相同的机会(概率)被抽中, 这样的抽样方式称为( )(本题6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 2. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个样本量为 n 的样本都有相同的机会(概 率)被抽中,这样的抽样方式称为( )(本题6.0分) A 、简单随机抽样 3 B 、整群抽样 B c 、系统抽样(等距抽样) D 、分层抽样(类型抽样) B 、

学生答案:A 标准答案:D 解析: 得分:0 3. (单选题)从总体中抽取一个元素后,把这个元素放回到总 体中再抽取第二个元素,直至抽取n 个元素为止,这样的抽样方 法称为()(本题6.0分) 重复抽样 不重复抽样 整群抽样 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 4. (单选题)一个元素被抽中后不再放回总体, 然后再从所剩 下的元素中抽取第二个元素, 直至抽取n 个元素为止,这样的抽 样方法称为()(本题6.0分) B 、

3 A 、重复抽样 3 B 、不重复抽样 3 c 、整群抽样 d D 、 分层抽样(类型抽样) 学生答案:B 标准答案:B 解析: 得分:6 5. (单选题)在抽样之前先将总体的元素划分为若干类,然后 为()(本题 6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:D 标准答案:D 解析: 得分:6 从各类中抽取一定数量的元素组成一个样本, 这样的抽样方式称 B 、

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

Spss统计分析论文 (2)

SPSS在铁路春运客流调查中的应用 摘要:本文在对南昌站2005年春运客流状况的问卷抽样调查的基础上,利用SPSS软件提供的交叉列联、多选项、对应分析等功能,对调查数据进行了实证研究。选择乘车目的、购票途径、出行考虑等因素、客流流向等问卷的代表性项目进行统计分析,得到南昌站春运客流相关因素的关系,为改善运输组织和提高服务质量提供依据。 关键词:铁路,春运,客流,SPSS,分析 每年春运客流的构成和流向等信息对铁路部门的运输组织具有重要意义。南昌站作为京九线上重要的客运站,每年春运都承担着较大的旅客发送任务,对车站的春运客流状况进行调查,有助于更好地进行春运组织。为了尽量客观真实地了解南昌站的春运客流状况,分析各相关因素的关系,在对南昌站2005年春运客流状况的问卷抽样调查的基础上,利用SPSS (Statistical Product and Service Solutions)软件提供的统计功能(主要是交叉列联、多选项、对应分析)对问卷数据进行了较深入的分析,希望能为改善铁路运输组织和提高服务质量提供依据。 1 抽样调查基本情况 1.1 调查时间和对象 抽样调查每天进行一次。每天上午、下午和晚上在每个候车室各发放10份问卷,即每天每个候车室30份问卷。调查对象为由南昌站乘火车前往其他地区的旅客。

1.2 抽样方法 本次抽样调查采用分层、等距抽样设计,即首先依照候车室分层,在候车室内按照候车区域再分层。分层完毕后,在调查期间每天某时由调查员进入候车室进行随机抽样。在每个候车区域随机选定一组候车旅客,每隔一固定数目等距抽取一名旅客,直到满足样本量为止。 1.3 调查项目 考虑到南昌站春运客流较为集中,旅客密集且流动性大,在问卷中采用封闭性答题形式,以方便被调查人快速、准确地完成调查。 (1)您乘车的目的:包括外出工作,探亲,旅游,学生返校。 (2)您的出行方向:包括北京方向(内蒙/北京/东北/合肥等);上海方向(杭州/宁波/南京/温州/苏州等);福建方向(福州/厦门等);成都方向(重庆/成都/柳州/贵州/昆明等);广东方向(东莞/广州/深圳等):武汉方向(武汉/长沙/郑州等);其他方向。 (3)您春节出行优先考虑的因素:包括安全;票价;舒适;快捷;能走就行。 (4)您对列车席位种类的选择:包括普通硬座;普通硬卧;空调硬座;空调硬卧;软座;软卧;其他。 (5)选择临时加开列车时,您考虑的因素(可多选):包括有空调,票价便宜,到达或开车时间;乘车时间:有卧铺:乘车环境及服务。

教育统计学答案

(0282)《教育统计学》复习思考题答案 一、填空题 1. 统计学是研究统计原理和方法的科学。 2.我们所研究的具有某种共同特性的个体总和称为总体。 3.一般情况下,大样本是指样本容量超过30 的样本。 4.表示总体的数字特征的特征量称为参数。 5.要了解一组数据的集中趋势,需计算该组数据的集中量。 6. “65、69、72、87、89”这组数据的算术平均数是76.4 。 7. “78、69、53、77、54”这组数据的中位数是69 。 8. 6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是145厘米。 9. 要了解一组数据的差异程度,需计算该组数据的差异量。 10.有7个学生的语文成绩分别为:80、65、95、70、55、87、69分,他们的全距是40分。 11.若某班学生数学成绩的标准差是5分,平均分是85分,其差异系数是5.88% 。 12.比较某班学生在身高和体重两方面的差异程度,要把学生身高和体重的标准差转化为差异系数。 13.两个变量之间不精确、不稳定的变化关系称为相关关系。 14.要描述两个变量之间变化方向及密切程度,需要计算相关系数。 15. 若两个变量之间存在正相关,则它们的相关系数是正数。 16.若两个变量之间的相关系数是负数,则它们之间存在负相关。 17.质与量的相关分析的方法主要包括二列相关、点二列相关和多系列相关。 18.品质相关的分析方法包括四分相关、Φ相关和列联相关。 20. 某班50个学生中有30个女生,若随机抽取一个同学,抽到男生的概率是2/5。 21.某一种统计量的概率分布称为抽样分布。 22.平均数差异显著性检验中需要判断两个样本是相关样本还是独立样本。 23. 单纯随机抽样能保证抽样的随机性和独立性。 24. χ2检验的数据资料是点计数据。 25. 单向表是把实测的点计数据按一种分类标准编制而得的表。 26. 单向表χ2检验是对单向表的数据进行χ2检验,即单因素的χ2检验。 27. 双向表是把实测的点计数据按两种分类标准编制而得的表。 28. 双向表χ2检验是对双向表的数据进行的χ2检验,即双因素的χ2检验。 29.假设检验的方法包括参数检验和非参数检验。 30.符号秩次检验属于非参数检验。 31.标准正态曲线在Z=0处为最高点。 32.直条图是表示间断变量的统计图。 33.直方图是表示连续变量的统计图。 34.教育统计资料的来源主要是经常性资料和专题性资料。 35.教育调查从范围来看,可分为全面调查和非全面调查。 36.对数据进行统计分类的标志按照形式可分为性质类别和数量类别。 二、简述题 1.简述教育统计学的研究对象和内容。 教育统计学的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

(完整版)多元回归分析中变量的选择——SPSS的应用毕业论文

毕业论文 题目多元回归分析中的变量选取 ——SPSS的应用 院(系)数学与统计学院 专业年级 2010级统计学 指导教师职称副教授

多元回归分析中的变量选取——SPSS的应用 殷婷 摘要 本文不仅对于复杂的统计计算通过常用的计算机应用软件SPSS来实现,同时通过对两组数据的实证分析,来研究统计学中多元回归分析中的变量选取,让大家对统计中的多元回归数据的选取和操作方法有更深层次的了解。一组数据是对于淘宝交易额的未来发展趋势的研究,一组数据时对于我国财政收入的研究。本文通过两个实证从不同程度上对数据选取的研究运用通俗的语言和浅显的描述将SPSS在多元回归分析中的统计分析方法呈现在大家面前,让大家对多元回归分析以及SPSS软件都可以有更深一步的了解。通过SPSS软件对数据进行分析,对数据进行处理的方法进行总结,找出SPSS对于数据处理和分析的优缺点,最后得在对变量的选取和软件的操作提出建议。 关键词:统计学 SPSS 变量的选取多元回归分析 Abstract

In this paper, not only for complex statistical calculations done by the commonly used computer application software of SPSS, through the empirical analysis of the two groups of data at the same time, to study the statistics of the variables in the multivariate regression analysis, let everybody to select multiple regression in statistical data and operation methods have a deeper understanding. Is a set of data for the future development trend of taobao transactions of research, a set of data for the research of our country's financial income. In this paper, through two empirical to select data from different extent research using a common language and plain the SPSS statistical analysis method in multiple regression analysis of present in front of everyone, let everyone to multiple regression analysis and SPSS software can have a deeper understanding. Through the SPSS software to analyze data, and summarizes method of data processing, find out the advantages and disadvantages of SPSS for data processing and analysis, finally had to put forward the proposal to the operation of the selection of variables and software. Keywords: Statistical SPSS The selection of variables multiple regression analysis 目录 摘要 (1) 英文摘要 (1) 引言 (3) 第一章回归分析 (3) 1.1自变量的选择 (4)

相关主题