搜档网
当前位置:搜档网 › 第四章 非参数检验(SPSS v 16.0)

第四章 非参数检验(SPSS v 16.0)

第四章非参数检验

非参数检验(non-parametric test)

卡方检验(test)、

Runs 检验(Runs test)、

Kolmogorov-Smirnov 单样本检验(Kolmogorov-Smirnov one-sample test)、

Mann-Whitney 等级和检验(Mann-Whitney rank-sum test)、

符号检验(sign test)、

Wilcoson 配对符号等级检验(Wilcoson matched-pairs signed-ranks test)、

Fridman 单因素方差分析(Fridman one-way analysis of variance)

多样本中数检验(K-sample median test)。

一、卡方检验

检验(也叫做Pearson Chi-Square test):配合度检验(the test of goodness of fit)和独立性检验(independence test)。

(一)配合度检验

配合度检验: 推断某变量不同取值观测分数的频数和对应的期望频数(expected frequency)是否有显著性差异。

作零假设:f0=f e

f0和f e分别为变量的每个水平的观测频数和期望频数。

配合度检验的自由度为:N-1,N为变量水平数。

【配合度检验·例】

配合度检验实际上是检验某变量的不同水平值的观测分数频率的分布是否服从某种期望或者理论分布。

某研究者进行了一次问卷调查。调查对象是300 名高中三年级学生;调查目的是考查学生对英语学习兴趣的自我评价:你对英语的学习兴趣□ 很浓、□ 较浓、□ 一般、□ 有点和□ 没有。获得原始数据如表4-1 所示。似乎较多人认为自己对英语的学习兴趣一般,较少人认为自己英语学习兴趣浓厚或没有兴趣。

该研究者想通过卡方分析证明:①对英语学习有不同兴趣的学生人数不均等和②其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近1:4:8:4:2。

表4-1 300 名学生对英语学习兴趣调查题目的反馈*

学生编号兴趣

001 2

002 3

003 5

……

300 3

* 英语学习兴趣很浓、较浓、一般、有点和没有5 个等级分别以数字5、4、3、2 和1 表示。

①对英语学习有不同兴趣的学生人数不均等。

〖操作〗ChiSqrQStdntRspns.sav 。执行 Analyze → Non-parametric Tests → Chi-Square ,系统将弹出卡方

检验主窗口(Chi-Square Test ),如图 4-1 所示。点击左侧变量列表中的

,点击

将出现在

下方的分析变量列表中,如图 4-1-1 所示。选中

标签下的

,以达到检验零假设(各水平的观测频数均等)的目的,如图 4-1-1 所示。点击

图 4-1 卡方检验设置朱主窗口 1 图 4-1-1 卡方检验设置朱主窗口2

〖结果与解释〗

【结果报告】

卡方检验表明,不同英语学习兴趣的学生人数不均等,200.1292

(4) X ,p <0.001。 如果没有原始数据表,但是,已知 300 个有效调查对象中分别有 18、62、132、56和 32 个学生分别选择了很浓、较浓、一般、有点和没有,那么,造 SPSS 表格如表 4-1-2 所示,保存为 ChiSqrQStdntRspns-20.sav 。对于表 4-2-2 中变量兴趣的各个分数,最初系统只能看作一般的数字,并不代表兴趣不同水平值的观测频数,所以,需要对兴趣进行频数加权处理。数据经加权处理后,操作同上。

② 其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近 1:4:8:4:2。 〖操作〗兴趣各水平值的观测频率比为 1:4:8:4:2。打开 ChiSqrQStdntRspns.sav 。除以下方面之外,操作

同上:选中

标签下的

而不是

。然后,按照兴趣的 5 个

变量水平比例 1:4:8:4:2 中的数字,在

右侧的

中输入数字 1,点击

下面激活了的

,如图 4-1-2 所示。依次输入数字 1、4、8、4、2,如图 4-1-3 所示。

图 4-1-2 卡方检验:兴趣各分数频数分布是否

服从某一定比例设置窗口 1 图 4-1-3 卡方检验:兴趣各分数频数分布是否

服从某一定比例设置窗口 2

点击

,获得结果如下。

〖结果与解释〗

【结果报告】

卡方检验表明,学生英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近 1:4:8:4:2,403.12

(4) X ,p >0.10。

(二)独立性检验

独立性检验是指对于两个水平数有限的变量,根据各变量水平的分数的频数,检验它们是否相互独立(independent)。

对于独立性检验,作零假设:两个变量相互独立。

独立性检验的自由度为:(N1-1)*(N2-1),N1和N2分别为第一个变量和第二个变量的水平数。

对于两个变量都只有2 个水平的情况,效应大小为:ф=。

两个变量中如果有一个变量的水平数大于2,则效应大小为:

Cramer’sф=,N为总观测数,df smaller为水平数较小的那个变量的水平

数减1。

如果要在0.05 显著性水平下达到80% 的统计功效,那么,效应大小等级、自由度和总观测数的关系如表4-2 所示。

表4-2 在0.05 显著性水平下达到80% 的统计功效的组间自由度、效应大小和总观测数的关系

自由度效应大小总观测数

1 小(0.10)785 中(0.30)87 大(0.50)26

2 小(0.10)964 中(0.30)107 大(0.50)39

3 小(0.10)1090 中(0.30)121 大(0.50)44

4 小(0.10)1194 中(0.30)133 大(0.50)48

【独立性检验·例】

独立性检验也叫联列表分析(cross-tabulation)。如,对某聋校2、4 和6 年级聋生经常佩戴助听器情况进行了一次随机调查,结果如表4-3 所示。不同年级聋生佩戴助听器情况有显著性差异吗?

表4-3 某校2、4 和 6 年级聋生佩戴助听器人数

聋生年级经常不佩戴助听器经常佩戴助听器

2 6 23

4 30 14

6 8 3

表4-3-1 某校2、4 和 6 年级聋生佩戴助听器人数的SPSS 表格结构*

*“Grd”代表学生年级,其3 个水平“2”、“4”、“6”分别以“1”、“2”、“3”表示;“HrngAidStt”代表学生经常佩戴助听器情况,“1”表示经常不佩戴助听器,“2”表示经常佩戴助听器;“Nmbr”代表人数。

〖操作〗ChiSqrQHrngAid.sav。首先对变量Nmbr 进行频数加权。然后,执行Analyze → Descriptive Statistics → Crosstabs,系统将弹出联列表分析主窗口(Crosstabs),如图4-2 所示。点击左侧变量列表中

的,点击,使列在标签下。点击左侧变量列表中的,点击,

使列在标签下,如图4-2-1 所示。

图4-2 联列表分析主窗口1 图4-2-1 联列表分析主窗口2

点击按钮,系统将弹出联列标分析统计量设定窗口,如图4-2-2 所示,选定

和,如图4-2-3 所示。如此设置,结果中将显示卡方检验函数值和效应大小。点击

,退出统计量设定窗口。

图4-2-2 联列表分析:统计量设定子窗口1 图4-2-3 联列表分析:统计量设定子窗口2 〖结果与解释〗

【结果报告】

卡方检验表明,不同年级聋生佩戴助听器情况有显著性差异,,Cramer’s ф=0.462。

不论对于配合度检验还是独立性检验,单元格期望频数最好大于10,不要小于5,如果有25% 的单元格的期望频数小于5,那么,值的效度就不可信。

二、其他非参数检验

(一)Runs 检验

如果一个变量只有两个水平,并对该变量测量获得一个分数序列。使用Runs 检验可以判断该分数序列中不同变量水平的分数是否无序分布。

【Runs 检验·例】

有90 名学生,而且,男生多女生少。在一次英语口语考试中,任课教师安排学生先后参加考试的不同性别顺序如下:

女、女、男、男、男、男、女、男、女、男、男、女、女、男、女、男、女、女、女、女、男、男、男、男、女、男、男、男、男、女、男、男、女、男、男、男、女、男、男、女、男、男、男、女、男、女、男、男、男、男、男、男、女、男、男、男、男、女、男、男、女、男、男、女、女、女、女、女、男、男、女、女、女、女、男、女、男、男、女、男、男、女、女、男、男、男、男、女、女、男。

问该性别排序是否符合随机要求。

表4-4 男女生性别排序的SPSS 表格结构*

*“1”和“2”分别代表男生和女生。

〖操作〗Non-Parametric6.sav。执行Analyze → Non-parametric Tests →Runs …,系统将弹出Runs 检验

主窗口(Runs Tests),如图4-3 所示。在左侧变量名列表中选中,点击,把移动到

下边的检验变量列表中。在标签下边的统计方法选项中,去掉系统

的默认选项,选中,并在其右边的输入框中输入变量的水平数2,如图4-3-1所示。点击。

图4-3 Runs 检验设置窗口1 图4-3-1 Runs 检验设置窗口2

〖结果与解释〗

【结果报告】

男女性别顺序有统计意义上的随机性,Z=-0.044,p>0.10。

(二)Kolmogorov-Smirnov 单样本检验

Kolmogorov-Smirnov 单样本检验用于检验一组分数是否服从正态分布或者其他理论分布。

【Kolmogorov-Smirnov 单样本检验·例】

假如有一个分数选列:

14、26、21、24、10、18、24、28、15、27、20、22、20、24、19、22、21、20、21、29、16、20、

26、29、23、5、17、21、28、21、29、24、13、24、5。

问该分数序列是否服从正态分布。

表4-5 分数序列的SPSS 表格结构

〖操作〗Non-Parametric7.sav。执行Analyze → Non-parametric Tests → 1-Sample K-S,系统将弹出Kolmogorov-Smirnov 单样本检验主窗口(One Samples Kolmogorov-Smirnov Test),如图4-4 所示。在左侧

变量名列表中选中,点击上边的,把移动到下边的检验变量列表

中。在标签下边的统计方法选项中,保持系统的默认选项,设定当前的目标

检验分布为正态分布,如图4-4-1 所示。点击。

图4-4 Kolmogorov-Smirnov 单样本检验设置

窗口1 图4-4-1 Kolmogorov-Smirnov 单样本检验设置窗口2

〖结果与解释〗

【结果报告】

Kolmogorov-Smirnov 分布检验,该分数序列与正态分布没有显著性差异,K-S Z=-0.975,p>0.10。

(三)Mann-Whitney 等级和检验

【Mann-Whitney 等级和检验·例1】

某教师对其任课班级进行了一次课程考试,由于题目较难,全班学生的分数都比较低,但是,该教师认为考试分数反映了不同学生的相对水平,因此,他对全部同学的实际分数进行了排序,并企图从学生分数的相对高低来判断不同宿舍学生之间学习成绩是否有显著差异。其中,甲乙两个宿舍学生在全班的分数排序情况如表4-6 所示。问甲乙两宿舍同学之间的考试成绩是否有显著差异。

表4-6 甲乙两宿舍同学之间的考试成绩在全班中的排名

学生宿舍成绩名次

甲 3

乙 2

乙15

……

甲23

表4-6-1 甲乙两宿舍同学之间的考试成绩在全班中的排名的SPSS 表格结构

〖操作〗Non-Parametric1.sav。执行Analyze → Non-parametric Tests → 2-Independent Samples,系统将弹

出等级分数两独立样本检验主窗口(Two-Independent-Samples Tests),如图4-5 所示。和独立样本平均数t

检验的情况类似,在左侧变量名列表中选中

,点击上边的

,把

移动到

下边的检验变量列表中;选中

,点击下边的

,把

移动到

下边的分组变量框中,如图4-5-1 所示。

图4-5 Mann-Whitney 等级和检验设置窗口1 图4-5-1 Mann-Whitney 等级和检验设置窗口

图4-5-2 Mann-Whitney 等级和检验分组设置

子窗口1图4-5-3 Mann-Whitney 等级和检验分组设置子窗口2

〖结果与解释〗

【结果报告】

Mann-Whitney 等级和检验表明,宿舍5 和宿舍6 的学生之间的成绩排名差异不显著,Z=-0.980,p>0.10。

当然,对服从正态分布的分数也可以进行Mann-Whitney 等级和检验,只是检验结果不如独立样本平均数t检验精确。我们不妨对两组可以进行独立样本平均数t检验的分数也作Mann-Whitney 等级和检验,比较一下这两种检验的结果。

【Mann-Whitney 等级和检验·例2】

甲乙两个班级同时参加同一学科考试,成绩如表4-7 所示。问甲乙两班学生的成绩是否显著差异,两个班的学生成绩排名是否有显著差异。

表4-7 甲乙两班同学的考试成绩

班级分数

甲63

乙64

乙66

……

甲94

表4-7-1 甲乙两班同学考试成绩的SPSS 表格结构

〖操作〗独立样本平均数t检验。Non-Parametric2.sav,对分数进行独立样本平均数t检验。

〖结果与解释〗

Mann-Whitney 等级和检验。获得如下结果:

(四)符号检验

【符号检验·例】

假若有两组配对分数,如表4-8 所示。请通过符号检验判断这两组分数之间的差异情况。

表4-8 两组配对分数

分数1 分数2

64.0 36.0

66.0 37.0

50.0 69.0

……

98.0 94.0

表4-8-1 两组配对分数的SPSS 表格结构

〖操作〗signTest1.sav。执行Analyze → Non-parametric Tests → 2-Related Samples,系统将弹出符号检验主窗口(Two-Related-Samples Tests),如图4-6 所示。和配对样本平均数t检验的情况类似,在左侧变量

名列表中选中和,点击,把和移动到下边的检验变量

对列表中。在标签下边的统计方法选项中,去掉的默认选项而选中,如图

4-6-1 所示。点击。

图4-6 符号检验设置窗口1 图4-6-1 符号检验设置窗口2

〖结果与解释〗

【结果报告】

符号检验表明,两组分数之间的差异没有达到显著性水平,Z=0.000,p=1.000。(五)Wilcoson 配对符号等级检验

【Wilcoson 配对符号等级检验·例】

使用符号检验的数据举例同【符号检验·例】。

〖操作〗signTest1.sav。执行Analyze → Non-parametric Tests → 2-Related Samples,在两个相关样本检验

主窗口,保留标签 下边的系统的默认选项 ,其它同符号检验。点击 。

〖结果与解释〗

【结果报告】

Wilcoson 配对符号等级检验表明,两组分数之间的差异没有达到显著性水平,Z =-1.106,p >0.10。

(六)Fridman 单因素方差分析 【Fridman 单因素方差分析·例】

某班只有 10 人,其某次英语考试中 3 个满分为 10 分的大题的分数如表 4-9 所示。问该班的 3 个题目的分数是否有显著差异。

表 4-9 某班英语考试中 3 个大题的分数 序号 大题 1 大题 2 大题 3 1 7.0 9.0 6.0 2 7.0 6.0 9.0 3 10.0 9.0 7.0 ... ... ... (10)

9.0

8.0

7.0

表 4-9-1 某班英语考试中 3 个大题的分数的 SPSS 表格结构

〖操作〗Non-Parametric4.sav 。执行 Analyze → Non-parametric Tests → K-Related Samples ,系统将弹出多

个相关样本检验主窗口(Tests for Several Related Samples ),如图 4-7 所示。在左侧变量名列表中选中

、和

,点击

,把这三个变量名都移动到

下边的检验变量对列

表中。保留标签 下边系统的默认选项 ,如图 4-7-1 所示。点击

图4-7 Fridman 单因素方差分析设置窗口1 图4-7-1 Fridman 单因素方差分析设置窗口2 〖结果与解释〗

【结果报告】

Fridman 单因素方差分析表明,该班3 个大题的得分之间没有显著差异,

Chi-Square=2.595,p>0.10。

(七)多样本中数检验

【多样本中数检验·例】

假如A、B、C 三个班的一次英语口语考试成绩,如表4-10 所示。问3 个班的英语口语考试分数是否有显著差异。

表4-10 A、B、C 三个班英语口语考试分数

A 班序号 A 班分数

B 班序号 B 班分数

C 班序号 C 班分数

1 7.0 1 9.0 1 6.0

2 7.0 2 6.0 2 9.0

3 10.0 3 9.0 3 7.0

………………

10 9 10 8 10 7

表4-10-1 A、B、C 三个班英语口语考试分数的SPSS 表格结构

注:“班级”的水平值“1”、“2”和“3”分别班级A、B 和C。

〖操作〗Non-Parametric5.sav。执行Analyze → Non-parametric Tests → K Independent Samples,系统将弹出多个独立样本检验主窗口(Tests for Several Independent Samples),如图4-8 所示。在左侧变量名列表中

选中,点击上边的,把移动到下边的检验变量对列表中。点击

,点击下边的,把移动到下边的分数分组设置变量框中,如图4-8-1 所示。

图4-8 多样本中数检验设置窗口1 图4-8-1 多样本中数检验设置窗口2

图4-8-2 多样本中数检验分组设置子窗口1图4-8-3 多样本中数检验分组设置子窗口2〖结果与解释〗

【结果报告】

多样本中数检验分析表明,A、B、C 三个班英语口语考试分数之间差异不显著,

Chi-Square=0.268,p>0.10。

第四章假设检验

第四章假设检验 参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。共同点:都是利用样本信息对总体数量特征进行推断。不同点:推断的角度不同 4.1 假设检验的基本问题 1、假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程; 包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。 2、小概率事件——若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)≤0.05。 3、原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为H0。总是有 符号=、≤或 ≥ 备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为H1。总是有符号≠、<或> 4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立; 先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定; 等号“=”总是放在原假设上; 因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。 假设检验主要是搜集证据来推翻和拒绝原假设。 5、双侧检验——是指备择假设没有特定的方向性,并含有符号≠的假设检验,又称为双尾检 验。 单侧检验——是指备择假设具有特定的方向性,并含有符号>或<的假设检验,又称为单尾检验。 6、第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设。第Ⅰ类错误的概率记为α,又被称为显著性水平。 又称为显著性水平,常被用于检验结论的可靠性度量; 既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第Ⅰ类错误概率的最大允许值);常用的α 值有0.01,0.05,0.10;由研究者事先确定。 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设。第Ⅱ类错误的概率记为β。

第七章 非参数检验习题 医学统计学习题

第七章非参数检验习题 一、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说()。 A.正秩和与负秩和的绝对值不会相差很大B.正秩和与负秩和的绝对值相等C.正秩和与负秩和的绝对值相差很大D.不能得出结论 E.以上都不对 2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是()。 A.把1X 和2X 的差数从小到大排序B.分别按1X 和2X 从小到大排序C.把1X 和2X 综合从小到大排序D.把1X 和2X 的和数从小到大排序E.把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点()。 A.不受总体分布的限制B.适用于等级资料C.适用于未知分布型资料 D.适用于正态分布资料 E.适用于分布呈明显偏态的资料4.等级资料的比较宜采用()。A.秩和检验 B.F 检验 C.t 检验 D.2 检验 E.u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的()。 A.两样本均数相同 B.两样本的中位数相同C.两样本对应的总体均数相同D.两样本对应的总体分布相同 E.两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是()。 A.Friedman 检验B.符号检验C.Kruskal-Wallis 检验 D.Wilcoxon 检验 E.t 检验 7.成组设计两样本比较的秩和检验中,描述不正确的是()。 A.将两组数据统一由小到大编秩 B.遇有相同数据,若在同一组,按顺序编秩C.遇有相同数据,若不在同一组,按顺序编秩D.遇有相同数据,若不在同一组,取其平均值 E.遇有相同数据,若在同一组,取平均致词 二、简答题 1.简要回答进行非参数统计检验的适用条件。2.你学过哪些设计的秩和检验,各有什么用途?3.试写出非参数统计方法的主要有缺点。三、计算题 1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析 2011-09-19 15:09 最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K个独立样本检验( Kruskal-Wallis检验)。 还是以SPSS教程为例: 假设:HO: 不同地区的儿童,身高分布是相同的 H1:不同地区的儿童,身高分布是不同的 不同地区儿童身高样本数据如下所示: 提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个 即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的分布,

(即指:卡方检验) 点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面: 将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。 在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定 运行结果如下所示:

对结果进行分析如下: 1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900 自由度为:3=k-1=4-1 下面来看看“秩和统计量”的计算过程,如下所示: 假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数) 最后得到的公式为: 北京地区的“秩和”为:秩平均*观察数(N) = 14.4*5=72 上海地区的“秩和”为:8.2*5=41 成都地区的“秩和”为:15.8*5=79 广州地区的“秩和”为:3.6*5=18

病理生理学考试-- 病理生理学考试--第七章 非参数检验(答案)

第七章 非参数检验(答案) 一、选择题 1.A 2.E 3.D 4.A 5.D 6.E 7.C 二、简答题 1.答:(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能。 2. 答:(1)配对设计的符号秩和检验(Wilcoxon 配对法)是推断其差值是否来自中位数为零的总体的方法,可用于配对设计差值的比较和单一样本与总体中位数的比较;(2)成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)用于完全随机设计的两个样本的比较,目的是推断两样本分别代表的总体分布是否吸纳共同。(3)成组设计多样本比较的秩和检验(Kruskal-Wallis 检验),用于完全随机设计的多个样本的比较,目的是推断两样本分别代表的总体的分布有无差别。(4)随机区组设计资料的秩和检验(Friedman 检验),用于配伍组设计资料的比较。 3. 答:优点:(1)适用范围广,不受总体分布的限制;(2)对数据的要求不严;(3)方法简便,易于理解和掌握。 缺点:如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低于非参数检验;若要使检验效能相同,往往需要更大的样本含量。 三、 计算题 1.解: (1)建立检验假设,确定检验水准 0H :用方法一和方法二测得乳酸脱氢酶含量的差值的总体中位数为零,即0d M = 1H :0d M ≠ 0.05α= (2)计算检验统计量T 值 ①求各对的差值 见表7-4第(4)栏。 ②编秩 见表7-4第(5)栏。 ③求秩和并确定统计量T 。 5.5T += 30.5T -= 取 5.5T =。 (3)确定P 值,做出推断结论 本例中8n =, 5.5T =,查附表T 界值表,得双侧0.05P <;按照0.05α=检验水准,拒绝0H ,接受1H 。认为用方法一和方法二测得乳酸脱氢酶含量差别有统计学意义。 表7-4 8份血清用原法和新法测血清乳酸脱氢酶(U/L )的比较 编号 原法 新法 差值d 秩次 (1) (2) (3) (4)=(2)—(3) (5) 1 100 120 -20 -8 2 121 130 -9 -5 3 220 225 -5 -3.5 4 186 200 -14 -6

第5章spss的参数检验(课后练习参考)

SPSS的参数检验 1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。 步骤:依题目录入数据,采用单样本T检验(原假设H0:u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:分析——比较均值——单样本T检验;指定检验值:在“检验值”后的框中输入检验值(填75),最后“确定”!分析:N=11人的平均值(mean)为,标准差()为,均值标准误差(std error mean)为统计量观测值为,t统计量观测值的双尾概率p-值(sig.(2-tailed))为,六七列是总体均值与原假设值差的95%的置信区间,为,,由此采用双尾检验比较a和p。T统计量观测值的双尾概率p-值(sig.(2-tailed))为>a=所以不能拒绝原假设;且总体均值的95%的置信区间为,,所以均值在~内,75包括在置信区间内,所以经理的话是可信的。 2、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。然而心理学家则倾向于认为提出事实的方式是有关系的。为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。 l 方式一:假设你已经买了100元一张的足球票,当你来到足球场门口时,发现票丢了且再也找不到了。球场还有票出售。你会再掏出100元买一张球票吗(1.买 0.不买)。随机访问了200人,其中:92人回答买; l 方式二:你想看足球赛,100元一张票。当你来到足球场买票时,发现丢了100元钱。你口袋中还有钱,此时你还会付100元买一张球票吗(1.买 0.不买)。随机访问了183人,其中:161人回答买; 请恰当建立SPSS数据文件,并利用本章所学习的参数检验方法,说明你更倾向于那种观点,为什么 步骤:菜单选项:分析——比较均值——独立样本T检验;选择若干变量作为检验变量到“检验变量”框(填TD态度);选择代表不同总体的变量(FS方式)作为分组变量到“分组变量”框;定义分组变量的分组情况“定义组”……:(填1,2)。分析:从分析结果上可以

第4章非参数检验作业

第四章非参数检验 1.为研究心脏病人猝死人数与日期的关系,收集了168个观察数据,见数据文件“非参数检验(心脏病猝死).sav”,其中:用1、2、3、4、5、6、7表示是星期几死的。现利用这批数据,推断心脏病人猝死人数与日期的关系是否是: 2.8:1:1:1:1:1:1.,使用总体分布的卡方检验方法进行检验。 解:取显著性水平为0.05(题设未给出) H0:心脏病人猝死人数与日期的关系是:2.8:1:1:1:1:1:1. H1:心脏病人猝死人数与日期的关系不是:2.8:1:1:1:1:1:1. 操作步骤:

结果:

由SPSS输出结果可知, P=0.256,大于显著性水平0.05,不能拒绝原假设。 2.为验证某批产品的合格品率是否达到90%,现从该批产品中随机抽取23个样品进行检验,得到最后的检测结果数据,见数据文件“非参数检验(产品合格率).sav”,其中:1表示一级品,0表示非一级品。使用二项分布检验方法检验一级品率为90%. 解: H0:这批产品一级品率的分布符合二项分布(p=90%) H1:这批产品一级品率的分布不符合二项分布(p=90%) 设显著性水平为0.05. 首先读入数据文件“非参数检验(产品合格率).sav”,选择非参数检验的二 项分布检验,并将检验比例设置为0.90。如下图所示。

得到结果如下: 从图中的分析结果我们可以看到P值为0.193>0.05,因此我们不拒绝原假设,可以认为这批产品合格品率达到90% 3.收集到21个关于周岁儿童身高的样本数据,见数据文件“非参数检验(单样本KS-儿童身高).sav”,试利用K-S方法检验周岁儿童的身高是否服从正态分

第10章__非参数检验

第10章非参数检验 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission 分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法

SPSS的参数检验

第7章 SPSS 的参数检验 7-1 统计推断的基本方法 一、统计推断的概念 1、定义:根据已经收集到的样本数据,推断样本来自的总体的分布或总体均值、方差等总体参数。 2、统计推断的原因 (1)总体数据无法全部收集到 如:企业里面的质量检验 (2)收集总体数据的成本很高 3、两种类型(对于小样本而言) (1)假设总体分布已知——参数检验 (2)总体分布未知——非参数检验 二、统计推断的基本方法 1、步骤 (1)根据推断检验的目标,对待推断的总体参数或分不做一个基本假设H 0 (2)利用收集到的数据和基本假设计算某检验统计量,该统计量服从或近似服从某种统计分布。 (3)根据该统计量得到的相伴概率值,该值是该统计量在某个特定的极端区域取值在H 0 成立时的概率。 (4)做出判断。 2、注意 (1)显著性水平使弃真的概率 (2)比较相伴概率与显著性水平 三、统计推断的基本内容 1、单样本 (1)大样本n ≧50 2 ~(,)X N n σμ, 其中:μ为总体均值,2σ为总体方差,n 为样本容量 当2σ未知时,用样本方差s 2代替2σ 标准化: ~(0,1)X Z N = 同理,μ2~(,)P P N P σ P 为总体成数,n 为样本容量 2(1)p pq p p n n σ-= = 标准化: μ μ~(0,1)p P p Z N σ-== (2)小样本 2σ 已知:~(0,1)Z N = 2σ 未知:0 ~(1)X X t t n μσ-==- 2、两个独立样本 (1)大样本

22~(, )A B A B A B A B X X N n n σσμμ--+ 标准化统计量: ~(0,1)Z N = 如果22,A B σσ未知,则用S 2A ,S 2B 代替 (2)小样本 如果22,A B σσ已知 22~(, )A B A B A B A B X X N n n σσμμ--+ 标准化统计量: (~(0,1)X X Z N = 如果22,A B σσ未知,但要求22A B σσ= ()~(2)A B X X t n n -- S 为S A ,S B 的加权平均 ☆方差比检验 22~(1,1)A A B B S F F n n S =-- 3、配对样本 X A , X B 满足正态分布,但并不要求22,A B σσ相等。 当A B μμ= 配对数据可以看作来自均值为0的总体D: 2~(0,)D N σ 所以,2 ~(0,)d N n σ i i i A B d X X =- 若2 σ未知,则用 221 1()1n d i i S d d n ==--∑代替 0~(1)d t t n S -=- n 为配对数.

SPSS-非参数检验—两独立样本检验_案例解析

SPSS-非参数检验—两独立样本检验案例解析 2011-09-16 16:29 好想睡觉,写一篇博文,希望可以减少睡意,今天跟大家研究和分享一下:spss非参数检验——两独立样本检验, 我还是引用教程里面的案例,以:一种产品有两种不同的工艺生产方法,那他们的使用寿命分别是否相同 下面进行假设:1:一种产品两种不同的工艺生产方法,他们的使用寿命分布是相同的 2:一种产品两种不同的工艺生产方法,他们的使用寿命分布是不相同的 我们采用SPSS进行分析,数据如下所示: 点击“分析”选择“非参数检验” 再选择“旧对话框——2个独立样本检 验如下所示:

在检验类型下面选择"Mann-Whitney U “ 检验类型(Mann-whitney u 检验等同于对两组数据的Wilcoxon秩和检验和Kruskal-Wallis检验,主要检验两个样本的总体在某些位置上是否相等。) 两种工艺类型分别为:甲种工艺和乙种工艺分别用定义值为“1” 和 “2”将“工艺类型”变量拖入“分组变量”下拉框内,点击“定义组”按钮,在组别1 和组别 2 中分别填入 1和2,点击继续按钮 选择“使用寿命”作为“检验变量”点击确定,得到分析结果如下:

下面对结果,我将进行详细分解: 1:N 代表变量个数,甲种工艺秩和为 80 乙种工艺秩和为 40, 下面来分析“秩和”这个结果如何出来的 第一步:我们将”使用寿命“这个变量按照“从小到大”的顺序进行排序,得到如下结果:

得到数据如下: 甲种工 艺: 661 669 675 679 682 692 693 乙种工艺: 646 649 650 651 652 662 663 672 我们将“甲种工艺”和“乙种工艺”两组数据进行合并排序,并且对两组数据进行“秩次排序”分别用“序号”代替以上数据 序号分别为: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 得到以下结果: 甲种工艺为: 6 9 11 12 13 14 15 (加起来刚好等于80)

非参数统计第4章 两独立样本的非参数检验

第四章 两独立样本的非参数检验 在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值.但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽 油中哪一个污染更少,两种市场营销策略中那种更有效等等. 作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿海省市区为(Y1,Y2,…,Y12): 15044 12270 5345 7730 22275 8447 9455 8136 6834 9513 4081 5500 而非沿海的为对(x1,x2,…,x18): 5163 4220 4259 6468 3881 3715 4032 5122 4130 3763 2093 3715 2732 3313 2901 3748 3731 5167 人们想要知道沿海和非沿海省市区的人均GDP 的中位数是否一样.这就是检验两个总体的位置参数是否相等的问题. 假定代表两个独立总体的随机样本(Y1,Y2,…,Y12)和(x1,x2,…,x18),则问题归结为检验它们总体的均值(或中位数)的差是否相等,或是否等于某个已知值.换言之,即检验 0H :021D =-μμ;1H : 021D ≠-μμ 0H :021D =-μμ;1H : 021D <-μμ 0H :021D =-μμ;1H : 021D >-μμ 在正态假定下,这些问题化为:)2(~11)(0-++ --= m n t m n s D y x t 2 ) ()(1 2 1 2 -+-+ -= ∑∑==n m y y x x S m i i n i i t 检验并不稳健,在不知总体分布时,应用t 检验时会有风险的。 3.1 Brown-Mood 中位数检验 令沿海地区的人均GDP 的中位数为M X ,而内地的为M Y 。零假设为 0H :y x M M =;1H : y x M M > 显然,在零假设下,中位数如果一样的话,它们共同的中位数,即这(12十18)=30个数的样 本中位数(记为此xy M ),应该对于每一列数据来说都处于中间位置.也就是说,(Y1,Y2,…,Y12) 和(x1,x2,…,x18)中大于或小于xy M 的样本点应该大致一样多,计算他们的混合样本中位数为

第五章 spss的参数检验

spss的参数检验第五单元 分。、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为751请76 56, 79, 77,87, 80, 人参加考试,得分如下:81, 72, 60, 78, 65, 现从雇员中随机选出11 问该经理的宣称是否可信。u=u0=75 即原假设:样本均值等于总体均值t检验→相关设置→输出结果步骤:生成spss数据→分析→比较均值→单样本5-1 表 表 ,故不能拒绝原假设,且0.668>0.050.05的检验值下得到双侧检验值为分析:由上表可以看出,在在此区间,更加证明73.73一般六级成置信区间为(67.31,80.14),表中从置信区间上也可以看出绩为75 ,即认为该总经理的话可信。 2、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。然而心理学家则倾向于认为提出事实的方式是有关系的。为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。原假设:决策与提问方式无关,即u-u0=0 步骤:生成spss数据→分析→比较均值→两独立样本t检验→相关设置→输出结果 表5-3 组统计量 提问方式 N 均值标准差均值的标准误 .035 200 .46 丢票再买 .500 决策 .024 183 .88 丢钱再买 .326 表5-4

分析:由表5-3可以看出,提问方式不同所做的相同决策的平均比例是 46%和88%,认为决策者的决策与提问方式有关。由表5-4看出,独立样本在0.05的检验值为0,小于0.05,故拒绝原假设,认为决策者对事实所作出的反应与提问方式有关,心理学家的观点更站得住脚。 3、一种植物只开兰花和白花。按照某权威建立的遗传模型,该植物杂交的后代有75%的几率开株开了兰花,请利142颗,种植后发现200的几率开白花。现从杂交种子中随机挑选25%兰花, SPSS 进行分析,说明这与遗传模型是否一致?用u=u0=0.75 75%,即原假设:开蓝花的比例是 t 检验→相关设置→输出结果步骤:生成spss 数据→分析→比较均值→单样本5-5 表 5-6 表 0.75,1.23,1.35)值为0,小于0.05,故拒绝原假设,由于检验区间为(sig 分析:由于检验的结果 不在此区间内,进一步说明原假设不成立,故认为与遗传模型不一致。:同一鼠喂不同的饲料所测得的体1 给幼鼠喂以不同的饲料,用以下两种方法设计实验:方式4、所测得的钙留存量数29只喂饲料12只喂饲料1,乙组有内钙留存量数据如下: 方式2:甲组有请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙据如下 的留存量有显著不同。 原假设:不同饲料使幼鼠体内钙的留存量无显著不同。1方式 t 检验 →相关设置→输出结果步骤:生成spss 数据→分析→比较均值→配对样本5-7 表 5-8 表

第四章-非参数检验

第四章非参数检验 非参数检验(non-parametric test) 卡方检验(test)、 Runs 检验(Runs test)、 Kolmogorov-Smirnov 单样本检验(Kolmogorov-Smirnov one-sample test)、 Mann-Whitney 等级和检验(Mann-Whitney rank-sum test)、 符号检验(sign test)、 Wilcoson 配对符号等级检验(Wilcoson matched-pairs signed-ranks test)、 Fridman 单因素方差分析(Fridman one-way analysis of variance) 多样本中数检验(K-sample median test)。 一、卡方检验 检验(也叫做Pearson Chi-Square test):配合度检验(the test of goodness of fit)和独立性检验(independence test)。 (一)配合度检验 配合度检验: 推断某变量不同取值观测分数的频数和对应的期望频数(expected frequency)是否有显著性差异。 作零假设:f0=f e f0和f e分别为变量的每个水平的观测频数和期望频数。 配合度检验的自由度为:N-1,N为变量水平数。 【配合度检验·例】 配合度检验实际上是检验某变量的不同水平值的观测分数频率的分布是否服从某种期望或者理论分布。 某研究者进行了一次问卷调查。调查对象是300 名高中三年级学生;调查目的是考查学生对英语学习兴趣的自我评价:你对英语的学习兴趣□ 很浓、□ 较浓、□ 一般、□ 有点和□ 没有。获得原始数据如表4-1 所示。似乎较多人认为自己对英语的学习兴趣一般,较少人认为自己英语学习兴趣浓厚或没有兴趣。 该研究者想通过卡方分析证明:①对英语学习有不同兴趣的学生人数不均等和②其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近1:4:8:4:2。 表4-1 300 名学生对英语学习兴趣调查题目的反馈* 学生编号兴趣 001 2 002 3 003 5 …… 300 3 * 英语学习兴趣很浓、较浓、一般、有点和没有5 个等级分别以数字5、4、3、2 和1 表示。 ①对英语学习有不同兴趣的学生人数不均等。

第七章--spss非参数估计

第七章非参数检验 1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。 原假设:不同年龄段人群对该商品满意程度的分布无显著差异。 步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定 表7-1 检验统计量a 满意程度 最极端差别绝对值.121 正.121 负.000 Kolmogorov-Smirnov Z 2.217 渐近显著性(双侧).000 a. 分组变量: 年龄段 分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。 2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。 原假设:本次存款金额的总体分布与正态分布无显著差异 步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定 表7-2 单样本 Kolmogorov-Smirnov 检验 本次存款金额 N282 正态参数a,b均值4738.09 标准差10945.569 最极端差别绝对值.333 正.292 负-.333 Kolmogorov-Smirnov Z 5.585 渐近显著性(双侧).000 a. 检验分布为正态分布。 b. 根据数据计算得到。 分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。 3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金

SPSS的参数检验和非参数检验

S P S S的参数检验和非 参数检验 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:

请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至 周六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。 实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。

SPSS学习笔记非参数检验

学习必备欢迎下载 总体分布未知,不会涉及有关总体分布的参数 1.单样本非参数检验:卡方分布,二项分布,K-S检验,变量值随机性检验 2.两独立样本非参数检验:两独立样本所来自的总体分布是否存在显著差异 3.两配对样本非参数检验 4.多独立样本非参数检验 5.多配对样本非参数检验 得到样本数据后,判断总体分布:直方图、P-P图、Q-Q图,或非参数检验 1.1 卡方检验: 根据样本数据,推断总体分布于期望分布或某一理论分布是否存在显著性差异,是一种吻合性检验,离散型数据。 原假设:样本来自总体的分布与期望分布或某一理论分布无显著性差异。 Eg:心脏病猝死人数与日期。 1.2二项分布检验: 检验总体是否服从指定概率为P的二项分布, 原假设:样本来自的总体与指定的二项分布无显著差异。 用于:二值型数据,性别,是否合格,是否为三好学生,硬币正反面等,用01表示。 注:检验概率值(检验比例) 1.3单样本K-S检验: 样本来自的总体是否与某一理论分布有显著差异,是一种拟合优度的检验方法。 用于:探索连续性变量的分布。正态分布(normal)、均匀分布(uniform)、指数分布(ex.)、泊松分布。 原假设:样本来自的总体与指定的理论分布无显著差异。 另外,对于数据量很大的连续型变量,可以用图形直观判断。 P-P图:数据与理论分布一致时,各个数据点应落在对角线上。 Q-Q图:如果数据与理论分布无显著差异,点应分布在0横线附近。(没找到啊?) 2 Test type: Mann-Whitney: 秩:变量值排序的名次或位置 K-S检验: 游程检验Wald-wolfwitz Runs 极端反应检验Moses Extreme Reactions:踢出极端值前后P值变化情况,是否踢出。注:不同分析方法对同批数据的分析,结论可能不相同,要反复进行探索性分析,还要注意方法本身侧重点上的差异性。 4 中位数检验强调位置,Kruskal-Wallis检验侧重分析平均秩,Jonckheere比较同相对数。 ~~~~不懂~ 5 mean rank 平均秩 P值说明平均秩是否存在显著差异 Kendall检验中,W协同系数接近于1时,说明是一致的。

第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题 一、选择题 1.两小样本均数比较,方差不齐时,下列说法不正确的是(). A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 H是(). 2. 两样本秩和检验的 A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等 3. 在统计检验中是否选用非参数统计方法(). A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是(). A. T越大,P值越小 B.T越大,P值越大 C. T值在界值范围内,P值小于相应的α D. T值在界值范围内,P值大于相应的α E. T值在界值范围上,P值大于相应的α 5. 成组设计两样本比较的秩和检验,其检验统计量T是(). A. 为了查T界值表方便,一般以秩和较小者为T B. 为了查T界值表方便,一般以秩和较大者为T C. 为了查T界值表方便,一般以例数较小者秩和为T D. 为了查T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

多样本定量资料比较,当分布类型不清时应选择(). A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后 H值,则会(). 的 c A.提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对 二、简答题 1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 3. 多组定量资料比较时,统计处理的基本流程是什么?

第4章 两独立样本的非参数检验(非参数统计,西南财大)

第三章 两独立样本的非参数检验 在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值.但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽 油中哪一个污染更少,两种市场营销策略中那种更有效等等. 作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿海省市区为(Y1,Y2,…,Y12): 15044 12270 5345 7730 22275 8447 9455 8136 6834 9513 4081 5500 而非沿海的为对(x1,x2,…,x18): 5163 4220 4259 6468 3881 3715 4032 5122 4130 3763 2093 3715 2732 3313 2901 3748 3731 5167 人们想要知道沿海和非沿海省市区的人均GDP 的中位数是否一样.这就是检验两个总体的位置参数是否相等的问题. 假定代表两个独立总体的随机样本(Y1,Y2,…,Y12)和(x1,x2,…,x18),则问题归结为检验它们总体的均值(或中位数)的差是否相等,或是否等于某个已知值.换言之,即检验 0H :021D =-μμ;1H : 021D ≠-μμ 0H :021D =-μμ;1H : 021D <-μμ 0H :021D =-μμ;1H : 021D >-μμ 在正态假定下,这些问题化为:)2(~1 1)(0-++--= m n t m n s D y x t 2 )()(1 2 1 2 -+-+-= ∑∑==n m y y x x S m i i n i i t 检验并不稳健,在不知总体分布时,应用t 检验时会有风险的。 3.1 Brown-Mood 中位数检验 令沿海地区的人均GDP 的中位数为M X ,而内地的为M Y 。零假设为 0H :y x M M =;1H : y x M M > 显然,在零假设下,中位数如果一样的话,它们共同的中位数,即这(12十18)=30个数的样本中位数(记为此xy M ),应该对于每一列数据来说都处于中间位置.也就是说,(Y1,Y2,…,Y12)和(x1,x2,…,x18)中大于或小于xy M 的样本点应该大致一样多,计算他们的混合样本中位数为

第10章非参数检验(精)

第10章非参数检验 非参数检验是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。 SPSS提供的非参数检验共有以下几种: Chi-Square:卡方检验(举例data16-01,data16-02) 在前面介绍的方法中,往往都事先假定总体服从正态分布,然后对其均值或方差作检验。但某个随机变量是否服从某种特定的分布是需要进行检验的。可以根据以往的经验或实际的观测数据的分布情况,推测总体可能服从某种分布函数F(x),利用这些样本数据来具体检验该总体分布函数是否真的就是F(x)。卡方检验(Chi-Square)就是这样一种用来检验给定的概率值下数据来自同一总体的无效假设的方法。 data16-01:掷一颗六面体300次,用1、2、3、4、5、6分别代表六面的六个点,试问这颗六面体是否均匀。 表16—1 300次掷一颗六面体实验观测结果 data16-02:100名健康成年女子血清总蛋白含量,试它是否服从正态分布。 Binomial:二项检验(举例data16-03) 二项分布检验(Binomial test)是一种用来检验在给定的落入二项式中第一项概率值的前提下数据来自二项分布的无效假设的方法。(二项分布是从二分类总体抽得的随机样本中可能观察到的两类比例的抽样分布。这就是说,它给出了在零假设成立时两类比例的各种可能值。这里,零假设是指总体值为P的假设,当一项研究的“结果”可分为两类时,就可以用二项分布来检验零假设。这种检验属于拟合优度型。它告诉我们是否能够认为从样本中观察到的两类比例(或频数)来自于具有指定P值的总体。) data16-03:掷一枚球类比赛用的挑边器31次,出现A面、B面在上的次数见表16-3,取变量名为“tbh”,用数字型数据1代表“A”,用数字型数据1代表“B”,试问这枚挑边器是否均匀。 表16-3 31次掷一枚球类比赛用的挑边器实验观测结果 Runs:游程检验(举例data16-04) 例如,假定观察的结果用加、减号表示,得到一组这样的记录顺序: ++---++----++-+ 我们总共观察到7个游程。 游程检验是指根据游程数所作的二分变量的随机性检验。游程检验可用来检验样本的随机性,这对统计推断是很重要的,游程检验也可用来检验任何序列的随机性,而不管这个

spss实验报告—非参数检验

实验报告 ——(非参数检验) 实验目的: 1、学会使用SPSS软件进行非参数检验。 2、熟悉非参数检验的概念及适用范围,掌握常见的秩和检验计算方法。 实验内容: 1、某公司准备推出一个新产品,但产品名称还没有正式确定,决定进行抽样调 查,在受访200人中,52人喜欢A名称,61人喜欢B名称,87人喜欢C 名称,请问ABC三种名称受欢迎的程度有无差别?(数据表自建) SPSS计算结果如下: 此题为总体分布的卡方检验。 零假设:样本来自总体分布形态和期望分布没有显著差异。即ABC三种名称受欢迎的程度无差别,分布形态为1:1:1,呈均匀分布。 观察结果,上表为200个观察数据对A、B、C三个名称(分别对应1,2,3)的喜爱的期望频数以及实际观察频数和期望频数的差。从下表中可以看出相伴概

率值为0.007小于显著性水平0.05,因此拒绝零假设,认为样本来自的总体分布与制定的期望分布有显著差异,即A、B、C三种名称受欢迎的程度有差异。 2、某村庄发生了一起集体食物中毒事件,经过调查,发现当地居民是直接饮用 河水,研究者怀疑是河水污染所致,县按照可疑污染源的大致范围调查了沿河居民的中毒情况,河边33户有成员中毒(+)和均未中毒(-)的家庭分布如下:(案例数据run.sav) -+++*++++-+++-+++++----++----+---- 毒源 问:中毒与饮水是否有关? SPSS计算结果如下: 此题为单样本变量值随机检验 零假设:总体某变量的变量值是随机出现的。即中毒的家庭沿河分布的情况随机分布,与饮水无关。 相伴概率为0.036,小于显著性水平0.05,拒绝零假设,因此中毒与饮水有关。 3、某试验室用小白鼠观察某种抗癌新药的疗效,两组各10只小白鼠,以生存日数作为观察指标,试验结果如下,案例数据集为:npara1.sav,问两组小白鼠生存日数有无差别。 试验组:24 26 27 30 32 34 36 40 60 天以上 对照组:4 6 7 9 10 10 12 13 16 16 SPSS计算结果如下: 此题为两独立样本非参数检验。 (1)两独立样本Mann-Whitney U检验:

SPSS检验步骤总结

检验步骤总结: 1、t检验 2、方差分析 3、卡方检验 4、秩和检验 5、相关分析 6、线性回归 1、t检验(要求数据来自正态总体,可能需要先做正态检验) (1)单一样本t检验 数据特征:单一样本变量均数与某固定已知均数进行比较 方法:ANALYZE-COMPARE MEANS-ONE SAMPLE t TEST (2)独立样本t检验 数据特征:两个独立、没有配对关系的样本(有专门变量表示组数) 方法:ANALYZE-COMPARE MEANS-INDEPENDENT SAMPLES t TEST 注意观察方差分析结果,判断查看的数据是哪一行! (3)配对样本t检验 数据特征:两个不独立的,有配对关系的样本(没有专门变量表示组数) 方法:ANALYZE-COMPARE MEANS-PAIRED SAMPLES t TEST 不需要方差分析结果 检验步骤: (1)正态性检验1(有同学推荐,老师没有强调,但依据理论应进行) (2)建立假设(H0:。。。。来自同一样本。H1:。。。。不来自同一样本) (3)确定检验水准 (4)计算统计量(依据上面不同样本类型选择检验方法,注意独立样本t检验要先注明方差分析结果) (5)确定概率值P (6)得出结论 2、方差分析(要求数据来自正态总体,可能需要先做正态检验) (1)单因素方差分析 数据特征:相互独立、来自正态总体、随机、方差齐性的多样本(有专门变量 表示组数,且组数大于2) 方法:ANALYZE-COMPARE MEANS-ONE WAY ANOVA 注意需要在options 里面选择homogeneity variance test 做方差分析 符合方差齐性才可以得出结论!(>0.1) (2)双因素方差分析 1正态性检验方法:analyze-explore-plot里面选择normality test

相关主题