搜档网
当前位置:搜档网 › 第四章-非参数检验

第四章-非参数检验

第四章-非参数检验
第四章-非参数检验

第四章非参数检验

非参数检验(non-parametric test)

卡方检验(test)、

Runs 检验(Runs test)、

Kolmogorov-Smirnov 单样本检验(Kolmogorov-Smirnov one-sample test)、

Mann-Whitney 等级和检验(Mann-Whitney rank-sum test)、

符号检验(sign test)、

Wilcoson 配对符号等级检验(Wilcoson matched-pairs signed-ranks test)、

Fridman 单因素方差分析(Fridman one-way analysis of variance)

多样本中数检验(K-sample median test)。

一、卡方检验

检验(也叫做Pearson Chi-Square test):配合度检验(the test of goodness of fit)和独立性检验(independence test)。

(一)配合度检验

配合度检验: 推断某变量不同取值观测分数的频数和对应的期望频数(expected frequency)是否有显著性差异。

作零假设:f0=f e

f0和f e分别为变量的每个水平的观测频数和期望频数。

配合度检验的自由度为:N-1,N为变量水平数。

【配合度检验·例】

配合度检验实际上是检验某变量的不同水平值的观测分数频率的分布是否服从某种期望或者理论分布。

某研究者进行了一次问卷调查。调查对象是300 名高中三年级学生;调查目的是考查学生对英语学习兴趣的自我评价:你对英语的学习兴趣□ 很浓、□ 较浓、□ 一般、□ 有点和□ 没有。获得原始数据如表4-1 所示。似乎较多人认为自己对英语的学习兴趣一般,较少人认为自己英语学习兴趣浓厚或没有兴趣。

该研究者想通过卡方分析证明:①对英语学习有不同兴趣的学生人数不均等和②其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近1:4:8:4:2。

表4-1 300 名学生对英语学习兴趣调查题目的反馈*

学生编号兴趣

001 2

002 3

003 5

……

300 3

* 英语学习兴趣很浓、较浓、一般、有点和没有5 个等级分别以数字5、4、3、2 和1 表示。

①对英语学习有不同兴趣的学生人数不均等。

表 4-1-1 300 名学生对英语学习兴趣调查题目反馈的 SPSS 表格结构

〖操作〗ChiSqrQStdntRspns.sav 。执行 Analyze → Non-parametric Tests → Chi-Square ,系统将弹出卡方

检验主窗口(Chi-Square Test ),如图 4-1 所示。点击左侧变量列表中的

,点击

将出现在 下方的分析变量列表中,如图 4-1-1 所示。选中

标签下的

,以达到检验零假设(各水平的观测频数均等)的目的,如图 4-1-1 所示。点击

图 4-1 卡方检验设置朱主窗口 1 图 4-1-1 卡方检验设置朱主窗口2

〖结果与解释〗

【结果报告】

卡方检验表明,不同英语学习兴趣的学生人数不均等,200.1292

(4) X ,p <0.001。 如果没有原始数据表,但是,已知 300 个有效调查对象中分别有 18、62、132、56和 32 个学生分别选择了很浓、较浓、一般、有点和没有,那么,造 SPSS 表格如表 4-1-2 所示,保存为 ChiSqrQStdntRspns-20.sav 。对于表 4-2-2 中变量兴趣的各个分数,最初系统只能看作一般的数字,并不代表兴趣不同水平值的观测频数,所以,需要对兴趣进行频数加权处理。数据经加权处理后,操作同上。

表 4-2-2 300 名学生对英语学习兴趣调查题目反馈的 SPSS 表格结构

② 其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近 1:4:8:4:2。

〖操作〗兴趣各水平值的观测频率比为 1:4:8:4:2。打开 ChiSqrQStdntRspns.sav 。除以下方面之外,操作

同上:选中

标签下的

而不是 。然后,按照兴趣的 5 个

变量水平比例 1:4:8:4:2 中的数字,在

右侧的

中输入数字 1,点击

下面激活了的

,如图 4-1-2 所示。依次输入数字 1、4、8、4、2,如图 4-1-3 所示。

图 4-1-2 卡方检验:兴趣各分数频数分布是否

服从某一定比例设置窗口 1 图 4-1-3 卡方检验:兴趣各分数频数分布是否

服从某一定比例设置窗口 2

点击

,获得结果如下。

〖结果与解释〗

【结果报告】

卡方检验表明,学生英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近 1:4:8:4:2,403.12

(4) X ,p >0.10。

(二)独立性检验

独立性检验是指对于两个水平数有限的变量,根据各变量水平的分数的频数,检验它们是否相互独立(independent )。

对于独立性检验,作零假设:两个变量相互独立。 独立性检验的自由度为:(N 1-1)*(N 2-1),N 1 和 N 2 分别为第一个变量和第二个变量的水平数。

对于两个变量都只有 2 个水平的情况,效应大小为:ф=。

两个变量中如果有一个变量的水平数大于 2,则效应大小为:Cramer’s ф=

,N 为总观测数,df smaller 为水平数较小的那个变量的水平

数减 1。

如果要在 0.05 显著性水平下达到 80% 的统计功效,那么,效应大小等级、自由度和总观测数的关系如表 4-2 所示。

表4-2 在0.05 显著性水平下达到80% 的统计功效的组间自由度、效应大小和总观测数的关系

自由度效应大小总观测数

1 小(0.10)785 中(0.30)87 大(0.50)26

2 小(0.10)964 中(0.30)107 大(0.50)39

3 小(0.10)1090 中(0.30)121 大(0.50)44

4 小(0.10)1194 中(0.30)133 大(0.50)48

【独立性检验·例】

独立性检验也叫联列表分析(cross-tabulation)。如,对某聋校2、4 和6 年级聋生经常佩戴助听器情况进行了一次随机调查,结果如表4-3 所示。不同年级聋生佩戴助听器情况有显著性差异吗?

表4-3 某校2、4 和 6 年级聋生佩戴助听器人数

聋生年级经常不佩戴助听器经常佩戴助听器

2 6 23

4 30 14

6 8 3

表4-3-1 某校2、4 和 6 年级聋生佩戴助听器人数的SPSS 表格结构*

*“Grd”代表学生年级,其3 个水平“2”、“4”、“6”分别以“1”、“2”、“3”表示;“HrngAidStt”代表学生经常佩戴助听器情况,“1”表示经常不佩戴助听器,“2”表示经常佩戴助听器;“Nmbr”代表人数。

〖操作〗ChiSqrQHrngAid.sav。首先对变量Nmbr 进行频数加权。然后,执行Analyze → Descriptive Statistics → Crosstabs,系统将弹出联列表分析主窗口(Crosstabs),如图4-2 所示。点击左侧变量列表中的,点击,使列在标签下。点击左侧变量列表中的,点击,使列在标签下,如图4-2-1 所示。

图4-2 联列表分析主窗口1 图4-2-1 联列表分析主窗口2 点击按钮,系统将弹出联列标分析统计量设定窗口,如图4-2-2 所示,选定

和,如图4-2-3 所示。如此设置,结果中将显示卡方检验函数值和效应大小。点击,退出统计量设定窗口。

图4-2-2 联列表分析:统计量设定子窗口1 图4-2-3 联列表分析:统计量设定子窗口2 〖结果与解释〗

【结果报告】

卡方检验表明,不同年级聋生佩戴助听器情况有显著性差异,,Cramer’s ф=0.462。

不论对于配合度检验还是独立性检验,单元格期望频数最好大于10,不要小于5,如果有25% 的单元格的期望频数小于5,那么,值的效度就不可信。

二、其他非参数检验

(一)Runs 检验

如果一个变量只有两个水平,并对该变量测量获得一个分数序列。使用Runs 检验可以判断该分数序列中不同变量水平的分数是否无序分布。

【Runs 检验·例】

有90 名学生,而且,男生多女生少。在一次英语口语考试中,任课教师安排学生先后参加考试的不同性别顺序如下:

女、女、男、男、男、男、女、男、女、男、男、女、女、男、女、男、女、女、女、女、男、男、男、男、女、男、男、男、男、女、男、男、女、男、男、男、女、男、男、女、男、男、男、女、男、女、男、男、男、男、男、男、女、男、男、男、男、女、男、男、女、男、男、女、女、女、女、女、男、男、女、女、女、女、男、女、男、男、女、男、男、女、女、男、男、男、男、女、女、男。

问该性别排序是否符合随机要求。

表4-4 男女生性别排序的SPSS 表格结构*

*“1”和“2”分别代表男生和女生。

〖操作〗Non-Parametric6.sav。执行Analyze → Non-parametric Tests →Runs …,系统将弹出Runs 检验主窗口(Runs Tests),如图4-3 所示。在左侧变量名列表中选中,点击,把移动到下边的检验变量列表中。在标签下边的统计方法选项中,去掉系统的默认选项,选中,并在其右边的输入框中输入变量的水平数2,如图4-3-1所示。点击。

图4-3 Runs 检验设置窗口1 图4-3-1 Runs 检验设置窗口2

〖结果与解释〗

【结果报告】

男女性别顺序有统计意义上的随机性,Z=-0.044,p>0.10。

(二)Kolmogorov-Smirnov 单样本检验

Kolmogorov-Smirnov 单样本检验用于检验一组分数是否服从正态分布或者其他理论分布。

【Kolmogorov-Smirnov 单样本检验·例】

假如有一个分数选列:

14、26、21、24、10、18、24、28、15、27、20、22、20、24、19、22、21、20、21、29、16、20、

26、29、23、5、17、21、28、21、29、24、13、24、5。

问该分数序列是否服从正态分布。

表4-5 分数序列的SPSS 表格结构

〖操作〗Non-Parametric7.sav。执行Analyze → Non-parametric Tests → 1-Sample K-S,系统将弹出Kolmogorov-Smirnov 单样本检验主窗口(One Samples Kolmogorov-Smirnov Test),如图4-4 所示。在左侧

变量名列表中选中,点击上边的,把移动到下边的检验变量列表中。在标签下边的统计方法选项中,保持系统的默认选项,设定当前的目标检验分布为正态分布,如图4-4-1 所示。点击。

图4-4 Kolmogorov-Smirnov 单样本检验设置

窗口1 图4-4-1 Kolmogorov-Smirnov 单样本检验设置窗口2

〖结果与解释〗

【结果报告】

Kolmogorov-Smirnov 分布检验,该分数序列与正态分布没有显著性差异,K-S Z=-0.975,p>0.10。

(三)Mann-Whitney 等级和检验

【Mann-Whitney 等级和检验·例1】

某教师对其任课班级进行了一次课程考试,由于题目较难,全班学生的分数都比较低,但是,该教师认为考试分数反映了不同学生的相对水平,因此,他对全部同学的实际分数进行了排序,并企图从学生分数的相对高低来判断不同宿舍学生之间学习成绩是否有显著差异。其中,甲乙两个宿舍学生在全班的分数排序情况如表4-6 所示。问甲乙两宿舍同学之间的考试成绩是否有显著差异。

表4-6 甲乙两宿舍同学之间的考试成绩在全班中的排名

学生宿舍成绩名次

甲 3

乙 2

乙15

……

甲23

表4-6-1 甲乙两宿舍同学之间的考试成绩在全班中的排名的SPSS 表格结构

〖操作〗Non-Parametric1.sav。执行Analyze → Non-parametric Tests → 2-Independent Samples,系统将弹出等级分数两独立样本检验主窗口(Two-Independent-Samples Tests),如图4-5 所示。和独立样本平均数t 检验的情况类似,在左侧变量名列表中选中,点击上边的,把移动到

下边的检验变量列表中;选中,点击下边的,把移动到下边的分组变量框中,如图4-5-1 所示。

图4-5 Mann-Whitney 等级和检验设置窗口1 图4-5-1 Mann-Whitney 等级和检验设置窗口

图4-5-2 Mann-Whitney 等级和检验分组设置

子窗口1图4-5-3 Mann-Whitney 等级和检验分组设置子窗口2

〖结果与解释〗

【结果报告】

Mann-Whitney 等级和检验表明,宿舍5 和宿舍6 的学生之间的成绩排名差异不显著,Z=-0.980,p>0.10。

当然,对服从正态分布的分数也可以进行Mann-Whitney 等级和检验,只是检验结果不如独立样本平均数t检验精确。我们不妨对两组可以进行独立样本平均数t检验的分数也作Mann-Whitney 等级和检验,比较一下这两种检验的结果。

【Mann-Whitney 等级和检验·例2】

甲乙两个班级同时参加同一学科考试,成绩如表4-7 所示。问甲乙两班学生的成绩是否显著差异,两个班的学生成绩排名是否有显著差异。

表4-7 甲乙两班同学的考试成绩

班级分数

甲63

乙64

乙66

……

甲94

表4-7-1 甲乙两班同学考试成绩的SPSS 表格结构

〖操作〗独立样本平均数t检验。Non-Parametric2.sav,对分数进行独立样本平均数t检验。

〖结果与解释〗

Mann-Whitney 等级和检验。获得如下结果:

(四)符号检验

【符号检验·例】

假若有两组配对分数,如表4-8 所示。请通过符号检验判断这两组分数之间的差异情况。

表4-8 两组配对分数

分数1 分数2

64.0 36.0

66.0 37.0

50.0 69.0

……

98.0 94.0

表4-8-1 两组配对分数的SPSS 表格结构

〖操作〗signTest1.sav。执行Analyze → Non-parametric Tests → 2-Related Samples,系统将弹出符号检验

主窗口(Two-Related-Samples Tests),如图4-6 所示。和配对样本平均数t检验的情况类似,在左侧变量名列表中选中和,点击,把和移动到下边的检验变量对列表中。在标签下边的统计方法选项中,去掉的默认选项而选中,如图4-6-1 所示。点击。

图4-6 符号检验设置窗口1 图4-6-1 符号检验设置窗口2

〖结果与解释〗

【结果报告】

符号检验表明,两组分数之间的差异没有达到显著性水平,Z=0.000,p=1.000。

(五)Wilcoson 配对符号等级检验

【Wilcoson 配对符号等级检验·例】

使用符号检验的数据举例同【符号检验·例】。

〖操作〗signTest1.sav。执行Analyze → Non-parametric Tests → 2-Related Samples,在两个相关样本检验主窗口,保留标签下边的系统的默认选项,其它同符号检验。点击。〖结果与解释〗

【结果报告】

Wilcoson 配对符号等级检验表明,两组分数之间的差异没有达到显著性水平,Z=-1.106,p>0.10。

(六)Fridman 单因素方差分析

【Fridman 单因素方差分析·例】

某班只有10 人,其某次英语考试中3 个满分为10 分的大题的分数如表4-9 所示。问该班的3 个题目的分数是否有显著差异。

表4-9 某班英语考试中 3 个大题的分数

序号大题 1 大题 2 大题 3

1 7.0 9.0 6.0

2 7.0 6.0 9.0

3 10.0 9.0 7.0

…………

10 9.0 8.0 7.0

表4-9-1 某班英语考试中 3 个大题的分数的SPSS 表格结构

〖操作〗Non-Parametric4.sav。执行Analyze → Non-parametric Tests → K-Related Samples,系统将弹出多个相关样本检验主窗口(Tests for Several Related Samples),如图4-7 所示。在左侧变量名列表中选中、、和,点击,把这三个变量名都移动到下边的检验变量对列表中。保留标签下边系统的默认选项,如图4-7-1 所示。点击。

图4-7 Fridman 单因素方差分析设置窗口1 图4-7-1 Fridman 单因素方差分析设置窗口2 〖结果与解释〗

【结果报告】

Fridman 单因素方差分析表明,该班3 个大题的得分之间没有显著差异,

Chi-Square=2.595,p>0.10。

(七)多样本中数检验

【多样本中数检验·例】

假如A、B、C 三个班的一次英语口语考试成绩,如表4-10 所示。问3 个班的英语口语考试分数是否有显著差异。

表4-10 A、B、C 三个班英语口语考试分数

A 班序号 A 班分数

B 班序号 B 班分数

C 班序号 C 班分数

1 7.0 1 9.0 1 6.0

2 7.0 2 6.0 2 9.0

3 10.0 3 9.0 3 7.0

………………

10 9 10 8 10 7

表4-10-1 A、B、C 三个班英语口语考试分数的SPSS 表格结构

注:“班级”的水平值“1”、“2”和“3”分别班级A、B 和C。

〖操作〗Non-Parametric5.sav。执行Analyze → Non-parametric Tests → K Independent Samples,系统将弹出多个独立样本检验主窗口(Tests for Several Independent Samples),如图4-8 所示。在左侧变量名列表中选中,点击上边的,把移动到下边的检验变量对列表中。点击,点击下边的,把移动到下边的分数分组设置变量框中,如图4-8-1 所示。

图4-8 多样本中数检验设置窗口1 图4-8-1 多样本中数检验设置窗口2

图4-8-2 多样本中数检验分组设置子窗口1图4-8-3 多样本中数检验分组设置子窗口2〖结果与解释〗

【结果报告】

多样本中数检验分析表明,A、B、C 三个班英语口语考试分数之间差异不显著,

Chi-Square=0.268,p>0.10。

第四章假设检验

第四章假设检验 参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。共同点:都是利用样本信息对总体数量特征进行推断。不同点:推断的角度不同 4.1 假设检验的基本问题 1、假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程; 包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。 2、小概率事件——若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)≤0.05。 3、原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为H0。总是有 符号=、≤或 ≥ 备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为H1。总是有符号≠、<或> 4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立; 先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定; 等号“=”总是放在原假设上; 因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。 假设检验主要是搜集证据来推翻和拒绝原假设。 5、双侧检验——是指备择假设没有特定的方向性,并含有符号≠的假设检验,又称为双尾检 验。 单侧检验——是指备择假设具有特定的方向性,并含有符号>或<的假设检验,又称为单尾检验。 6、第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设。第Ⅰ类错误的概率记为α,又被称为显著性水平。 又称为显著性水平,常被用于检验结论的可靠性度量; 既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第Ⅰ类错误概率的最大允许值);常用的α 值有0.01,0.05,0.10;由研究者事先确定。 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设。第Ⅱ类错误的概率记为β。

第七章 非参数检验习题 医学统计学习题

第七章非参数检验习题 一、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说()。 A.正秩和与负秩和的绝对值不会相差很大B.正秩和与负秩和的绝对值相等C.正秩和与负秩和的绝对值相差很大D.不能得出结论 E.以上都不对 2.设配对资料的变量值为1X 和2X ,则配对资料的秩和检验是()。 A.把1X 和2X 的差数从小到大排序B.分别按1X 和2X 从小到大排序C.把1X 和2X 综合从小到大排序D.把1X 和2X 的和数从小到大排序E.把1X 和2X 的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点()。 A.不受总体分布的限制B.适用于等级资料C.适用于未知分布型资料 D.适用于正态分布资料 E.适用于分布呈明显偏态的资料4.等级资料的比较宜采用()。A.秩和检验 B.F 检验 C.t 检验 D.2 检验 E.u 检验 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的()。 A.两样本均数相同 B.两样本的中位数相同C.两样本对应的总体均数相同D.两样本对应的总体分布相同 E.两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是()。 A.Friedman 检验B.符号检验C.Kruskal-Wallis 检验 D.Wilcoxon 检验 E.t 检验 7.成组设计两样本比较的秩和检验中,描述不正确的是()。 A.将两组数据统一由小到大编秩 B.遇有相同数据,若在同一组,按顺序编秩C.遇有相同数据,若不在同一组,按顺序编秩D.遇有相同数据,若不在同一组,取其平均值 E.遇有相同数据,若在同一组,取平均致词 二、简答题 1.简要回答进行非参数统计检验的适用条件。2.你学过哪些设计的秩和检验,各有什么用途?3.试写出非参数统计方法的主要有缺点。三、计算题 1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?

第十一章 非参数检验

第一节 非参数检验的基本概念及特点 一、非参数检验 (一)什么是“非参数” 非参数模型:缺乏总体分布模式的信息。 (二)非参数检验的定义 非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。 (三)非参数检验的优点和缺点: 1、优点: 一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。 计算简便。 2、缺点: 统计效能远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。 (四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单; 4、最大的不足是不能充分利用资料的全部信息; 5、不能处理“交互作用”,即多因素情况。 第二节 两个独立样本的非参数检验方法 一、秩和检验法 秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W 检验,也称Mann-Whitney U 检验。秩和检验法与参数检验法中独立样本的t 检验法相对应。当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。 (一)秩统计量 秩统计量指样本数据的排序等级。假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布。这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为 () 21211++= n n n T μ ()12121 21++=n n n n T σ 其检验值为

病理生理学考试-- 病理生理学考试--第七章 非参数检验(答案)

第七章 非参数检验(答案) 一、选择题 1.A 2.E 3.D 4.A 5.D 6.E 7.C 二、简答题 1.答:(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能。 2. 答:(1)配对设计的符号秩和检验(Wilcoxon 配对法)是推断其差值是否来自中位数为零的总体的方法,可用于配对设计差值的比较和单一样本与总体中位数的比较;(2)成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)用于完全随机设计的两个样本的比较,目的是推断两样本分别代表的总体分布是否吸纳共同。(3)成组设计多样本比较的秩和检验(Kruskal-Wallis 检验),用于完全随机设计的多个样本的比较,目的是推断两样本分别代表的总体的分布有无差别。(4)随机区组设计资料的秩和检验(Friedman 检验),用于配伍组设计资料的比较。 3. 答:优点:(1)适用范围广,不受总体分布的限制;(2)对数据的要求不严;(3)方法简便,易于理解和掌握。 缺点:如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低于非参数检验;若要使检验效能相同,往往需要更大的样本含量。 三、 计算题 1.解: (1)建立检验假设,确定检验水准 0H :用方法一和方法二测得乳酸脱氢酶含量的差值的总体中位数为零,即0d M = 1H :0d M ≠ 0.05α= (2)计算检验统计量T 值 ①求各对的差值 见表7-4第(4)栏。 ②编秩 见表7-4第(5)栏。 ③求秩和并确定统计量T 。 5.5T += 30.5T -= 取 5.5T =。 (3)确定P 值,做出推断结论 本例中8n =, 5.5T =,查附表T 界值表,得双侧0.05P <;按照0.05α=检验水准,拒绝0H ,接受1H 。认为用方法一和方法二测得乳酸脱氢酶含量差别有统计学意义。 表7-4 8份血清用原法和新法测血清乳酸脱氢酶(U/L )的比较 编号 原法 新法 差值d 秩次 (1) (2) (3) (4)=(2)—(3) (5) 1 100 120 -20 -8 2 121 130 -9 -5 3 220 225 -5 -3.5 4 186 200 -14 -6

第二讲-非参数统计检验教学内容

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=??第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24N N N N E S Var S ==。拒绝域为:{}N N S S c > (2)由中心极限定理可知,当2 ,1N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α??????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n ==?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00{}{}s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2}{}{2100α =≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

统计学习题 第十一章 非参数检验

第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

第4章非参数检验作业

第四章非参数检验 1.为研究心脏病人猝死人数与日期的关系,收集了168个观察数据,见数据文件“非参数检验(心脏病猝死).sav”,其中:用1、2、3、4、5、6、7表示是星期几死的。现利用这批数据,推断心脏病人猝死人数与日期的关系是否是: 2.8:1:1:1:1:1:1.,使用总体分布的卡方检验方法进行检验。 解:取显著性水平为0.05(题设未给出) H0:心脏病人猝死人数与日期的关系是:2.8:1:1:1:1:1:1. H1:心脏病人猝死人数与日期的关系不是:2.8:1:1:1:1:1:1. 操作步骤:

结果:

由SPSS输出结果可知, P=0.256,大于显著性水平0.05,不能拒绝原假设。 2.为验证某批产品的合格品率是否达到90%,现从该批产品中随机抽取23个样品进行检验,得到最后的检测结果数据,见数据文件“非参数检验(产品合格率).sav”,其中:1表示一级品,0表示非一级品。使用二项分布检验方法检验一级品率为90%. 解: H0:这批产品一级品率的分布符合二项分布(p=90%) H1:这批产品一级品率的分布不符合二项分布(p=90%) 设显著性水平为0.05. 首先读入数据文件“非参数检验(产品合格率).sav”,选择非参数检验的二 项分布检验,并将检验比例设置为0.90。如下图所示。

得到结果如下: 从图中的分析结果我们可以看到P值为0.193>0.05,因此我们不拒绝原假设,可以认为这批产品合格品率达到90% 3.收集到21个关于周岁儿童身高的样本数据,见数据文件“非参数检验(单样本KS-儿童身高).sav”,试利用K-S方法检验周岁儿童的身高是否服从正态分

非参数统计第4章 两独立样本的非参数检验

第四章 两独立样本的非参数检验 在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值.但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽 油中哪一个污染更少,两种市场营销策略中那种更有效等等. 作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿海省市区为(Y1,Y2,…,Y12): 15044 12270 5345 7730 22275 8447 9455 8136 6834 9513 4081 5500 而非沿海的为对(x1,x2,…,x18): 5163 4220 4259 6468 3881 3715 4032 5122 4130 3763 2093 3715 2732 3313 2901 3748 3731 5167 人们想要知道沿海和非沿海省市区的人均GDP 的中位数是否一样.这就是检验两个总体的位置参数是否相等的问题. 假定代表两个独立总体的随机样本(Y1,Y2,…,Y12)和(x1,x2,…,x18),则问题归结为检验它们总体的均值(或中位数)的差是否相等,或是否等于某个已知值.换言之,即检验 0H :021D =-μμ;1H : 021D ≠-μμ 0H :021D =-μμ;1H : 021D <-μμ 0H :021D =-μμ;1H : 021D >-μμ 在正态假定下,这些问题化为:)2(~11)(0-++ --= m n t m n s D y x t 2 ) ()(1 2 1 2 -+-+ -= ∑∑==n m y y x x S m i i n i i t 检验并不稳健,在不知总体分布时,应用t 检验时会有风险的。 3.1 Brown-Mood 中位数检验 令沿海地区的人均GDP 的中位数为M X ,而内地的为M Y 。零假设为 0H :y x M M =;1H : y x M M > 显然,在零假设下,中位数如果一样的话,它们共同的中位数,即这(12十18)=30个数的样 本中位数(记为此xy M ),应该对于每一列数据来说都处于中间位置.也就是说,(Y1,Y2,…,Y12) 和(x1,x2,…,x18)中大于或小于xy M 的样本点应该大致一样多,计算他们的混合样本中位数为

第四章-非参数检验

第四章非参数检验 非参数检验(non-parametric test) 卡方检验(test)、 Runs 检验(Runs test)、 Kolmogorov-Smirnov 单样本检验(Kolmogorov-Smirnov one-sample test)、 Mann-Whitney 等级和检验(Mann-Whitney rank-sum test)、 符号检验(sign test)、 Wilcoson 配对符号等级检验(Wilcoson matched-pairs signed-ranks test)、 Fridman 单因素方差分析(Fridman one-way analysis of variance) 多样本中数检验(K-sample median test)。 一、卡方检验 检验(也叫做Pearson Chi-Square test):配合度检验(the test of goodness of fit)和独立性检验(independence test)。 (一)配合度检验 配合度检验: 推断某变量不同取值观测分数的频数和对应的期望频数(expected frequency)是否有显著性差异。 作零假设:f0=f e f0和f e分别为变量的每个水平的观测频数和期望频数。 配合度检验的自由度为:N-1,N为变量水平数。 【配合度检验·例】 配合度检验实际上是检验某变量的不同水平值的观测分数频率的分布是否服从某种期望或者理论分布。 某研究者进行了一次问卷调查。调查对象是300 名高中三年级学生;调查目的是考查学生对英语学习兴趣的自我评价:你对英语的学习兴趣□ 很浓、□ 较浓、□ 一般、□ 有点和□ 没有。获得原始数据如表4-1 所示。似乎较多人认为自己对英语的学习兴趣一般,较少人认为自己英语学习兴趣浓厚或没有兴趣。 该研究者想通过卡方分析证明:①对英语学习有不同兴趣的学生人数不均等和②其英语学习兴趣很浓、较浓、一般、有点和没有各等级的人数比接近1:4:8:4:2。 表4-1 300 名学生对英语学习兴趣调查题目的反馈* 学生编号兴趣 001 2 002 3 003 5 …… 300 3 * 英语学习兴趣很浓、较浓、一般、有点和没有5 个等级分别以数字5、4、3、2 和1 表示。 ①对英语学习有不同兴趣的学生人数不均等。

第七章--spss非参数估计

第七章非参数检验 1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。 原假设:不同年龄段人群对该商品满意程度的分布无显著差异。 步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定 表7-1 检验统计量a 满意程度 最极端差别绝对值.121 正.121 负.000 Kolmogorov-Smirnov Z 2.217 渐近显著性(双侧).000 a. 分组变量: 年龄段 分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。 2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。 原假设:本次存款金额的总体分布与正态分布无显著差异 步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定 表7-2 单样本 Kolmogorov-Smirnov 检验 本次存款金额 N282 正态参数a,b均值4738.09 标准差10945.569 最极端差别绝对值.333 正.292 负-.333 Kolmogorov-Smirnov Z 5.585 渐近显著性(双侧).000 a. 检验分布为正态分布。 b. 根据数据计算得到。 分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。 3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金

非参数假设检验法及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

第10章__非参数检验

第10章非参数检验 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission 分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法

第4章 两独立样本的非参数检验(非参数统计,西南财大)

第三章 两独立样本的非参数检验 在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值.但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽 油中哪一个污染更少,两种市场营销策略中那种更有效等等. 作为一个例子.我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元).沿海省市区为(Y1,Y2,…,Y12): 15044 12270 5345 7730 22275 8447 9455 8136 6834 9513 4081 5500 而非沿海的为对(x1,x2,…,x18): 5163 4220 4259 6468 3881 3715 4032 5122 4130 3763 2093 3715 2732 3313 2901 3748 3731 5167 人们想要知道沿海和非沿海省市区的人均GDP 的中位数是否一样.这就是检验两个总体的位置参数是否相等的问题. 假定代表两个独立总体的随机样本(Y1,Y2,…,Y12)和(x1,x2,…,x18),则问题归结为检验它们总体的均值(或中位数)的差是否相等,或是否等于某个已知值.换言之,即检验 0H :021D =-μμ;1H : 021D ≠-μμ 0H :021D =-μμ;1H : 021D <-μμ 0H :021D =-μμ;1H : 021D >-μμ 在正态假定下,这些问题化为:)2(~1 1)(0-++--= m n t m n s D y x t 2 )()(1 2 1 2 -+-+-= ∑∑==n m y y x x S m i i n i i t 检验并不稳健,在不知总体分布时,应用t 检验时会有风险的。 3.1 Brown-Mood 中位数检验 令沿海地区的人均GDP 的中位数为M X ,而内地的为M Y 。零假设为 0H :y x M M =;1H : y x M M > 显然,在零假设下,中位数如果一样的话,它们共同的中位数,即这(12十18)=30个数的样本中位数(记为此xy M ),应该对于每一列数据来说都处于中间位置.也就是说,(Y1,Y2,…,Y12)和(x1,x2,…,x18)中大于或小于xy M 的样本点应该大致一样多,计算他们的混合样本中位数为

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

第10章非参数检验(精)

第10章非参数检验 非参数检验是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。 SPSS提供的非参数检验共有以下几种: Chi-Square:卡方检验(举例data16-01,data16-02) 在前面介绍的方法中,往往都事先假定总体服从正态分布,然后对其均值或方差作检验。但某个随机变量是否服从某种特定的分布是需要进行检验的。可以根据以往的经验或实际的观测数据的分布情况,推测总体可能服从某种分布函数F(x),利用这些样本数据来具体检验该总体分布函数是否真的就是F(x)。卡方检验(Chi-Square)就是这样一种用来检验给定的概率值下数据来自同一总体的无效假设的方法。 data16-01:掷一颗六面体300次,用1、2、3、4、5、6分别代表六面的六个点,试问这颗六面体是否均匀。 表16—1 300次掷一颗六面体实验观测结果 data16-02:100名健康成年女子血清总蛋白含量,试它是否服从正态分布。 Binomial:二项检验(举例data16-03) 二项分布检验(Binomial test)是一种用来检验在给定的落入二项式中第一项概率值的前提下数据来自二项分布的无效假设的方法。(二项分布是从二分类总体抽得的随机样本中可能观察到的两类比例的抽样分布。这就是说,它给出了在零假设成立时两类比例的各种可能值。这里,零假设是指总体值为P的假设,当一项研究的“结果”可分为两类时,就可以用二项分布来检验零假设。这种检验属于拟合优度型。它告诉我们是否能够认为从样本中观察到的两类比例(或频数)来自于具有指定P值的总体。) data16-03:掷一枚球类比赛用的挑边器31次,出现A面、B面在上的次数见表16-3,取变量名为“tbh”,用数字型数据1代表“A”,用数字型数据1代表“B”,试问这枚挑边器是否均匀。 表16-3 31次掷一枚球类比赛用的挑边器实验观测结果 Runs:游程检验(举例data16-04) 例如,假定观察的结果用加、减号表示,得到一组这样的记录顺序: ++---++----++-+ 我们总共观察到7个游程。 游程检验是指根据游程数所作的二分变量的随机性检验。游程检验可用来检验样本的随机性,这对统计推断是很重要的,游程检验也可用来检验任何序列的随机性,而不管这个

第6章非参数检验

第6章非参数检验 非参数检验是针对那些总体分布不能用有限个实参数来刻画,而只能对其作一些诸如分布连续、有密度、具有某阶矩等一般性假定的统计问题。例如,检验“两个总体有相同分布”这个假设,若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,这就是非参数统计问题。又如,估计总体分布的期望,若假定总体分布为正态分布,则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。不过参数统计与非参数统计之间并没有泾渭分明的界线,有的统计问题,从不同的角度可以理解为参数性的,也可以理解为非参数性的。例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的;但如果对随机误差的分布类型没有作任何假定,则从问题总体分布这个角度看,也可以看成是非参数性的。 非参数统计的一个重要特点是非参数统计问题中对总体分布的假定要求的条件很宽,因而使得针对这种问题而构造的非参数统计方法,不致于因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性。但正是因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明:当一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,其效率上的损失也很小。 第1节符号检验 符号检验是根据正、负符号个数的假设检验方法。首先需要将原始数据按设定的规则,转换成正、负号,然后计数正、负号的个数做出检验。该检验可用于样本中位数和总体中位数的比较,数据升降趋势检验,特别可用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表达时,也可用本方法。 配对资料符号检验的计算步骤为:将成对数据以一定规则编码(或原始数量型数据),然后相减,得到的结果后,计数大于0的样本个数以及小于0的样本个数分别为n+和n-,当样本大小时,计算近似卡方值。

第7章 非参数检验试题

第7章非参数检验试题 选择题: 1、4组学生成绩(优、良、中、差)比较,宜用(B )。 A 方差分析 B 秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是(B )。 A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、(C ),应该用非参数统计方法。 A 正态分布资料n不相等时两样本均数比较 B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较 D 两组百分比资料的平均数比较 4、在统计检验中是否选择用非参数统计方法,( A )。 A 要根据研究目的和数据特征作决定 B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论 实验组对照组 实测值甲的编秩乙的编秩实测值甲的编秩乙的编秩 10 7.5 7.5 10 7.5 7.5 12 9 9 8 4 5 15 10 10.5 8 5 5 15 11 10.5 6 1 2 17 12 13 6 2 2 17 13 13 6 3 2 17 14 13 8 6 5 19 17 17 19 17 17 19 17 17 20 20 20.5 19 17 17 20 21 20.5 19 17 17 21 22 22 D 要看哪个P值更小 5、下表列出了成组设计的两样本资料及甲乙两个研究者的编秩结果,下面哪一个说法是对的?( C ) A 甲的编秩方法是错的 B 乙的编秩方法是错的 C 甲乙两人方法均对 D 甲乙两人的编秩方法均错 6、以下检验方法中,(A )不属于非参数统计方法。 A.t检验 B.H检验 C.T检验D.χ2检验 7、为判断各总体均数是否相等,对于来自方差齐性及正态分布总体的多个样本比较,可以作秩和(H)检验,通过判断各总体分布的位置是否相同而判断各总体均数是否相等,与作方差分析相比( C )。 A.应该把α定得小一点 B.将增大犯I类错误的概率

第四章非参数检验上课材料

第四章 非参数检验 (Nonparametric Tests 菜单) ? 本章学习内容 3.1 非参数检验概述 3.2 卡方检验(Chi Square ) 3.3 二项分布检验(Binomial ) 3.4 单样本K-S 检验(1 Sample K-S Tests ) 3.5 单样本变量值随机性检验(Runs ) 3.6 两独立样本非参数检验(2 independent Samples 3.7 多独立样本非参数检验(K independent Samples 3.7 两相关样本非参数检验(2 Related Samples 3.8 多相关样本非参数检验(K Related Samples ? 具体内容 3.1 非参数检验概述 非参数检验是统计推断的一个重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在假定知道总体分布形式的情况下,对总体分布的某些参数,如均值、方差等进行推断检验。但是,在现实生活中,由于种种原因,人们往往无法对总体的分布形态作简单的假定,但又希望能从样本数据中获得尽可能多的所需要信息。非参数检验正是基于这种考虑,在总体分布位置或知道甚少的情况下,利用样本数据对总体的分布形态或分布参数进行推断。 3.2 卡方检验(Chi-Square ) 总体分布的卡方检验就是根据样本数据推断总体的分布与期望分布或某一理论分布是否有显著差异。它的零假设是H 0:样本来自的总体其分布形态与期望分布或某一理论分布无显著差异。总体分布的卡方检验是一种吻合性检验,比较适合于单个因素的多项分类的数据分析。 单样本

实例分析: 医学家在研究心脏病人猝死人数与日期的关系时发现,一周之中,星期一心脏病人猝死者较多,其他日期则基本相当,比例近似为2.8:1:1:1:1:1:1。现收集到样本数据168个,据此推断其总体分布是否与假定的分布相吻合。见“心脏病人猝死日期.sav ”。 具体操作如下: Analyze Nonparametric Tests Chi-Square ,打开卡方检验对话框,如下图。 心脏病猝死日期 5553.5 1.52319.1 3.91819.1-1.11119.1-8.12619.1 6.92019.1.91519.1 -4.1 168 1234567Total Observed N E xpected N Residual Tes t Statis tics 7.757 6.256 Chi-Square a df Asymp. Sig. 心脏病猝死日期 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 19.1. a. 可以看出,由于相伴概率值大于显著性水平0.05,因此不能拒绝零假设,可以认为样本来自的总体分布于指定的理论分布无显著差异,即:心脏病人猝死人数与日期的关系基本是 2 1 3

非参数统计学讲义(第四章)讲稿2

非参数统计学讲义 第四章 多样本模型 §1 k 个相关样本的非参数检验 在参数统计中,检验几个样本是否来自完全相同的总体,采用方差分析或F 检验。运用F 检验的假定条件是:样本是从正态分布的总体中独立抽选的;总体具有相同的方差;数据的测量层次至少是定距尺度。当被用来分析的数据不符合这些假定条件,或研究者不希望作这些假设,以便增加结论的普遍性时,不宜采用参数统计的方法,而必须运用非参数方法。 如果k (等于或大于3)个样本是按某种或某些条件匹配的,那么k 个样本称为相关的,否则为独立的。k 个相关和独立样本的差别与两个相关和独立样本之间的差别类似。本节介绍k 个相关样本的非参数检验。 一、Cochran Q 检验 1.研究背景 Cochran Q 检验也译为科库兰检验。它是用以检验匹配的三组或三组以上的频数或比例之间有无显著差异的方法。这种匹配可以用不同形式获得。例如,检验三种不同类型的采访形式对被采访者的有效回答是否有影响,可以抽选一些人,分成n 组,每组有3个匹配的被采访者,要求他们的有关情况相同。每组的3名成员被随机地置于3种条件之下,即分别接受三种类型的采访,于是,就获得了3个匹配的样本,即k =3,每个样本有n 个观测结果。k 个相关样本也可以采用同一组人,对不同的k 个条件的反应匹配成样本,这类似于两个相关样本中以研究对象作为自身的对照者。例如,检验几种教学手段对学生掌握知识是否有显著不同,可以随机抽取n 个学生,让他们先后置于k 种教学手段之下,再作出评价。这样可以获得k 个匹配的样本,每个样本有n 个观测结果。 在现实生活中,很多数据是以二元数据的形式出现的, 【例4-1】村民对四个候选人的评价得到结果: 表4-1 村民评价结果 其中:1表示同意;0表示不同意。关心的问题是候选人在村民眼中有无区别,即检验H 0:12k θ==是否成立。 2.基本方法 若有k 个相关样本,每个样本有n 个观测结果,检验k 个样本间是否有显著差异,可以建立双侧备择,假设组为 k H :0个样本间无显著差异 k H :1个样本间有显著差异 由于三个及三个以上样本间差异的方向不便于判定,因而,通常只建立双侧备择进行检验。 为对假设作出判定,所分析的数据测量层次为定类尺度即可。获得的数据可排成一个n 行k 列的表。如果H 0为真,那么将测量结果分为“成功”和“失败”的话,“成功”与“失败”应随机地分布在表中的各行各列。Cochran Q 检验的统计量定义为 2 22 1 1 2 21 1 (1)() (1)(1)k k i i i i b b i i j j k k N N k k N k N Q kN L kN L ====-----= = --∑∑∑∑ (4.1) 式中,k 为处理数;b 为区组数;i N 为行总和;j L 为列总和;i j i j N N L = =∑∑;1 i i N N k =∑。 由于Q 统计量的抽样分布近似为自由度df =k 一1的2 χ分布,所以根据自由度df =k 一1,给定的显著性水平α,能够在附表中查找临界值2 αχ,若 2 αχ≥Q 则在显著性水平α下拒绝H 0,表明样本之间存在着显著差异。相反,则不能拒绝H 0。

病理生理学考试-- 病理生理学考试--第七章 非参数检验习题

第七章 非参数检验习题 、、 选择题 1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说( )。A .正秩和与负秩和的绝对值不会相差很大 B .正秩和与负秩和的绝对值相等C .正秩和与负秩和的绝对值相差很大 D .不能得出结论E .以上都不对 2.设配对资料的变量值为和,则配对资料的秩和检验是( )。1X 2X A .把和的差数从小到大排序 B .分别按和从小到大排序1X 2X 1X 2X C .把和综合从小到大排序 D .把和的和数从小到大排序1X 2X 1X 2X E .把和的差数的绝对值从小到大排序1X 2X 3.下列哪项不是非参数统计的优点( )。A .不受总体分布的限制 B .适用于等级资料C .适用于未知分布型资料 D .适用于正态分布资料E .适用于分布呈明显偏态的资料4.等级资料的比较宜采用( )。 A .秩和检验 B .检验 C .检验 D .检验 E .检验 F t 2 u 5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( )。A .两样本均数相同 B .两样本的中位数相同C .两样本对应的总体均数相同 D .两样本对应的总体分布相同E .两样本对应的总体均数不同 6.以下检验方法中,不属于非参数检验方法的是( )。 A .Friedman 检验 B .符号检验 C .Kruskal-Wallis 检验 D .Wilcoxon 检验 E .检验 t 7.成组设计两样本比较的秩和检验中,描述不正确的是( )。A .将两组数据统一由小到大编秩 B .遇有相同数据,若在同一组,按顺序编秩 C .遇有相同数据,若不在同一组,按顺序编秩 D .遇有相同数据,若不在同一组,取其平均值 E .遇有相同数据,若在同一组,取平均致词二、简答题 1.简要回答进行非参数统计检验的适用条件。2.你学过哪些设计的秩和检验,各有什么用途?3.试写出非参数统计方法的主要有缺点。三、计算题

相关主题