搜档网
当前位置:搜档网 › 第五章假设检验

第五章假设检验

第五章假设检验
第五章假设检验

第五章:假设检验

主讲人:任杰

一、假设检验的基本原理

(一)小概率事件

1、定义:在一个抽样分布中,如果样本统计量的值出现的概率落入一个事先已经规定了的区域(即概率密度比较小的区域),就认为小概率事件发生了,该随机事件就叫做小概率事件。

2、原理:小概率事件在一次实验中不可能发生,如果发生了,就可以认为该事件并不是实验想要研究的事件。所以小概率区域也可叫做拒绝区域。

练习

? 已知

? 从中抽取三个容量为16的样本

? 得到各样本平均数为:

? 请计算各样本平均数出现的概率是多少?

? 思考:小概率事件与“三个标准差原则”取舍数据的关系。

(二)统计推断思想

1、设想:在用某抽样样本推断其所属总体是否为我们假设的总体时,如果小概率事件发生了,我们就可以认为该抽样样本不是来自于我们想推断的总体,或者说该抽样样本所属总体与我们想推断的总体之间存在着比较显著的差异。

2、假设检验:用样本统计量对提出的关于总体情况的假设做出某种推断,叫做假设检验(Hypothesis testing)。

3、假设

1)定义:假设就是在用样本统计量推断总体时,事先提出的抽样样本和总体的关系。

2)种类:通常有两个假设:零假设和研究假设。

–研究假设:又叫对立假设,用H1表示,是我们想要证明的假设,或者说是研究想要得到的结论。通常是认为当前抽样样本所属总体与假设总体有区别的假设。–零假设:又叫原假设,用H0表示,与研究假设对立的假设,通常是认为当前抽样样本所属的总体与假设总体无区别的假设

3)两种假设的关系

? 零假设和检验假设是相互对立的关系,如果零假设成立,则研究假设为假;如果零假设为假,则研究假设成立。

? 统计推断时,一般是通过对零假设的检验来判断研究假设是否成立。

4、两种错误

1)显著性水平:统计推断时,确定小概率事件的水平即为显著性水平,用希腊字母α表示,通常α=.05或α=.01,也有取α=.10的。

2)假设检验的两种结果:

–当P≤α时,小概率事件发生了,就可以在α水平上拒绝零假设,接受研究假设;–当P>α时,接受零假设拒绝研究假设。

3)两种错误:在统计推断时,无论是接受零假设还是拒绝零假设,都会犯错误。

–拒绝零假设时所犯的错误为α错误,错误量为α。

–接受零假设时所犯的错误为β错误。

4)α错误与β错误的关系与控制? 要同时减少α错误与β错误是不可能的,但可以根据二者之间的关系,尽量在显著性水平一定的情况下,减少β错误。

5、假设检验的类型

1)单侧检验:当能够预料样本统计量的值大于或小于假设的值时,把拒绝概率置于理论抽样分布的一侧,叫单侧检验。有左侧检验和右侧检验两种情况。

2)双侧检验,当不能判断样本统计量和总体的关系时,就把拒绝概率置于分布的两侧,叫双侧概率。

检验类型与β错误的控制

二、总体平均数的显著性检验

(一)由一样本判断其所属总体的平均数与某已知总体平均数的差异1、当已知总体正态分布且总体方差已知时,用Z分布进行总体平均数的显著性检验,又叫Z检验

练习

?某校历年大学英语四级考试成绩的标准差为30分,平均分为65分。现从今年参加四级考试的学生中抽取17名学生,计算其平均分为62分,标准差为20分,请问今年该校英语四级成绩和往年是否一样?

2、当已知总体分布为正态,但总体方差未知时,用t分布进行总体平均数的显著性检验,又叫t 检验。

练习:若该校历年英语四级成绩的标准差不知道,如何进行检验?

? 若在上例中,该校体育系学生的四级成绩历年都低于全校平均水平,今年体育系26名学生的平均成绩为56,标准差为15,问今年体育系的CET-4成绩是否仍然低于全校平均水平?(二)由两样本判断其所属两总体平均数的差异

1、平均数差的抽样分布:

–来自方差为的总体中容量为的样本平均数的抽样分布记作:则:

–同样,来自方差为的总体中容量为n2的样本平均数的抽样分布记作:则:

–则两个抽样样本平均数之差的抽样分布记作:可得:

1)平均数差的分布的平均数为:

1)平均数差的分布的方差为:

1)平均数差的分布的标准误为:

2、独立样本平均数的差异检验

? 当r=0时,两样本为独立样本

1)若两总体正态分布,且σ1、σ2已知不管两样本容量大小,都用Z检验:

练习

? 已知某校31名男生和41名女生四级考试平均成绩分别为65分和68分,标准差分别为22分和20分,该校历年男生和女生英语四级成绩的标准差分别为25分和20分,请问该校今年男女生英语四级成绩是否一样?

2)两总体正态分布,但σ1、σ2未知,? 此时不能用Z检验,两总体方差的无偏估计为:

? 平均数差的抽样分布的标准误为:

? 有如下统计量,其分布比较复杂:

如果σ1= σ2 = σ0,根据t分布进行检验

的无偏估计用联合方差替代:

则:

如果σ1≠σ2 ,用t′检验如果两总体方差不等,则平均数差的分布既不是t分布更不是正态分布,对其检验常用t′分布。

这时,t′分布只是近似t分布,但不能以自由度df=n1+n2-2的临界值作为为t′分布的临界值,检验时应根据两个抽样样本t分布的临界值来计算t′分布的临界值。

练习

? 为了比较独生子女与非独生子女在社会性方面的差异,随机抽取独生子女25人,非独生子女31人,进行社会认知测验,结果二者的平均成绩与标准差分别为(25.8,6)和(29.9,10.2),试问独生子女与非独生子女的社会认知能力是否存在显著差异?(已知两总体方差不等)? 此例中,若n1=n2,t′(α)有什么变化?

n1=n2时,t′(α)值的变化

3)两总体为非正态分布如果是大样本,不管总体方差是否已知,用Z′检验。

3、相关样本的平均数差异检验? 当r≠0时,两样本为相关样本

1)如果σ1、σ2 、r已知,用Z检验

练习

? 某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(σ=16),结果平均智商为106,一年后再对同组被试施测,结果平均智商为110,已知两次测验的相关系数为.74,问能否说随着年龄的增长与一年的教育,儿童智商有了显著提高。

2)如果σ1、σ2 未知,用t检验

练习

? 上面练习中,如果不知总体σ,只知道两次测验的标准差分别为15和18,如何进行检验?3)两组相关数据的平均数检验

三、方差的差异检验

(一)样本方差与总体方差的差异检验? 样本方差与总体方差之比的抽样分布为χ2分布,在对二者进行检验时,就要根据χ2值落入的区域作出判断,如果落入小概率事件区域,则

说明二者差异比较显著;反之二者差异不显著? 即当显著性水平为α时,

(二)两样本方差的差异显著性检验

1、原理

?当两样本为独立样本时,在总体方差未知时,用各自的无偏估计值代替,这时,两总体方差无偏估计量的比值分布服从F分布。如果两总体方差相等,则其无偏估计量之比值应该在1的上下浮动,如果这个值偏离1太远,则说明两总体方差不等。

2、检验公式

练习试检验上面练习中独生子女和非独生子女在社会性测验方面的离散程度的差异。(三)两相关样本的方差差异检验? 对两相关样本的方差进行检验时,不能用F检验,只能用t检验。检验公式为:

相关系数的差异显著性检验

? ρ=0(H0假设)时,相关系数的抽样分布为近似正态分布,用t检验,检验公式为

? ρ≠0时,相关系数的抽样分布不是正态分布,但可以通过费舍相关系数转化表,把r转化为Zr,这些Zr的分布为近似正态分布,可以用Z分布进行检验。检验公式为

? 同ρ≠0时一样,也要先把所有的相关系数转化为费舍相关系数,然后用Z检验,公

式为:

第五章假设检验

第五章 假设检验 第一节 假设检验中的基本概念和基本原理 一、统计假设的概念 统计假设,指的是和抽样手段联系在一起,并且依靠抽样数据来进行验证的假设。 统计假设的内容都是数量化了的,而且验证的依据都是凭借抽样调查所取得的资料,在抽取样本资料时,必须保证抽样的随机性。 假设? ??H H 10备择假设原假设 原假设,又称为零假设。它一般是根据已有的资料,或经过周密考虑后确定的、具有稳定性的、受保护的经验和看法。因此,若没有充分根据, H 0是不会被轻易否定的。 备择假设,又称为研究假设。经过抽样调查,若有充分根据否定原假设H 0,自然就得接受其逻辑对立面。原假设H 0的逻辑对立面即为备择假设。 以总体均值μ的假设检验为例,根据问题的不同,假设检验可能有三种: 1、双边检验 H 0:μμ0 = H 1 :μμ0 ≠ 2、右侧单边检验 H 0:μμ0 = H 1 :μ> μ0 3、左侧单边检验 H 0:μ μ0 = H 1 :μ< μ 二、假设检验的基本原理——小概率原理 小概率原理可归纳为两个方面:一是可以认为小概率事件在一次观察中是不可能出现的;二是如果在一次观察中出现了小概率事件,那么,合理的想法是否定原来认为该事件具有小概率的看法。 假设检验的基本思想:经过随机抽样获得一个来自总体的样本,然后根据样本计算某个(或

某几个)统计量的数值。若在原假设H 0成立的条件下,该统计量数值的出现几乎是不可能的,就拒绝或否定原假设H 0,并接受它的逻辑对立面——备择假设H 1。反之,如果在原假设H 0成立的条件下,该统计量数值出现的可能性不是很小的话,就没有理由拒绝原假设H 0。 三、假设检验中的统计量 1、在原假设H 0成立的情况下,统计量中不应包含有未知参数,其数值应该是确定的。 2、所选用的统计量的分布应该是已知的,是有表可查的。 例如,对于正态总体均值μ的检验H 0:μ μ0 = ,应选择的统计量为: =Z n X σ μ -(σ2 已知) t = n S X μ-(σ2 未知) 四、显著性水平α 显著性水平α是假设检验中所规定的小概率的数量界限。也就是在原假设H 0成立的条件下,判断统计量数值的出现是否是小概率事件的标准。常用的标准有:05.0,1.0==αα或 01.0=α。 五、临界值、接受域和拒绝域 选定一个检验统计量后,在原假设H 0成立的条件下,就可画出统计量的分布。再根据给定的显著性水平α,就可确定临界值、接受域和拒绝域。 比如,对于正态总体均值μ的双边检验H 0:μ μ0 =,在总体方差σ2 已知的情况下,我 们选择= Z n X σ μ -为统计量;根据原假设H 0:μ μ0 = ,就可以画出如图5-1-1所示的Z 统计 量的分布。

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

第5章 假设检验

第五章、假设检验 思考题 1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有: (1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。 2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系? 答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。在其他条件不变时,α增大,β减小;β增大,α减小。 3.什么是显著性水平?它对于假设检验决策的意义是什么? 答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。 4.什么是p值?p值检验和统计量检验有什么不同? 答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p 值可以有效地补充α提供地关于检验可靠性的有限信息。p值检验的优点在于, 它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。 5.什么是统计上的显著性? 答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的 练习题 3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。 (2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。

第五章 假设检验

第五章假设检验 本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z检验、t检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel进行假设检验。 第一节假设检验概述 一、假设检验的基本概念 假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。 所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。 小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。所以,统计检验又称显著性检验。 下面通过一个具体例子说明假设检验是怎样进行的。 【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢? 上述例子中,消费者协会实际要进行的是一项统计检验工作,检验总体平均容量是否等于包装上注明的250毫升。即,检验总体平均μ=250是否成立。这就是一个原假设(null H表示,即: hypothesis),通常用0 H:μ=250 H,备选假设是在原假设被否定时与原假设对立的是备选假设(alternative hypothesis)1 另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出 现的结论作为备选假设。上例中可能的备选假设有三种:

第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量 ? 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ? 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。 5.1 两类错误与功效 1. 两类错误的概率 H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0- (5.2) (略) ? 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为 第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ? 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病 第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ? 两类错误的背景: 拒绝H 0时可能犯第Ⅰ类错误 不拒绝H 0时可能犯第Ⅱ类错误 ? 两类错误的后果: 第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ? 一般α, β的数值要在科研设计时事先确定 2. 功效 (power) ? 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β (5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β (5.5) ? 功效就是真实有效的药物被发现的概率∕疾病被诊断出 来的概率 5.2 影响功效的四要素 ? 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ? 功效的影响因素为:δ=0μ-x ,σ,n ,α X ≥μ0+Z αn σ (5.7) (略) ? 现用X 分布图形来定性地讨论四要素对功效的影响 1. 客观差异越大,功效越大

第5章 假设检验课后习题解答

第五章 假设检验 一、选择题 1.单项选择题 (1)将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的1/2,这是( B )。 A.单侧检验 B.双侧检验 C.右单侧检验 D.左单侧检验 (2)检验功效定义为( B )。 A.原假设为真时将其接受的概率 B.原假设不真时将其舍弃的概率 C.原假设为真时将其舍弃的概率 D.原假设不真时将其接受的概率 (3)符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着( C )。 A.存在试验误差(随机误差) B.存在条件误差 C.不存在什么误差 D.既有抽样误差,也有条件误差 (4)得出两总体的样本数据如下: 甲:8,6,10,7,8; 乙:5,11,6,9,7,10 秩和检验中,秩和最大可能值是( C )。 A.15 B.48 C.45 D.66 2.多项选择题 (1)显著性水平与检验拒绝域的关系是( ABD )。 A.显著性水平提高(α变小),意味着拒绝域缩小 B.显著性水平降低,意味着拒绝域扩大 C.显著性水平提高,意味着拒绝域扩大 D.显著性水平降低,意味着拒绝域扩大化 E.显著性水平提高或降低,不影响拒绝域的变化 (2)β错误( ACDE )。 A.是在原假设不真实的条件下发生的 B.是在原假设真实的条件下发生的 C.决定于原假设与实际值之间的差距 D.原假设与实际值之间的差距越大,犯β错误的可能性就越小 E.原假设与实际值之间的差距越小,犯β错误的可能性就越大 二、计算题 1.某牌号彩电规定无故障时间为10000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,

测得平均无故障时间为10150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为H 0:μ0=10000,H 1:μ0<10000(使用寿命应该使用单侧检验)。n =100可近似采用正态分布的检验统计量z α=0.01水平下的反查正态概率表得到临界值2.34到2.36之间 (因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3 z = =。因为z =3>2.36(>2.34),所以拒绝原假设。 2.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为H 0:μ0=800,H 1:μ0≠800(产品重量应该使用双侧检验)。采用t 分布的检验统计量 t = 。查出α=0.05和0.01两个水平下的临界值(df =n -1=15)为2.131和2.947。t =1.667。因为 2.131 2.947t <<,所以在两个水平下都接受原假设。 3.某市全部职工中,平常订阅某种报纸的占40%,最近从订阅率来看似乎出现降低的现象,随机抽200户职工家庭进行调查,有76户职工订阅该报纸,问报纸的订阅率是否显著降低(α=0.05)? 解:假设检验为H 0:P =40%,H 1:P <40%。采用成数检验统计量 z = α=0.05 水平下的临界值为1.64和1.65之间。计算统计量值 0.577z = ≈?,z =-0.577>- 1.64,所以接受原假设。p 值为0.48和0.476之间[因为本题为单侧检验,值p ()() 12F z =?]。显然 p 值>0.05,所以接受原假设。 4.某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问: (1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑? (2)计算(1)的p -值; (3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油? (4)计算(3)的p -值; (5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2) 。

第五章 假设检验

第五章 假设检验 一、单项选择题 1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用( )。 A 、左侧检验 B 、右侧检验 C 、双侧检验 D 、左侧检验或右侧检验 2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定原假设,则可认为( )。 A 、抽样是不科学的 B 、检验结论是正确的 C 、犯了第一类错误 D 、犯了第二类错误 3、当样本统计量的观察值未落入原假设的拒绝域时,表示( )。 A 、可以放心地接受原假设 B 、没有充足的理由否定与原假设 C 、没有充足的理由否定备择假设 D 、备择假设是错误的 4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( )。 A 、都减少 B 、都增大 C 、都不变 D 、一个增大一个减小 5、关于检验统计量,下列说法中错误的是( )。 A 、检验统计量是样本的函数 B 、检验统计量包含未知总体参数 C 、在原假设成立的前提下,检验统计量的分布是明确可知的 D 、检验同一总体参数可以用多个不同的检验统计量 6、某地方煤矿每月发生事故的平均次数为5次,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。用来检验这一计划有效性的原假设和备择假设应为( )。 A 、原假设:μ≥5;备择假设:μ< 5。 B 、原假设:μ= 5;备择假设:μ≠5。 C 、原假设:μ≠5;备择假设:μ= 5。 D 、原假设:μ≤5;备择假设:μ> 5。 7、在假设检验中,不拒绝原假设意味着( )。 A 、原假设肯定是正确的。 B 、没有证据证明原假设是错误的。 C 、原假设肯定是错误的。 D 、没有证据证明原假设是正确的。 8、从正态总体中随机抽取一个样本容量n=100的随机样本,计算得到该样本的均值17 X ,样本修正方差的标准差为9。假定总体方差已知,为121。要检验总体均值是否为20,则所用统计量的值为( )。 A 、-0.333。 B 、-3.333。 C 、-2.727。 D 、-3.317。 9、在假设检验中,原假设和备择假设( )。 A 、只有一个成立而且必有一个成立。 B 、都有可能成立。 C 、都有可能不成立。 D 、原假设一定成立,备择假设不一定成立。

第5章 假设检验思考与练习参考答案

第5章 假设检验 思考与练习参考答案 一、最佳选择题 1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。 A.0.01α= B. 0.05α= C. 0.10α= D. 0.20α= E. 0.30α= 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t = 3.24,t 0.05,v =2.086, t 0.01,v =2.845。正确的结论是( E )。 A. 此样本均数与该已知总体均数不同 B. 此样本均数与该已知总体均数差异很大 C. 此样本均数所对应的总体均数与该已知总体均数差异很大 D. 此样本均数所对应的总体均数与该已知总体均数相同 E. 此样本均数所对应的总体均数与该已知总体均数不同 3. 假设检验的步骤是( A )。 A. 建立假设,选择和计算统计量,确定P 值和判断结果 B. 建立无效假设,建立备择假设,确定检验水准 C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误 D. 计算统计量,确定P 值,作出推断结论 E. 以上都不对 4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。 A. 统计量t 越大,说明两总体均数差别越大 B. 统计量t 越大,说明两总体均数差别越小 C. 统计量t 越大,越有理由认为两总体均数不相等 D. P 值就是α E. P 值不是α,且总是比α小 5. 下列( E )不是检验功效的影响因素的是: A. 总体标准差σ B. 容许误差δ C. 样本含量n D. Ⅰ类错误α E. Ⅱ类错误β 二、思考题 1.试述假设检验中α与P 的联系与区别。 答:α值是决策者事先确定的一个小的概率值。 P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。 P ≤α时,拒绝0H 假设。

第五章统计估计和假设检验

第五章统计估计和假设检验 第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。 统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。 假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验; 另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。 第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。 极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。 例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0 与X=1 两种情形,于是,可得事件A发生的概率为:

第5章 假设检验习题

第五章假设检验 思考与练习 一、单项选择题 1.将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是(b )。 a. 单侧检验 b.双侧检验 c.右侧检验 d.左侧检验 2.检验功效定义为(b )。 a. 原假设为真时将其接受的概率 b. 原假设不真时将其舍弃的概率 c. 原假设为真时将其舍弃的概率 d. 原假设不真时将其接受的概率 3.符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(c )。 a.存在试验误差(随机误差) b.存在着条件误差 c.不存在什么误差 d.既有抽样误差,也有条件误差 4.得出两总体的样本数据如下: 甲:8,6,10,7,8 乙:5,11,6,9,7,10 秩和检验中,秩和最大可能值是(c )。 126

a. 15 b. 48 c. 45 d. 66 二、多项选择题 1.显著性水平与检验拒绝域关系(a b d ) a. 显著性水平提高(α变小),意味着拒绝域缩小 b. 显著性水平降低,意味着拒绝域扩大 c. 显著性水平提高,意味着拒绝域扩大 d. 显著性水平降低,意味着拒绝域扩大化 e. 显著性水平提高或降低,不影响拒绝域的变化 2. β错误(a c d e ) a. 是在原假设不真实的条件下发生 b. 是在原假设真实的条件下发生 c. 决定于原假设与真实值之间的差距 d. 原假设与真实值之间的差距越大,犯β错误的可能性就越小 e. 原假设与真实值之间的差距越小,犯β错误的可能性就越大 三、计算题 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件, 127

128 测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧检验)。采用t 分布的检验统计量n x t /0 σμ-= 。查出α=0.05和0.01两个水 平下的临界值(df=n-1=15)为2.131和2.947 。 1.33t = =。因为 t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量 n x z /0 σμ-= 。查出α=0.01水平下的反查正态概率表得到临界值2.32到 2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值 3100 /50010000 10150=-= z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障

第5章 统计假设检验练习题及答案

实验报告——第5章统计假设检验 姓名杨秀娟班级人力10001 学号 【实验1】 某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76 请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著) 【解】 (1)数据和变量说明 本题所用数据是:外企英语六级考试成绩样本 该文件为11个样本,1个变量,如变量视图 (2)操作方法 (3)结果报告

上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。 由上表可知,t= , P=, P>,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。 【实验2】 以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。 表5-20 培训前后销售业绩数据 序号123456789 培训前677074977488827185 培训后786778987687867895【解】 (1)数据和变量说明 本文件有2个变量,9个数据

(2)操作方法 (3)结果报告 由上表可知, P=, P<,不接受无效假设,有显著差异,所以该培训产生了显著效果。

【实验3】 饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。 方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下: 表5-21 方案一喂养数据 方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下: 表5-22方案二喂养数据 请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。 【解】 方案一 (1)数据和变量说明 答:9个数据,2个变量 (2)操作方法

相关主题