搜档网
当前位置:搜档网 › 2独立性检验

2独立性检验

2独立性检验
2独立性检验

1.2独立性检验的基本思想及其初步应用1.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:

认为作业多认为作业不多总数

喜欢玩电脑游戏18927

不喜欢玩电脑游戏81523

总数262450

根据表中数据得到

2

50181589

27232426

k

()

??-?

=≈

???

5.059,因为p(K2≥5.024)=0.025,

则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为()

(A)97.5% (B) 95% (C)90% (D)无充分根据

2.(2011?湛江一模)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅表格来确定“X和Y有关系”的可信度.如果k>3.84,那么有把握认为“X和Y有关系”的百分比为()

P(K2>

k)

0.500.400.250.150.100.050.0250.0100.0050.001

k0.4550.708 1.323 2.072 2.706 3.84 5.024 6.6357.87910.83

A.5%

B.75%

C.99.5%

D.95%

3.(2012?泰安一模)下列说法:

①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;

②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;

③线性回归方程必过;

④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系;

其中错误的个数是()

A.0

B.1

C.2

D.3

4.(2010?泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是()

A.这种疫苗能起到预防甲型H1N1流感的有效率为1%

B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1

C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”

D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”

男女总计

爱好104050

不爱好203050

总计3070100

附表:

P(K2≥k)0.100.050.025

k 2.706 3.841 5.024

随机变量,经计算,统计量K2的观测值k≈4.762,参照附表,得到的正

确结论是()

A.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别有关”

B.在犯错误的概率不超过5%的前提下,认为“爱好该项运动与性别无关”

C.有97.5%以上的把握认为“爱好该项运动与性别有关”

D.有97.5%以上的把握认为“爱好该项运动与性别无关”

6.(2013?临沂一模)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动有关系”.

P(k2≥k0)0.1000.0500.0250.0100.001

k0 2.706 3.841 5.024 6.63510.828

A.0.1%

B.1%

C.99%

D.99.9%

7.(2012?武昌区模拟)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:

男女总计

走天桥402060

走斑马线203050

总计6050110

由,算得

参照独立性检验附表,得到的正确结论是()

A.有99%的把握认为“选择过马路的方式与性别有关”

B.有99%的把握认为“选择过马路的方式与性别无关”

C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”

D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”

8.(2012?上饶一模)在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数:)

物理成绩好物理成绩不好合计

数学成绩好18725

数学成绩不好61925

合计242650

A.90%

B.95%

C.97.5%

D.99%

9.(2014?韶关二模)由于工业化城镇化的推进,大气污染日益加重,空气质量逐步恶化,雾霾天气频率增大,大气污染可引起心悸、胸闷等心脏病症状.为了解某市患心脏病是否与性别有关,在某医院心血管科随机的对入院50

患心脏病不患心脏病合计

男20525

女101525

合计302050

参考临界值表:

p(p2≥k)0.150.100.050.0250.0100.0050.001

K 2.072 2.706 3.841 5.024 6.6357.87910.828

(参考公式:K2=其中n =a +b +c +d).

问有多大的把握认为是否患心脏病与性别有关.答:()

A.95%

B.99%

C.99.5%

D.99.9%

10.(2014?黄山二模)某部门为了了解青年人喜欢户外运动是否与性别有关,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论为:有()把握认为“喜欢户外运动与性别有关”.

附:(独立性检验临界值表)

P(K2≥k0)0.050.0250.0100.0050.001

k0 3.841 5.024 6.6367.87910.828

A.0.1%

B.1%

C.99%

D.99.9%

11.(2014?永州三模)随机调查某校110名学生是否喜欢跳舞,由列联表和公式K2=计算

出K2,并由此作出结论:“有99%的可能性认为学生喜欢跳舞与性别有关”,则K2可以为()

附表:

P(K2≥k0)0.100.050.0250.010

k0 2.706 3.841 5.024 6.635

A.3.565

B.4.204

C.5.233

D.6.842

12.(2013?河南模拟)某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,

男女

文科 2 5

理科 10 3

则以下判断正确的是()

参考公式和数据:k2=

p(k2≥k0)0.150.100.050.0250.0100.0050.001

k0 2.07 2.71 3.84 5.02 6.647.8810.83

B.至多有97.5%的把握认为学生选报文理科与性别有关

C.至少有95%的把握认为学生选报文理科号性别有关

D.至多有95%的把握认为学生选报文理科与性别有关

13.(2014?泰安一模)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位

性别

是否需要志愿者男女

需要4030

不需要160270

由算得,

P(K2≥k)0.0500.0100.001

k 3.841 6.63510.828

参照附表,得到的正确结论是()

A.在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别有关”

B.在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别无关”

C.有99%以上的把握认为“需要志愿者提供帮助与性别有关”

D.有99%以上的把握认为“需要志愿者提供帮助与性别无关”

14.(2012?潍坊二模)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:

优秀非优秀总计

A班14620

B班71320

C班211940

附:参考公式及数据:

(1)卡方统计量(其中n=n11+n12+n21+n22);

P(x2≥k0)0.0500.010

K0 3.841 6.635

则下列说法正确的是()

A.有99%的把握认为环保知识测试成绩与专业有关

B.有99%的把握认为环保知识测试成绩与专业无关

C.有95%的把握认为环保知识测试成绩与专业有关

D.有95%的把握认为环保知识测试成绩与专业无关

15.(2014?潍坊三模)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到如下

喜爱打篮球不喜爱打篮球合计

男生20525

女生101525

合计302050

则至少有()的把握认为喜爱打篮球与性别有关.

A.95%

B.99%

C.99.5%

D.99.9%

男女总计

爱好104050

不爱好203050

总计3070100

P(K2≥k)0.100.050.025

k 2.706 3.84150.24

由K2=算得K2=≈4.762

参照附表,得到的正确结论()

A.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”

B.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”

C.有97.5%以上的把握认为“是否爱吃零食与性别有关”

D.有97.5%以上的把握认为“是否爱吃零食与性别无关”

17

由表中数据计算得到K的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关.

18.为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了100个样本,统计结果为:服用药的共有60个样本,服用药但患病的仍有20个样本,没有服用药且未患病的有20个样本.

(1)根据所给样本数据完成下面2×2列联表;

参考答案1.A

【解析】

试题分析:∵根据表中数据得到K2

2 50181589

27232426

()

??-?

=

???

≈5.059,

因为p(K2≥5.024)=0.025,∴认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为1-0.025=97.5%

故选A.

考点:独立性检验的应用.

2.D

【解析】

试题分析:根据所给的观测值,把观测值同表格所给的临界值进行比较,看观测值大于哪一个临界值,得到说明两个变量有关系的可信程度.

解:∵k>3.84,

∴有0.05的几率说明这两个变量之间的关系是不可信的,

即有1﹣0.05=95%的把握说明两个变量之间有关系,

故选D.

点评:本题考查独立性检验,考查两个变量之间的关系的可信程度,考查临界值表的应用,本题是一个基础题,关键在于理解临界值表的意义,而没有要我们求观测值,降低了题目的难度.

3.C

【解析】

试题分析:①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;

②设有一个回归方程,变量x增加一个单位时,y平均减少5个单位;

③线性回归方程必过必过样本中心点;

④由计算得K2=13.079,则其两个变量间有关系的可能性是99.9%,

解:①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故①正确;

②设有一个回归方程,变量x增加一个单位时,y平均减少5个单位,故②不正确;

③线性回归方程必过必过样本中心点,故③正确;

④由计算得K2=13.079,对照临界值,可得其两个变量间有关系的可能性是99.9%,故④错误,

综上知,错误的个数是2个

故选C.

点评:本题考查线性回归方程,考查独立性检验,考查方差的变化特点,是一个考查的知识点比较多的题目,注意分析,本题不需要计算,只要理解概念就可以得出结论.

4.D

【解析】

试题分析:根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度约为99%,即这种疫苗不能起到预

(教案)1.2独立性检验的基本思想及其初步应用

第一课时 1.2独立性检验的基本思想及其初步应用(一) (共2课时) 教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量2 K的含义. 教学过程: 一、复习准备: 回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤. 二、讲授新课: 1. 教学与列联表相关的概念: ①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”. ②列联表:分类变量的汇总统计表(频数表). 一 般我们只研究每个分类变量只取两个值,这样的列 联表称为22 ?. 如吸烟与患肺癌的列联表: 2. 教学三维柱形图和二维条形图的概念: 由列联表可以粗略估计出吸烟者和不吸烟者患肺 癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论) 3. 独立性检验的基本思想: ①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体. 第一步:提出假设检验问题H 0:吸烟与患肺癌没有关系?H 1 :吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 () K ()()()() n ad bc a b c d a c b d - = ++++ (它越小,原假设“H :吸 烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1 :吸烟与患肺癌有关系”成立的可能性越大. 教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据

1.1《独立性检验》习题

1-1《 统计案例》习题 1.1 独立性检验 双基达标 限时15分钟 1.下面是一个2×2的列联表 则表中a ,b 解析 由a +21=73,得a =52, 由a +5=b ,得b =57. 答案 52,57 2.为了检验两个事件A 与B 是否相关,经计算得χ2=3.850,我们有________ 的把握认为事件A 与B 相关. 答案 95% 3.为了考查高中生的性别与是否喜欢数学课程之间的关系,某市在该辖区内 的高中学生中随机地抽取300名学生进行调查,得到表中数据: 解析 由χ2 =300 47×123-35×95 2142×158×82×218≈4.512. 答案 4.512 4.下列关于独立性检验的4个叙述,说法正确的是________. ①χ2 的值越大,说明两事件相关程度越大; ②χ2 的值越小,说明两事件相关程度越小; ③χ2 ≤3.841时,有95%的把握说事件A 与B 无关; ④χ2 >6.635时,有99%的把握说事件A 与B 有关. 解析 在独立性检验中,随机变量χ2 的取值大小只能说明“两分类变量有关”,这一结论 的可靠程度,即可信度,而不表示两事件相关的程度,故①②不正确.χ2 >6.635说明有99%的把握认为二者有关系,χ2≤3.841时,若x 2 >2.706则有90%的把握认为事件A 与B 有关系.因

此可知③中说法是不正确的. 答案 ④ 5.想要检验是否喜欢参加体育活动是不是与性别有关,应该假 设________________. 解析 独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时 的χ2应该很小,如果χ2很大,则可以否定假设;如果χ2 很小,则不能够肯定或者否定假设. 答案 H 0:喜欢参加体育活动与性别无关 6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行 了3年的跟踪研究,调查他们是否发作过心脏病,调查结果如下表所示: 解 提出假设H 0:两种手术对病人又发作心脏病没有影响.由列联表,得 χ2=392× 39×167-157×29 2196×196×68×324 ≈1.780<2.706. 因为当H 0成立时,χ2 ≥1.780的概率大于10%,这个概率比较大,所以根据目前的调查数 据,不能否定假设H 0,故我们没有理由说这两种手术与“又发作过心脏病”有关,故可以认为病人是否发作心脏病跟他做过何种手术无关. 综合提高 限时30分钟 7. 2008年10月8日为我国第十一个高血压日,主题是“在家测量您的 血压”.某社区医疗服务部门为了考察该社区患高血压病是否与食盐摄入 量有关,对该社区的1 633人进行了跟踪调查,得出以下数据: 计算χ2有关系.

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

《独立性检验的基本思想及其初步应用》说课稿

《独立性检验的基本思想及其初步应用》说课稿 各位专家、老师,大家好。我叫***,来自***中学,今天我说课的内容是《独立性检验的基本思想及 其初步应用》。 根据新课标的理念,对于本节课,我将以教什么,怎样教,为什么这样教为思路,从教材分析、学情 分析、目标分析、教法设计、教学过程、教学反思这六个方面来阐述我对本节课的构思。 一、教材分析 本节课是人教A版选修2-3第三章第二节第一课时,通过对典型案例的探究,了解独立性检验的基本 思想、方法及其初步应用。 学生学习了利用回归分析研究两个变量间的相关关系,本节课利用独立性检验进一步分析两个分类变 量之间是否有关系,是高中数学知识中体现统计思想的重要内容。 学生是教学的主体,只有了解学情,才能有效的进行课堂教学。 二、学情分析 知识上:学生已经学习过统计、变量回归分析等知识,这为本节课的学习提供了知识基础。 能力方面:学生具备了一定的认知、分析、归纳能力;能够进行小组活动。 学生缺少深入探究问题的方法;运算能力和语言表达能力有待提高。 针对这个问题,课堂上我通过适时引导学生探究,鼓励学生积极展示来解决。 三、目标分析 根据新课标对本节课的教学要求以及本节课教学内容特点,结合学情,我制定以下教学目标: 知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检 验,明确独立性检验的基本步骤,并能解决实际问题。 过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂 主体。 情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。 基于以上分析,我确立本节课的: 教学重点:了解独立性检验的基本思想及实施步骤。 教学难点:独立性检验的基本思想;随机变量K2的含义。 为了突出重点、突破难点,在教法和学法上我是这样设计的: 四、教法设计 结合本节课的教学内容和学生的认知水平,在教法上:我坚持以学生为主体,教师为主导的原则,采 用“合作探究”的教学模式。通过精心设置问题,以问题为驱动,引导学生积极探究;组织学生分组讨 论,适时指导评价;点评学生展示成果,归纳总结。 在学法上:我以培养学生的探究能力为出发点,着眼于知识的形成和发展,注重学生的学习体验,把 学习过程分成四个步骤,由浅入深、循序渐进。 结合教法、学法,在教学上我将用八个环节来达成我的教学目标。 五、教学过程 1、情境引入,提出问题 我首先让学生观看视频: 提出问题1:“你认为吸烟与患肺癌有关系吗?”怎样用数学知识说明呢? 这样从实际问题抽象出数学问题,既激发了学生的求知欲,也为顺利实施本节课的教学目标打下了良 好的基础. 2、阅读教材,探究新知 在兴趣的引领和问题的驱动下,学生认真阅读教材,学习新知。我利用多媒体展示各种图片,更加形 象地说明分类变量的不同取值。明确指出,对于分类变量重点探究的是“两个分类变量之间是否有关系”。 “我们经常说吸烟容易得肺癌,是不是吸烟一定得肺癌呢?”(不一定) 我接着问:吸烟是否对患肺癌有影响呢?(有) 1

独立性检验的基本思想及其初步应用习题及答案

数学·选修1-2(人教A版) 独立性检验的基本思想及其初步应用 ?达标训练 1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图B.等高条形图 C.2×2列联表 D.以上均不对 答案:B 2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) 与 d c+d 与 a c+d 与 c c+d 与 c b+c 答案:C 3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( ) A.k越大,“ X与Y有关系”可信程度越小 B.k越小,“ X与Y有关系”可信程度越小 C.k越接近于0,“X与Y无关”程度越小 D.k越大,“X与Y无关”程度越大 答案:B 4.下面是一个2×2列联表:

则表中a、b的值分别为( ) A.94、96 B.52、50 C.52、54 D.54、52 答案:C 5.性别与身高列联表如下: 那么,检验随机变量K2的值约等于 ( ) A. B. C.22 D. 答案:C 6.给出列联表如下: 根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) A.B.0.5 C.D. 答案:B

?素能提高 1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( ) A .男人、女人中患有色盲的频率分别为、 B .男人、女人患色盲的概率分别为19240、3 260 C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 D .调查人数太少,不能说明色盲与性别有关 解析:男人患色盲的比例为38480,比女人中患色盲的比例6 520 大, 其差值为?? ???? 38480-6520≈ 6,差值较大. 答案:C 2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=算得, K 2=≈. 附表: 参照附表,得到的正确结论是( ) A .有99%以上的把握认为“爱好该项运动与性别有关” B .有99%以上的把握认为“爱好该项运动与性别无关” C .在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关” D .在犯错误的概率不超过%的前提下,认为“爱好该项运动与性

高考试题回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

不得病 61 213 274 合计 93 314 407 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问 题中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随 机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 ()0.55i i y y =-=∑,7≈. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+) )) 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据 测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:

高中数学第一章统计案例1.2独立性检验是如何判断两个事件是否相互独立的素材北师大版

独立性检验是如何判断两个事件是否相互独立的 独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2χ应该很小.如果由观测数据计算得到的2χ的观测值很大,则在一定程度上说明假设不合理.根据随机变量 2χ的含义,可以通过概率式评价 该假设不合理的程度,由实际计算的2χ>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%. 当2χ≤3.841时,认为两个分类变量是无关的.对于两事件而言即相互独立. 1.两个事件独立的判定 例1: 为了研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进 根据193个病人的数据,能否作出药的效果与给药方式有关的结论?请说明理由. 解:提出假设H 0:药的效果与给药方式无关系. 根据列联表中的数据,得χ2 =2 193(58314064)122719895 -?-????≈1.3896<2.072. 当H 0成立时,χ2 >1.3896的概率大于15%, 这个概率比较大,所以根据目前的调查数据,不能否定假设H 0,即不能作出药的效果与给药方式有关的结论. 注意:这是一个由列联表来验证的独立性检验问题,其结论是没有关系的假设成立.并且应该注意上述结论是对所有口服药物与注射药物的实验人而言的,绝不要误以为对被跟踪的193个跟踪研究对象成立. 例2:调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系. 分析:利用表中的数据通过公式计算出2χ统计量,可以用它的取值大小来推断 独立性是否成立. 解:由公式 ()841.368892.357 3234553182624892 2 <≈????-??= χ 故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关).

卡方独立性检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

1.2独立性检验的基本思想及其初步应用(学、教案)

1. 2 独立性检验的基本思想及其初步应用 课前预习学案 一、预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本 思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 二、预习内容 1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程. 温度/x C 21 23 25 27 29 32 35 产卵数/y 个 7 11 21 24 66 115 325 (学生描述步骤,教师演示) 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 课内探究学案 一、学习要求: 通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用 学习重点: 对独立性检验的基本思想的理解. 学习难点: 独立性检验的基本思想的应用. 二、学习过程: 知识点详解 知识点一:分类变量 对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 知识点二:列联表 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人): 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验 这种利用随机变量K 2 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 知识点四:判断结论成立的可能性的步骤 一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样 501001502002503003500 10203040 温度 产卵数

随机变量及其分布列与独立性检验练习题附答案

数学学科自习卷(二) 一、选择题 1.将三颗骰子各掷一次,记事件A =“三个点数都不同”,B =“至少出现一个6点”,则条件概率()P A B ,() P B A 分别是( ) A.6091,12 B.12,6091 C.518,6091 D.91216,12 2.设随机变量ξ服从正态分布()3,4N ,若()()232P a P a ξξ<-=>+,则a 的值为 A .73 B .53 C .5 D .3 3.已知随机变量ξ~)2,3(2N ,若23ξη=+,则D η= A . 0 B . 1 C . 2 D . 4 4.同时拋掷5枚均匀的硬币80次,设5枚硬币正好出现2枚正面向上,3枚反面向上的次数为ξ,则ξ的数学期望是( ) A .20 B .25 C. 30 D .40 5. 甲乙两人进行乒乓球比赛, 约定每局胜者得1分, 负者得0分, 比赛进行到有一人比对方多2分或打满6局时停止, 设甲在每局中获胜的概率为 23,乙在每局中获胜的概率为13 ,且各局胜负相互独立, 则比赛停止时已打局数ξ的期望()E ξ为( ) A .24181 B .26681 C .27481 D .670243 6.现在有10奖券,82元的,25元的,某人从中随机无放回地抽取3奖券,则此人得奖金额的数学期望为( ) A .6 B .395 C .415 D .9 7.一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,,,(0,1)a b c ∈,且无其它得分情况,已知他投篮一次得分的数学期望为1,则ab 的最大值为 ( ) A .148 B .124 C .112 D .16 8.位于数轴原点的一只电子兔沿着数轴按下列规则移动:电子兔每次移动一个单位,移动的方向向左或向右,并且向左移动的概率为 23,向右移动的概率为13,则电子兔移动五次后位于点(1,0)-的概率是 ( ) A .4243 B .8243 C .40243 D .80243

回归方程和独立性检验知识点

回归分析和独立性检验 一、回归分析 1、回归直线方程 a x b y ???+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n i i n i i i x x y y x x b 1 2 1 )() )((?= ∑∑==--n i i n i i i x n x y x n y x 1 2 21 (由最小二乘法得出,考试时给出此公式中的一个) x b y a ??-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。 ) 2、几条结论: (1)回归直线过样本的中心点)(y x ,。 (2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。 (3)斜率b 的含义(举例): 如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。 (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r r 越大.,相关性越强. 。0>r 时,y 与x 正相关;0

1独立性检验(应用检测题)

本套试题考查的内容比较全面,独立性检验的概念与方法、2×2列联表、随机变量2 K 的值、三维柱形图、二维条形图、等高条形图等知识点在试题中都得到了充分体现,很多试题与现实生活相联系,新颖别致,有大量的原创与改编试题。 独立性检验的基本思想及其初步应用同步测试题 A 组 一、选择题 1.独立性检验中的统计假设就是假设两个事件A 、B ( ) A 互斥 B 不互斥 C 相互独立 D 不独立 2.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就 ( ) A. 越大 B. 越小 C.无法判断 D. 以上都不对 3.2010年3月26日,韩国军舰“天安”号发生不明原因爆炸事故离奇沉没,5月20日韩国军民联合调查团公布的调查结果说天安舰是遭受朝鲜小型潜水艇发射的鱼雷攻击而沉没的。对此,许多网民表达了自己的意见,有的网友进行了调查,在参加调查的4258名男性公民中有2360名认为是朝鲜所为,3890名女性公民中有2386人认为朝鲜是遭陷害,在运用这些数据说明天安舰事件中朝鲜是否冤枉时用什么方法最有说服力?( ) A 平均数 B 回归分析 C 独立性检验 D 方差 4.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度。如果k>5.024,那么就有把握认为“X 和Y 有关系”的百分比为 A.25% B.75% C.2.5% D.97.5% 5.假设有两个分类变量X 和Y ,它们的值域分别为},{21x x 和},{21y y ,其2×2列联表为: 对以下数据,对同一样本能说明X与Y有关的可能性最大的一组为( ) A .5=a ,4=b ,3=c ,2=d B .5=a ,3=b ,4=c ,2=d C .2=a ,3=b ,4=c ,5=d D .2=a ,3=b ,5=c ,4=d 6.考察玉米种子经过药物处理跟生病之间的关系得到如下表数据:

无差检验、独立性检验 SPSS

作业6: 1.无差检验 随机从某市抽取90名教师,其中高级职称有30名,中级职称有42名,初级职称有18名。若假设规定高、中、初级职称比为2:6:2,试问这一调查结果是否与规定相一致? 注:上表中“1”表示高级职称、“2”表示中级职称、“3”表示初级职称。 (2)研究假设 零假设:这一调查结果与规定一致。 备择假设:这一调查结果与规定不一致。 (3)操作说明 1.输入数据。保存为“数据1”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案” 对话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使 之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数 据编辑框。 3.卡方检验。单击“分析”菜单下的“非参数检验”,选项中得“卡方检验”命令。 在弹出的“卡方检验”对话框中,因为要对高级职称、中级职称、初级职称的人数 进行分析,所以在对话框左侧的列表中选择“职称”变量,单击“添加”按钮使之 添加到“检测变量列表”框中。在“期望值”框中得“数值”处输入理论上高级职 称、中级职称、初级职称的比例2:6:2,然后单击“确定”按钮,SPSS开始进行卡 方检验。 (4)生成图表及结果解释 从第一个表格中可以看出高、中、初级职称的实际观测值、理论值和两者之间的差异个数;从第二个表格中可以看出自由度df=2,X2=10.667>9.210= X20.01 (2), P<0.01,所以拒绝零假设,支持备择假设,即这一调查结果与规定不一致。

2.独立性检验 在研究初中厌学学生意志力时,某研究得到下表样本资料,试问厌学学生的意志力水平是否与年级有关? (1)原始数据 (2)研究假设 零假设:厌学学生的意志力水平与年级无关。 备择假设:厌学学生的意志力水平与年级有关。 (3)操作说明 1. 输入数据。保存为“数据2”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案”对 话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数据编辑框。 3.独立性检验。单击“分析”菜单下的“描述统计”中得“交叉表”选项,在弹出的“交叉表”对话框中,将左边列表中得“年级”添加到“行”变量框中,将左边列表框中得“意志力水平”添加到“列”变量中。点击“统计量”按钮,在弹出的对话框中,选择“卡方检验”单选项。点击“继续”按钮,返回到“交叉表”对话框中,点击“确定”。SPSS开始进行独立性检验。 (4)生成图表及结果解释。

(完整版)1.2.2独立性检验的基本思想及其初步应用习题及答案

数学·选修1-2(人教A版) 1.2 独立性检验的基本思想及其初步应用 ?达标训练 1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图B.等高条形图 C.2×2列联表 D.以上均不对 答案:B 2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A. a a+b 与 d c+d B. c a+b 与 a c+d C. a a+b 与 c c+d D. a a+b 与 c b+c 答案:C 3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( ) A.k越大,“ X与Y有关系”可信程度越小 B.k越小,“ X与Y有关系”可信程度越小 C.k越接近于0,“X与Y无关”程度越小 D.k越大,“X与Y无关”程度越大 答案:B

4.下面是一个2×2列联表: 则表中a、b的值分别为( ) A.94、96 B.52、50 C.52、54 D.54、52 答案:C 5.性别与身高列联表如下: 那么,检验随机变量K2的值约等于 ( ) A.0.043 B.0.367 C.22 D.26.87 答案:C 6.给出列联表如下: 根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) A.0.4 B.0.5 C.0.75 D.0.85 答案:B

?素能提高 1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( ) A .男人、女人中患有色盲的频率分别为0.038、0.006 B .男人、女人患色盲的概率分别为19240、3 260 C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 D .调查人数太少,不能说明色盲与性别有关 解析:男人患色盲的比例为38480,比女人中患色盲的比例6 520 大, 其差值为?? ???? 38480-6520≈0.067 6,差值较大. 答案:C 2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2= 算得, K 2= ≈7.8. 附表: P (K 2≥k 0) 0.050 0.010 0.001 k 0 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A .有99%以上的把握认为“爱好该项运动与性别有关”

《独立性检验》

《独立性检验的基本思想及其初步应用》教学设计 东北师范大学附属实验学校李宇 一、教学内容与内容解析 1.内容: 独立性检验的基本思想及实施步骤 2.内容解析: 本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。 教学重点:理解独立性检验的基本思想及实施步骤. 二、教学目标与目标解析 1.目标: ①知识与技能目标 通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步

骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。 ②过程与方法目标 通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。这一直觉来自于观测数据,即样本。问题是这种来自于样本的印象能够在多大程度上代表总体。这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。 ③情感态度价值观目标 通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 2.目标解析: 独立性检验是考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.因此,在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力. 新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。从心理学的角度看,青少年有一种好奇的心态、探究的心理。因此,紧紧地抓住学生的这一特征,利用学生身边的问题“玩电脑游戏与注意力集中是否有关系”,设计教学情境,使学生在观察、讨论等活动中,逐步提高数据分析能力。 三、教学问题诊断分析 1.本节课的内容独立性检验对学生来说是全新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。 2.独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个

独立性检验练习含答案

§ 独立性检验 一、基础过关 1.当χ2>时,就有________的把握认为“x 与y 有关系”. 2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数) 3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号) y 1 y 2 总计 x 1 ( a b a +b x 2 c d c +d 总计 a +c b +d & a + b + c +d ①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 】 爱好 40 20 60 不爱好 20 30 50 总计 60 % 50 110 由 χ2=n ad -bc 2 a + b c + d a +c b +d 算得, χ2=110×40×30-20×20260×50×60×50≈. 附表: P (χ2≥k ) k ) 参照附表,得到的正确结论是________. ①在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”;

③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸 . 年龄 合计 不超过40岁 超过40岁 吸烟量不多于20支/天 50 15 65 ) 吸烟量多于20支/天 10 25 35 合计 60 40 100 则有________的把握确定吸烟量与年龄有关. 二、能力提升 — 6.某高校“ 专业 性别 非统计专业 统计专业 合计 男 13 10 23 | 女 7 20 27 合计 20 30 50 为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×13×20-10×7 2 23×27×20×30 ≈. 因为χ2≈>,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________. 7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. ~ 8.下列说法正确的是________.(填序号) ①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大; ③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. 9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据: 无效 有效 总计 ( 男性患者 15 35 50 女性患者 6 44 50

知识讲解 独立性检验的基本思想及其初步应用(文、理)

独立性检验的基本思想及其初步应用 编稿:赵雷审稿:李霞 【学习目标】 1. 了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用 2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用. 【要点梳理】 要点一、分类变量 有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。 要点诠释: (1)对分类变量的理解。 这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。 (2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。 要点二、2×2列联表 1. 列联表 用表格列出的分类变量的频数表,叫做列联表。 2. 2×2列联表 对于两个事件A ,B ,列出两个事件在两种状态下的数据,如下表所示: 这样的表格称为2×2列联表。 要点三:卡方统计量公式 为了研究分类变量X 与Y 的关系,经调查得到一张2×2列联表,如下表所示 统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 22 ()()()()() n ad bc K a b c d a c b d -=++++(n a b c d =+++为样本容量)。 要点四、独立性检验

1. 独立性检验 通过2×2列联表,再通过卡方统计量公式计算2K 的值,利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 2. 变量独立性的判断 通过对2K 统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断: ①如果2K ≤3.841时,认为事件A 与B 是无关的。 ②如果2K >3.841时,有95%的把握说事件A 与事件B 有关; ③如果2 K >6.635时,有99%的把握说事件A 与事件B 有关; 要点诠释: (1)独立性检验一般是指通过计算2K 统计量的大小对两个事件是否有关进行判断; (2)独立性检验的基本思想类似于反证法。即在H 0:事件A 与B 无关的统计假设下,利用2K 统计量的大小来决定在多大程度上拒绝原来的统计假设H 0,即拒绝“事件A 与B 无关”,从而认为事件A 与B 有关。独立性检验为假设检验的特例。 (3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。 3.独立性检验的基本步骤及简单应用 独立性检验的步骤: 要推断“A 与B 是否有关”,可按下面步骤进行: (1)提出统计假设H 0:事件A 与B 无关(相互独立); (2)抽取样本(样本容量不要太小,每个数据都要大于5); (3)列出2×2列联表; (4)根据2×2列联表,利用公式:22 ()()()()() n ad bc K a c b d a b c d -=++++,计算出2 K 的值; (5)统计推断:当2 K >3.841时,有95%的把握说事件A 与B 有关; 当2 K >6.635时,有99%的把握说事件A 与B 有关; 当2K >10.828时,有99.9%的把握说事件A 与B 有关; 当2K ≤3.841时,认为事件A 与B 是无关的. 要点诠释: ① 使用2 K 统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.

相关主题