专题十概率与统计
第二十八讲统计初步
2019年
1.(2019全国1文6)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生B.200号学生C.616号学生D.815号学生2.(2019全国II文14)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
3.(2019全国II文19)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
≈.
8.602
4.(2019全国III文4)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为
A.0.5 B.0.6 C.0.7 D.0.8
5.(2019全国III文17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同. 经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代
表).
6.(2019江苏5)已知一组数据6,7,8,8,9,10,则该组数据的方差是.
7.(2019北京文17)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:
不大于2 000元大于2 000元
支付金额
支付方式
仅使用A 27人3人
仅使用B 24人1人
(Ⅰ)估计该校学生中上个月A,B两种支付方式都使用的人数;
(Ⅱ)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;
(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(Ⅱ)的结果,能否认为样本仅使用B 的学生中本月支付金额大于2 000元的人数有变化?说明理由.
8.(2019天津文15)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.
(Ⅰ)应从老、中、青员工中分别抽取多少人?
A B C D E F.(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,
享受情况如右表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
员工
A B C D E F
项目
子女教育○○×○×○
继续教育××○×○○
大病医疗×××○××
住房贷款利息○○××○○
住房租金××○×××
赡养老人○○×××○
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.
2010-2018年
一、选择题
1.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
2.(2017新课标Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩
产量(单位:kg)分别为1x ,2x ,…,n x ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A .1x ,2x ,…,n x 的平均数
B .1x ,2x ,…,n x 的标准差
C .1x ,2x ,…,n x 的最大值
D .1x ,2x ,…,n x 的中位数
3.(2017新课标Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理
了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是 A .月接待游客逐月增加 B .年接待游客量逐年增加
C .各年的月接待游客量高峰期大致在7,8月
D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 4.(2017山东)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:
件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为 A .3,5 B .5,5 C .3,7 D .5,7
5.(2016年全国III 卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均
最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个
6.(2016年北京)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.
在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则
A.2号学生进入30秒跳绳决赛B.5号学生进入30秒跳绳决赛
C.8号学生进入30秒跳绳决赛D.9号学生进入30秒跳绳决赛7.(2016年山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
A.56 B.60 C.120 D.140
8.(2015新课标2)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
9.(2015湖北)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为
A.134石B.169石C.338石D.1365石
10.(2015北京)某校老年,中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体情况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为
A.90 B.100 C.180 D.300
类别人数
老年教师900
中年教师1800
青年教师1600
合计4300
11.(2015四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是
A.抽签法B.系统抽样法C.分层抽样法D.随机数法
12.(2015陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数是
A.93 B.123 C.137 D.167
13.(2015湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为
A.3 B.4 C.5 D.6
14.(2014广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为
A.50 B.40 C.25 D.20
15.(2014广东)已知某地区中小学生人数和近视情况分别如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别是
A .200,20
B .100,20
C .200,10
D .100,10
16.(2014湖南)对一个容器为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系
统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为
123,,p p p ,则( )
A .123p p p =<
B .231p p p =<
C .132p p p =<
D .123p p p == 17.(2013新课标1)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取
部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是 A 、简单随机抽样
B 、按性别分层抽样
C 、按学段分层抽样
D 、系统抽样
18.(2013福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6
组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为
A .588
B .480
C .450
D .120
19.(2013山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平
均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x 表示:
9 4 0 1 0 x 9 1
8 7 7
则7个剩余分数的方差为 A .
116
9
B .
36
7
C .36 D
.7
20.(2012陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图
所示),则该样本的中位数、众数、极差分别是
6 1
7 8
5 0 0 1 1 4 7 94 5 5 5 7 7 8 8 93 1 2 4 4 8 9
2 0 2
3 3
1 2 5
A .46,45,56
B .46,45,53
C .47,45,56
D .45,47,53 二、填空题
21.(2018全国卷Ⅲ)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了
解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
22.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .
1
109998
23.(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
24.(2016年北京)某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,
第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店
①第一天售出但第二天未售出的商品有______种; ②这三天售出的商品最少有_______种.
25.(2015广东)已知样本数据1x ,2x ,???,n x 的均值5x =,则样本数据121x +,221x +,
???,21n x + 的均值为 .
26.(2015湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a = .
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .
27.(2014江苏)为了了解一片经济的生长情况,随机抽测了其中60株树木的底部周长(单
位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100cm .
28.(2014天津)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽
样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.
29.(2013辽宁)为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .
::,现用分层抽样的方法30.(2012江苏)某学校高一、高二、高三年级的学生人数之比为334
从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.31.(2012浙江)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.
32.(2012山东)右图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),
[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温
低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.
三、解答题
33.(2018全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3
m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)水量
频数 1 3 2 4 9 26 5
使用了节水龙头50天的日用水量频数分布表
日用
[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)水量
频数 1 5 13 10 16 5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 3
m的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中
的数据以这组数据所在区间中点的值作代表.)
34.(2018全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m
和不超过m的工人数填入下面的列联表:
超过m不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:22
()()()()()n ad bc K a b c d a c b d -=++++, 2()0.0500.0100.001
3.841 6.63510.828
P K k k ≥
35.(2017新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时
各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
新养殖法
旧养殖法
箱产量/kg
箱产量/kg
(1)记A 表示事件“旧养殖法的箱产量低于50kg”,估计A 的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较。 附:
2
2
()()()()()
n ad bc K a b c d a c b d -=++++
36.(2017北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使
用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
37.(2016年全国I卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
频数
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(I)若n=19,求y与x的函数解析式;
(II)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(III )假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个
易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
38.(2016年北京)某市民用水拟实行阶梯水价.每人用水量中不超过w 立方米的部分按4
元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
用水量(立方米)
频率组距0.50.40.30.20.1 4.54
3.53
2.5
2
1.5
1
0.5
O
(Ⅰ)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4
元/立方米,w 至少定为多少?
(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当w =3时,估计该市居民
该月的人均水费.
39.(2015新课标2)某公司为了解用户对其产品的满意度,从,A B 两地区分别随机调查了
40个用户,根据用户对产品的满意度评分,得分A 地区用户满意评分的频率分布直方图和B 地区用户满意度评分的频数分布表.
B 地区用户满意度评分的频数分布表
满意度评
分分组 [50,60)
[60,70)
[70,80)
[80,90)
[90,100)
频数
2
8
14
10
6
(Ⅰ)在答题卡上作出B 地区用户满意度评分的频数分布直方图,并通过直方图比较
两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级;
满意度评分 低于70分 70分到80分
不低于90分 满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
40.(2015广东)某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,
[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方
图如图2.
(Ⅰ)求直方图中x 的值;
(Ⅱ)求月平均用电量的众数和中位数;
(Ⅲ)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用
户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?
41.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数
据如下表:
(Ⅰ)求y 关于t 的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯
收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:
()()
()
1
2
1
n
i
i i n
i i t
t
y y b t t ∧
==--=
-∑∑,??a
y bt =- 42. (2014新课标1) 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指
标值,由测量表得如下频数分布表:
(I )在下表中作出这些数据的频率分布直方图:
质量指标值
频率/组距
125
115
105
95
85
75
0.0400.0380.0360.0340.0320.0300.0280.0260.0240.0220.0200.0180.0160.0140.0120.0100.0080.0060.0040.002
(II )估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值
作代表);
(III )根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低
于95的产品至少要占全部产品的80%”的规定?
43.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取
了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(I )根据已知条件完成下面22 列联表,并据此资料你是否认为“体育迷”与性别有关?
(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育
迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
2
1212
211222112
)(++++-=
n n n n n n n n n χ, 附: