阶段性测试题十(统计、统计案例)
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟. 第Ⅰ卷(选择题 共50分)
一、选择题(本大题共10个小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2015·潍坊联考)某学校从高二甲、乙两个班中各选6名同学参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的平均分为81,则x +y 的值为( )
甲 乙 9 7 7 8 y 5 0 x 8 1 1 0 1
9
2
A .6
B .7
C .8
D .9 [答案] D
[解析] 由众数的定义知x =5,由乙班的平均分为81得78+70+y +81+81+80+92
6=81,解得y =4,故x +y =9.
2.(文)若M 个数的平均数是X ,N 个数的平均数是Y ,则这M +N 个数的平均数是( ) A .X +Y 2 B .X +Y M +N
C .MX +NY M +N
D .MX +NY X +Y
[答案] C
[解析] 该题考查平均数的概念及运算.共有M +N 个数,这M +N 个数的和为(MX +NY),故这M +N 个数的平均数为
MX +NY
M +N
. (理)期中考试后,班长算出了全班40名同学的数学成绩的平均分为M.如果把M 当成一个同学的分数,与原来的40个分数加在一起,算出这41个分数的平均值为N ,那么M N 为( ) A .40 41 B .1 1 C .41 40 D .2 1 [答案] B
[解析] 设40个人的成绩依次为a1,a2,…,a40,则 M =a1+a2+…+a4040
. 当把该平均分M 当成一个人的分数时,41个分数的平均值为N =a1+a2+…+a40+M
41
=40M +M
41=M ,
故M N =1 1.
3.某班78名同学已编号1,2,…,78,为了了解该班同学的作业情况,老师收取了编号能被5整除的15名同学的作业,这里运用的抽样方法是( )
A .简单随机抽样
B .系统抽样
C .分层抽样
D .抽签法 [答案] B
[解析] 由抽样方法知,应选B .
4.一个社会调查机构就某地居民的月收入调查了20000人,并根据所得数据画出了样本频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,按月收入用分层抽样方法抽样,若从月收入[3000,3500)(元)段中抽取了30人,则这20000人中共抽取的人数为( )
A .200
B .100
C .20000
D .40 [答案] A
[解析] 由题意得,月收入在[3000,3500)(元)段中的频率是0.0003×500=0.15,该收入段的人数是20000×0.15=3000(人),从中抽取了30人,说明从每100人中抽取1个,故共抽取20000100=200(人).
5.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y 与x 负相关且y ^
=2.347x -6.423; ②y 与x 负相关且y ^
=-3.476x +5.648; ③y 与x 正相关且y ^
=5.437x +8.493; ④y 与x 正相关且y ^
=-4.326x -4.578 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ [答案] D
[解析] 若y 与x 负相关,则y ^
=bx +a 中b<0,故①不正确,②正确; 若y 与x 正相关,则y ^
=bx +a 中b>0,故③正确,④不正确;故选D .
6.(2014·广东高考)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A .50 B .40 C .25 D .20 [答案] C
[解析] 本题考查系统抽样.
从1000名学生中抽取40名,分成40组,每组25人,间隔为25.选C .系统抽样又叫等距抽样.
7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归直线方程y ^
=0.67x +54.9.表中一个数据模糊不清,请你推断出该数据的值为( )
零件数x(个) 10 20 30 40 50 加工时间y(min)
62
75
81
89
A .75
B .62
C .68
D .81 [答案] C
[解析]
设表中模糊看不清的数据为m ,由表中数据得:
x -=30,y -=m +3075,
由于由最小二乘法求得回归方程y =0.67x +54.9, 将x -=30,y -=m +307
5代入回归直线方程,
得m =68,故选C . 8.(2014·安徽示范高中联考)给出下列五个命题:
①将A 、B 、C 三种个体按3 1 2的比例分层抽样调查,如果抽取的A 个体为9个,则样本容量为30;
②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;
③甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲;
④已知具有相关关系的两个变量满足的回归直线方程为y =1-2x ,则x 每增加1个单位,y 平均减少2个单位;
⑤统计的10个样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为0.4. 其中真命题为( ) A .①②④ B .②④⑤ C .②③④ D .③④⑤ [答案] B
[解析] ①样本容量为9÷36=18,①是假命题;②数据1,2,3,34,5的平均数为1
5(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③x -
乙=5+6+9+10+55=7,s2乙=15[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=15×(4+1+4+9+4)=4.4,∵s2甲>s2乙,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求概率为4
10=0.4,⑤是真命题.
9.(文)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图如图,后来有1个数据模糊,无法辨认,在图中以x 表示:
8 7 7 9 4 0 1 0 x 9 1
则7个剩余分数的方差为( ) A .1169 B .367 C .36
D .677
[答案] B
[解析] 去掉最高最低分后的数据为87,90,90,91,91,94,90+x ,
由x -
=91=87+90+90+91+91+94+ 90+x 7得x =4,则方差s2=[(87-91)2+(90-91)2+(90-91)2+(91-91)2+(94-91)2+(91-91)2+(94-91)2]=367.
(理)某班有48名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是( )
A .70,25
B .70,50
C .70,1.04
D .65, 25 [答案] B
[解析] 易得x 没有改变,x =70,
而s2=1
48[(x21+x22+…+502+1002+…+x248)-48x 2]=75, s ′2=148[(x21+x22+…802+702+…+x248)-48x 2] =1
48[(75×48+48x 2-12500+11300)-48x 2] =75-1200
48=75-25=50.
10.一个频率分布表(样本容量为30)不小心被损坏了一部分(如图),只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)上的数据个数可能是( )
A .7和6
B .6和9
C .8和9
D .9和10 [答案] B
[解析] 因样本中数据在[20,60)上的频率为0.8,则样本中数据在[20,60)上的频数为30×0.8=24.又因为样本中数据在[20,40)上的频数为4+5=9, 所以样本在[40,60)上的数据的个数为30×0.5=15. 第Ⅱ卷(非选择题 共100分)
二、填空题(本大题共5个小题,每小题5分,共25分,把正确答案填在题中横线上) 11.(文)(2014·湖北高考)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. [答案] 1800
[解析] 本题考查分层抽样.
设乙厂生产的总数为n 件,则80-50n =80
4800,
解得n =1800. (理)(2014·天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4 5 5 6,则应从一年级本科生中抽取________名学生. [答案] 60
[解析] 本题考查分层抽样.
∵人数比4 5 5 6,设每份为x ,
则4x +5x +5x +6x =20x =300,∴x =15, ∴一年级抽15×4=60人.
12.今年3月份,某报社做了一次关于“什么是新时代的雷锋精神?”的调查,在A 、B 、C 、D 四个单位回收的问卷数依次成等差数列,共回收1000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B 单位抽30份,则在D 单位抽取的问卷是________份. [答案] 60
[解析] 因为在A 、B 、C 、D 四个单位回收的问卷数依次成等差数列,所以从A 、B 、C 、D 按单位分层抽取的容量也成等差数列,设公差为d ,则(30-d)+30+(30+d)+(30+2d)=150,所以d =15,所以在D 单位抽取的问卷是30+2d =60份.
13.我校高三(4)班共有56人,学生编号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容易为4的样本,已知编号为6,34,48的同学在样本中,那么还有一位同学的编号应为________. [答案] 20
[解析] 系统抽样也是等距抽样,因为第三、第四两段中抽取的编号之差为14, 所以第二段中抽取的编号与第一段中抽取的编号之差也为14, 所以还有一位同学的编号应为20. 14. (2015·银川第一次质检)如图是甲、乙两名篮球运动员2014年赛季每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是________.
甲 乙
7
1 2 6 2 8 2 3 1 9 6 4 5
3 1 2
[答案] 54
[解析] 甲得分为:17,22,28,34,35,26,其中位数为28+34
2=31;乙得分为:12,16,21,23,29,31,32,其中位数为23,故甲、乙两人比赛得分的中位数之和是54.
15.某高中共有学生2000名,已知在全校学生中随机抽取1名,抽到高三年级男生的概率是0.1,现用分层抽样的方法在全校抽取若干名学生参加社区服务,相关信息如下表:
年级 高一 高二 高三 男生(人数) a 310 b 女生(人数) c d 200 抽样人数
x
15
10
则x =________.
[答案] 25
[解析] 由抽到高三年级男生的概率是0.1,可得b =200,设在全样抽取n 名学生参加社区服务,
则有n 2000=10200+200,解得n =50,
∴x =50-15-10=25.
三、解答题(本大题共6个小题,共75分,解答应写出文字说明,证明过程或演算步骤)
16.(本小题满分12分)某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分. [解析] (1)分数在[120,130)内的频率为:
1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3. 频率组距=0.3
10
=0.03,补全后的直方图如下:
(2)平均分为:
x -
=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.
17.(本小题满分12分)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表.
甲 27 38 30 37 35 31 乙
33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.
[解析] (1)画茎叶图,中间数为数据的十位数
甲 乙
7 2 8 9 8 7 5 1 0 3 3 4 6 8
从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.
(2)根据公式得:x 甲=33,x 乙=33;s 甲=3.96,s 乙=3.35;甲的中位数是33,乙的中位数是33.5.综合比较,选乙参加比赛较为合适. 18.(本小题满分12分)(2014·北京高考)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9 [16,18) 2 合计
100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)
[解析] 思路分析:(1)从频率分布表中读出阅读时间不少于12小时人数求概率. (2)利用频率比组距为小矩形的高求解. (3)由图作出估计应为第4组.
(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是1-10
100=0.9. 从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)的有17人,频率为0.17, 所以a =频率组距
=0.17
2=0.085.
课外阅读时间落在组[8,10)的有25人,频率为0.25, 所以b =频率组距
=0.25
2=0.125.
(3)样本中的100名学生课外阅读时间的平均数为
1×6+3×8+5×17+7×22+9×25+11×12+13×6+15×2+17×2
100
=7.68
在第4组.
19.(本小题满分12分)地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视.某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取100名同学进行紧急避险常识知识竞赛.图(1)和图(2)分别是对七年级和八年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.
(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中, 同一组数据常用该组区间的中点值作为代表)
(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”?
成绩小于60分人数 成绩不小于60分人数 合计
七年级 八年级 合计
附:K2=n ad -bc 2
a +
b
c +
d a +c b +d
.临界值表:
P(K2≥k) 0.10 0.05 0.010 k
2.706
3.841
6.635
[解析] (1)七年级学生竞赛平均成绩为
(45×30+55×40+65×20+75×10)÷100=56(分), 八年级学生竞赛平均成绩为
(45×15+55×35+65×35+75×15)÷100=60(分). (2)2×2列联表如下:
成绩小于60分人数 成绩不小于60分人数 合计 七年级 70 30 100 八年级 50 50 100 合计
120
80
200
∴K2=200× 50×30-50×70 2
100×100×120×80
≈8.333>6.635, ∴有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”. 20.(本小题满分13分)某种产品的广告费支出x 与销售额(单位:百万元)之间有如下对应数据:
x 2 4 5 6 8
y 30 40 50 60
70
如果y 与x 之间具有线性相关关系. (1)作出这些数据的散点图; (2)求这些数据的线性回归方程;
(3)预测当广告费支出为9百万元时的销售额. [解析] (1)
(2)x -=5,y -
=50,∑i =15xiyi =1 390,∑i =1
5
x2i =145,
b =
∑i =1
5
xiyi -5x -·y
-
∑i =1
5
x2
i -5x -
2=7,a =y --b x -
=15,
∴线性回归方程为y =7x +15. (3)当x =9时,y =78.
即当广告费支出为9百万元时,销售额为78百万元.
21.(本小题满分14分)(文)某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],由统计的数据得到的频率分布直方图如图所示,下表是年龄的频率分布表.
区间 [25,30) [30,35) [35,40) [40,45) [45,50] 人数
25
a
b
(1)求正整数a ,b ,N 的值;
(2)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组中抽取的人数分别是多少?
(3)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的
概率.
[解析] (1)由频率分布直方图可知,[25,30)与[30,35)两组的人数相同, 所以a =25人. 且b =25×0.08
0.02=100人. 总人数N =25
0.02×5=250人.
(2)因为第1,2,3组共有25+25+100=150人,利用分层抽样在150名员工中抽取6人,每组抽取的人数分别为: 第1组的人数为6×25
150=1, 第2组的人数为6×25
150=1, 第3组的人数为6×100
150=4,
所以第1,2,3组分别抽取1人,1人,4人.
(3)由(2)可设第1组的1人为A ,第2组的1人为B ,第3组的4人分别为C1,C2,C3,C4,则从6人中抽取2人的所有可能结果为:(A ,B),(A ,C1),(A ,C2),(A ,C3),(A ,C4),(B ,C1),(B ,C2),(B ,C3),(B ,C4),(C1,C2),(C1,C3),(C1,C4),(C2,C3),(C2,C4),(C3,C4),共有15种.
其中恰有1人年龄在第3组的所有结果为:(A ,C1),(A ,C2),(A ,C3),(A ,C4),(B ,C1),(B ,C2),(B ,C3),(B ,C4),共有8种. 所以恰有1人年龄在第3组的概率为8
15.
(理)已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.
8 1 7 0 3 6 8 9 6 2 5 7 5 9 (1)若第5组抽出的号码为22,写出所有被抽出职工的号码;
(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;
(3)在(2) 的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率. [解析] (1)由题意,第5组抽出的号码为22.
因为2+5×(5-1)=22,所以第1组抽出的号码应该为2, 抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47. (2)因为10名职工的平均体重为
x -=1
10(81+70+73+76+78+79+62+65+67+59)=71,
所以样本方差为s2=1
10(102+(-1)2+22+52+72+82+(-9)2+(-6)2+(-4)2+(-12)2)=52.
(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,99),(76,81),(78,79),(78,81),(79,81). 记“体重为76公斤的职工被抽取”为事件A ,故所求概率为P(A)=410=2
5.