高中数学统计抽样方法精选题目(附答案)
一、抽样方法
1.简单随机抽样
(1)特征:
①一个一个不放回的抽取;
②每个个体被抽到可能性相等.
(2)常用方法:
①抽签法;
②随机数表法.
2.系统抽样
(1)适用环境:当总体中个数较多时,可用系统抽样.
(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.
3.分层抽样
(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.
(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.
1.(1)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()
A.7B.9
C.10 D.15
(2)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.
[解析](1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为a n=9+30(n-1)=30n-21,
由451≤30n-21≤750,得236
15≤n≤
257
10,所以n=16,17,…,25,共有25-16+1=10人.
(2)小学中抽取30×150
150+75+25=18所学校;从中学中抽取30×
75
150+75+25
=9所学
校.
[答案](1)C(2)189
注:
1.系统抽样的特点
(1)适用于元素个数很多且均衡的总体. (2)各个个体被抽到的机会均等.
(3)总体分组后,在起始部分抽样时采用的是简单随机抽样. (4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =N
n . 2.与分层抽样有关问题的常见类型及解题策略
(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.
(2)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.
(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数. 2.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A .抽签法
B .系统抽样法
C .分层抽样法
D .随机数法
解析:选C 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为________.
解析:高三年级学生人数为430-160-180=90,设高三年级抽取x 人,由分层抽样可得
32180=x
90,解得x =16. 答案:16
4.某单位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为________.
解析:因为分层抽样的抽样比应相等,所以420960=14
样本容量,样本容量=960×14420=32.
答案:32
二、用样本的频率分布估计总体的频率分布
1.频率分布直方图
2.茎叶图
5.(1)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,
其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为
11,则样本中平均气温不低于25.5 ℃的城市个数为________.
(2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].
①求图中a的值;
②根据频率分布直方图,估计这100名学生语文成绩的平均分;
③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
[
为50×0.18=9.
答案:9
(2)解:①由频率分布直方图可知(0.04+0.03+0.02+2a)×10=1.
所以a=0.005.
②该100名学生的语文成绩的平均分约为
x=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.
③由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:
100-(5+20+40+25)=10.
注:
与频率分布直方图有关问题的常见类型及解题策略
(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
6.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶
图,则数据落在区间[22,30)内的频率为()
A.0.2 B.0.4
C.0.5 D.0.6
解析:选B由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)
内的频率为4
10=0.4,故选B.
7.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重大于70.5公斤的人数为()
A.300 B.360
C.420 D.450
解析:选B样本中体重大于70.5公斤的频率为:
(0.04+0.034+0.016)×2=0.090×2=0.18.
故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 000×0.18=360(人).8.某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.
解析:总销售额为2.5
0.1=25(万元),故11时至12时的销售额为0.4×25=10(万元).
答案:10
三、用样本的数字特征估计总体的数字特征
有关数据的数字特征
9.(1)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )
A .46,45,56
B .46,45,53
C .47,45,56
D .45,47,53
(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A .甲的成绩的平均数小于乙的成绩的平均数
B .甲的成绩的中位数等于乙的成绩的中位数
C .甲的成绩的方差小于乙的成绩的方差
D .甲的成绩的极差小于乙的成绩的极差
(3)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
[解析] (1)从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+47
2
=46,众数为45,极差为68-12=56,故选择A.
(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为1
5×[(4
-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,1
5×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9
-6)2]=12
5
,C 对;甲、乙的成绩的极差均为4,D 错.故选C.
(3)假设这组数据按从小到大的顺序排列为x 1
,x 2
,x 3
,x 4
,则???
x 1
+x 2
+x 3
+x
4
4
=2,x 2
+x
3
2=2,
∴
?????
x 1+x 4=4,x 2+x 3
=4, 又s = 1
4[(x 1
-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2] =
1
2
(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2
=
1
2
2[(x 1-2)2+(x 2-2)2]=1, ∴(x 1-2)2+(x 2-2)2=2. 同理可求得(x 3-2)2+(x 4-2)2=2.
由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2+(y -2)2=2上的点,分析知x 1,x 2,x 3,x 4应为1,1,3,3.
[答案] (1)A (2)C (3)1,1,3,3 注:
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
10.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③
D .②④
解析:选B 法一:∵x 甲=26+28+29+31+31
5=29,
x 乙=28+29+30+31+325=30,
∴x 甲 又s 2甲 =9+1+0+4+45=185,s 2乙=4+1+0+1+4 5 =2, ∴s 甲>s 乙.故可判断结论①④正确. 法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B. 11.甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是__________,气温波动较大的城市是__________. 解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为9+13+17×2+18+22 6= 16,乙城市上半年的平均温度为12+14+17+20+24+27 6=19,故两城市中平均温度较高的 是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大. 答案:乙 乙 12.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103; 乙:99,100,102,99,100,100. (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1)x 甲=99+100+98+100+100+103 6=100(mm), x 乙=99+100+102+99+100+1006 =100(mm), s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=7 3 (mm 2), s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2 ]=1(mm 2). (2)因为s 2甲>s 2乙,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求. 四、线性回归 1.两个变量的线性相关 (1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关: ①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量 之间具有线性相关关系,这条直线叫做回归直线. (2)线性回归方程: 方程y ^=b ^x +a ^ 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数. ????? b ^=∑i =1 n (x i -x )(y i -y )∑i =1 n (x i -x )2 =∑i =1 n x i y i -n x y ∑i =1 n x 2i -n x 2 ,a ^ =y -b x . 13.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: (1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) [解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =1 6(90+84+83+80+75+68) =80. 所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^ =-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250) =-20x 2+330x -1 000 =-20(x -8.25)2+361.25. 当且仅当x =8.25时,L 取得最大值. 故当单价定为8.25元时,工厂可获得最大利润. 注: (1)线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算. (2)回归直线方程恒过点(x ,y ). 14.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与 某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料: 回归方程,再用被选取的2组数据进行检验. (1)求选取的2组数据恰好是相邻两个月的概率; (2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? 解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}共15个基本事件,设抽到相邻两个月的事件为A ,则A ={(1,2),(2,3),(3,4),(4,5),(5,6)}共5个基本事件, ∴P (A )=515=1 3 . (2)由表中数据求得x =11,y =24, ∑i =1 4x i y i =1 092,∑i =1 4 x 2i =498. 代入公式可得b ^=187 . 再由a ^=y -b ^x ,求得a ^ =-307, 所以y 关于x 的线性回归方程为 y ^=187x -307 . (3)当x =10时,y ^=150 7,????1507-22=47<2; 同样,当x =6时,y ^=78 7,????787-12=67<2. 所以该小组所得线性回归方程是理想的.