搜档网
当前位置:搜档网 › 高考统计知识点汇总

高考统计知识点汇总

高考统计知识点汇总
高考统计知识点汇总

高考统计知识点汇总

————————————————————————————————作者:————————————————————————————————日期:

第二章:统计 1、抽样方法:

①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)

注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为

N

n 。 2、总体分布的估计: ⑴一表二图:

①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图:

①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计:

⑴平均数:n

x x x x x n

++++=Λ321; 取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ,则其平均数为

n n p x p x p x +++Λ2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:2

1

2)(1

∑=-=

n

i i

x x

n

s ;标准差:2

1

)(1∑=-=

n

i i

x x

n

s

注:方差与标准差越小,说明样本数据越稳定。

平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程

①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧

(最小二乘法)

1

221

n

i i i n

i i x y nx y b x nx a y bx

==?

-?

?=??-??=-??∑∑注意:线性回归直线经过定点),(y x 。 第三章:概率

1、随机事件及其概率:

⑴事件:试验的每一种可能的结果,用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=

A P n

m

A P . 2、古典概型:

⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点: ①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。

⑶古典概型概率计算公式:一次试验的等可能基本事件共有n 个,事件A 包含了其中的m 个基本事件,则事件A 发生的概率n

m A P =

)(. 3、几何概型:⑴几何概型的特点:①所有的基本事件是无限个;②每个基本事件都是等可能发生。

⑵几何概型概率计算公式:的测度

的测度

D d A P =

)(;

其中测度根据题目确定,一般为线段、角度、面积、体积等。 4、互斥事件:

⑴不可能同时发生的两个事件称为互斥事件;

⑵如果事件n A A A ,,,21Λ任意两个都是互斥事件,则称事件n A A A ,,,21Λ彼此互斥。 ⑶如果事件A ,B 互斥,那么事件A+B 发生的概率,等于事件A ,B 发生的概率的和, 即:)()()(B P A P B A P +=+

⑷如果事件n A A A ,,,21Λ彼此互斥,则有:)()()()(2121n n A P A P A P A A A P +++=+++ΛΛ ⑸对立事件:两个互斥事件中必有一个要发生,则称这两个事件为对立事件。 ①事件A 的对立事件记作A )(1)(,1)()(A P A P A P A P -==+

②对立事件一定是互斥事件,互斥事件未必是对立事件。 1、基本概念

⑴互斥事件:不可能同时发生的两个事件.

如果事件A B C 、、,其中任何两个都是互斥事件,则说事件A B C 、、彼此互斥.

当A B 、是互斥事件时,那么事件A B +发生(即A B 、中有一个发生)的概率,等于事件A B 、分别发生的概率的和,即 ()()()P A B P A P B +=+.

⑵对立事件:其中必有一个发生的两个互斥事件.事件A 的对立事件通常记着A .对立事件的概率和等于1. ()1()P A P A =-.

特别提醒:“互斥事件”与“对立事件”都是就两个事件而言的,互斥事件是不可能同时发生的两个事件,而对立事件是其中必有一个发生的互斥事件,因此,对立事件必然是互斥事件,但互斥事件不一定是对立事件,也就是说“互斥”是“对立”的必要但不充分的条件.

⑶相互独立事件:事件A (或B )是否发生对事件B (或A )发生的概率没有影响,(即其中一个事件是否发生对另一个事件发生的概率没有影响).这样的两个事件叫做相互独立事件.

当A B 、是相互独立事件时,那么事件A B ?发生(即A B 、同时发生)的概率,等于事件A B 、分别发生的概率的积.即 ()()()P A B P A P B ?=?.

若A 、B 两事件相互独立,则A 与B 、A 与B 、A 与B 也都是相互独立的. ⑷独立重复试验

①一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验.②独立重复试验的概率公式

如果在1次试验中某事件发生的概率是p ,那么在n 次独立重复试验中这个试验恰好发生k 次的概率

()()(1)

0,12,.,k

k

n k

n n P k n k C p p -==-L

⑸条件概率:对任意事件A 和事件B ,在已知事件A 发生的条件下事件B 发生的概率,叫做条件概率.记作P(B|A),读作A 发生的条件下B 发生的概率.公式:()

(),()0.()

P AB P B A P A P A =

> 2、离散型随机变量

⑴随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量 随机变量常

用字母,,,X Y ξη等表示.

⑵离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.

⑶连续型随机变量: 对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量.

⑷离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出.

若X 是随机变量,(,Y aX b a b =+是常数)

则Y 也是随机变量 并且不改变其属性(离散型、连续型). 3、离散型随机变量的分布列 ⑴概率分布(分布列)

设离散型随机变量X 可能取的不同值为12,x x ,…,i x ,…,n x , X 的每一个值i x (1,2,,i n =?)的概率()i i P X x p ==,则称表

X 1x 2x … i x … n x P

1p 2p … i p … n p

为随机变量X 的概率分布,简称X 的分布列.性质:①0,1,2,...;i p i n ≥= ②1

1.n

i i p ==∑

⑵两点分布 如果随机变量X 的分布列为

则称X 服从两点分布,并称(1)p P X ==为成功概率. ⑶二项分布

如果在一次试验中某事件发生的概率是p ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是

()(1).k k

n k n P X k C p p -==-

其中0,1,2,...,,1k n q p ==-,于是得到随机变量X 的概率分布如下:

X 0 1

… k …

n

P

00n n C p q

111

n n C p q -

k

k

n k

n C p q

- …

n n n C p q

我们称这样的随机变量X 服从二项分布,记作()p n B X ,~,并称p 为成功概率.

判断一个随机变量是否服从二项分布,关键有三点:

①对立性:即一次试验中事件发生与否二者必居其一;②重复性:即试验是独立重复地进行了n 次; ③等概率性:在每次试验中事件发生的概率均相等.

注:⑴二项分布的模型是有放回抽样;⑵二项分布中的参数是,,.p k n

⑷超几何分布 一般地, 在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件

{}X k =发生的概率为()(0,1,2,,)k n k M N M

n

N

C C P X k k m C --===L ,于是得到随机变量X 的概率分布如下:

X

0 1 P 1p -

p

其中{}min ,m M n =,*

,,,,n N M N n M N N ∈≤≤.

我们称这样的随机变量X 的分布列为超几何分布列,且称随机变量X 服从超几何分布.

注:⑴超几何分布的模型是不放回抽样;

⑵超几何分布中的参数是,,.M N n 其意义分别是 总体中的个体总数、N 中一类的总数、样本容量. 4、离散型随机变量的均值与方差

⑴离散型随机变量的均值 一般地,若离散型随机变量X 的分布列为

X 1x 2x … i x … n x P

1p 2p … i p … n p

则称()1122i i n n E X x p x p x p x p =+++++L L 为离散型随机变量X 的均值或数学期望(简称期望).它反映了离散型随机变量取值的平均水平.

性质:①()().E aX b aE X b +=+ ②若X 服从两点分布,则().E X p =

③若()p n B X ,~,则().E X np =

⑵离散型随机变量的方差

一般地,若离散型随机变量X 的分布列为

X 1x 2x … i x … n x P

1p 2p … i p … n p

则称

21

()(())n

i i i D X x E X p ==-∑为离散型随机变量X 的方差,并称其算术平方根()D X 为随机变量X 的标

准差.它反映了离散型随机变量取值的稳定与波动,集中与离散的程度.

()D X 越小,X 的稳定性越高,波动越小,取值越集中;()D X 越大,X 的稳定性越差,波动越大,

取值越分散.

性质:①2

()().D aX b a D X +=

②若X 服从两点分布,则()(1).D X p P =-

③若()p n B X ,~,则()(1).D X np P =-

5、正态分布

正态变量概率密度曲线函数表达式:()()R x e

x f x ∈?=

--

,212

2

2σμσ

π,其中σμ,是参数,且

X

0 1 … m

P 00n M N M n N C C C -- 11n M N M

n N C C C --

… m n m M N M n

N

C C C --

+∞<<-∞>μσ,0.记作2(,).N μσ如下图:

专题八:统计案例

1、回归分析

回归直线方程bx a y

+=?, 其中()()()1122211n n

i i i i i i n n

i

i i i x x y y x y nx y b x x x nx a y bx

====?

---?

?==?

--??

=-?∑∑∑∑相关系数:()()

()

()

12

2

1

1

n

i

i i n n

i i i i x

x y y r x x y y ===--=

--∑∑∑

1

222211n

i i

i n n

i i i i x y nxy

x nx y ny ===-=

????-- ???????

∑∑∑

2、独立性检验

假设有两个分类变量X 和Y ,它们的值域分另为{x 1, x 2}和{y 1, y 2},其样本频数2?2列联表为:

y 1 y 2 总计 x 1 a b a+b x 2 c d c+d 总计

a+c

b+d

a+b+c+d

若要推断的论述为H 1:“X 与Y 有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度.

具体的做法是,由表中的数据算出随机变量2

K 的值2

2

()()()()()

n ad bc K a b c d a c b d -=++++,其中

n a b c d =+++为样本容量,K 2的值越大,说明“X 与Y 有关系”成立的可能性越大.

随机变量2

K 越大,说明两个分类变量,关系越强;反之,越弱。

2 3.841K ≤时,X 与Y 无关;2 3.841K >时,X 与Y 有95%可能性有关;2 6.635K ≥时X 与Y 有99%

可能性有关.

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

概率统计知识点汇总

概率第一章 (一)概率的加减乘除运算 (二) 概率的计算 1. 古典概型的计算 2. 条件概率的计算 (三) 全概率公式与贝叶斯公式 (四) n 重伯努利试验 概率第二章 (一)随机变量分布函数 1. 分布函数的定义及性质 2. 学会用分布函数表示随机变量落入指定区域的概率 (二)离散型随机变量 1. 具体问题会求解离散型随机变量的分布列 分布列要满足的条件 2. 由分布列会求解分布函数 3. 由分布函数会求解分布列 4. 掌握三个常见的离散型随机变量 (三)连续型随机变量 1. 由分布函数会求解分布密度 2. 由分布密度会求解分布函数 3. 利用分布密度求解未知参数 4. 掌握三个常见的连续型随机变量 (四)随机变量函数的分布 1. 离散型随机变量的函数 2. 连续型随机变量的函数 概率第三章 二维随机向量 (一)联合分布函数的定义及性质 联合概率分布函数定义为____),(=y x F 联合分布函数的性质: ___),(____,),(),(),(=+∞+∞=-∞-∞=-∞=-∞F F y F x F 用联合概率分布函数表示二维随机向量落入指定区域的概率 ____),(2121=≤<≤

高项案例知识点总结

1、项目经理的选择和素质:P18-23 一个合格项目经理应具备的素质:(1)广博的知识,丰富的经历,良好的协调能力,良好的职业道德,良好的沟通和表达能力,良好的领导能力。 项目经理应具备的五大知识领域:项目管理知识体系,应用领域的知识、标准和规定,项目环境知识,通用的管理知识和技能,软技能和人际关系技能。 2、项目干系人的需求分析和沟通分析,两部分组成——P31+P232 项目干系人的分析:1、非组员的干系人的三大职责:参与、审查、反馈2、项目干系人的分析的目的:确定项目干系人的需求,帮助项目经理制定沟通管理策略。 项目干系人的管理的方法:沟通方法(分析干系人需求和期望目标,分层次分目标进行沟通,不同干系人采用不同的沟通策略,综合运用正式的和非正式的或公开或私下等多种沟通方法),问题日志需求分析就是确定待开的信息系统应该做什么。 需求分析的特点: 1、用户与开发人员之间存在着沟通方面的困难; 2、用户的需求是动态变化的; 3、生命周期种不同的阶段系统变更的代价呈非线性增长; 需求分析的过程1、问题识别;2、分析与综合;3、制订规格说明;4、评审; 需求分析的方法1、原型化方法2、结构化方法3、动态分析法 需求分析步骤: 1、阅读甲方所有资料文件-组织资产、业务法规制度、业务流程; 2、撰写调研提纲,并与甲方业务人员确认; 3、业务岗位实地调研,岗位调研报告(一地)业务调研集中会议与试点地区岗位调研(省地市异地); 4、撰写业务调研报告,与甲方主要需求人员开会讨论; 5、甲方高层参加的业务需求调研报告会,认可业务需求内容 6、正式撰写“需求分析”系列文档;与甲方主要需求人员讨论; 7、真是提交需求评审,开会,确认需求; 3、项目的组织结构对项目管理的影响P34 第五章 4、整体管理计划的制定流程,作用和内容P91-93 整体管理作用:对项目管理过程中的不同过程和活动进行识别、定义、整合、统一和协调的过程。 整体管理计划的制定流程:制订项目章程,制订项目范围说明书初步,制订项目管理计划,指导和管理项目执行,监督和控制项目工作,整体变更控制,项目收尾。 5、范围管理——范围的定义、确认,P110 范围定义:描述项目过程并把结果与项目写进详细范围说明书中。 项目范围确认的工作要点:制订并执行确认程度,项目干系人对项目范围的正式确认,让系统的使用者有效参与,项目各阶段的确认和项目最终验收的确认。 分阶段分步骤的确认是归避风险的有效方法。确认的方法:测量、测试、检验,审查、产品评审、走查 6、WBS——工作分解的方法、作用P113 创建WBS所采用的方法:使用指导方针,类比法,自顶向下、自底向上 WBS的局限:不能显示活动之间的顺序,不能显示活动之间的依赖关系 WBS的表现形式:分级的树型结构,表格形式 WBS分解的详细程度:大项目:WBS分为总纲和子项目目录;小项目:WBS直接划分到工作包。 WBS的作用通及意义:将项目大的可交付物成果与项目工作划分为较小的和易管理的组成部分,详

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

最新统计概率知识点归纳总结大全

统计概率知识点归纳总结大全 1.了解随机事件的发生存在着规律性和随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率. 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=) ()(I card A card =n m ; 等可能事件概率的计算步骤: (1) 计算一次试验的基本事件总数n ; (2) 设所求事件A ,并计算事件A 包含的基本事件的个数m ; (3) 依公式()m P A n =求值; (4) 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.

(4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤是: 第一步,确定事件性质???? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 考点2离散型随机变量的分布列 1.随机变量及相关概念 ①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示. ②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列 ①离散型随机变量的分布列的概念和性质 一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

概率统计知识点全面总结

知识点总结:统计与概率 I 统计 1.三大抽样 (1)基本定义: ① 总体:在统计中,所有考查对象的全体叫做全体. ② 个体:在所有考查对象中的每一个考查对象都叫做个体. ③ 样本:从总体中抽取的一部分个体叫做总体的样本. ④ 样本容量:样本中个体的数目叫做样本容量. (2)抽样方法: ①简单随机抽样:逐个不放回、等可能性、有限性。=======★适用于总体较少★ 抽签法:整体编号( 1~N )放入不透明的容器中搅拌均匀逐个抽取n 次,即可得样本容量为 n 的样本。 随机数表法:整体编号(等位数,如001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机 (上、下、左、右)重复,超过范围则忽略不计直至取得以n 为样本容量的样本。 ②系统抽样:容量大.等距,等可能。=======★适用于总体多★ 用随机方法编号,若N 无法被整除,则剔除后再分组,n N k 。再用简单随机抽样法来抽取一个个体,设为l ,则编号为l ,k+l ,2k+l ……(n-1)k ,抽出容量为n 的样本。(每组编号相同)。 ③分层抽样:总体差异明显.按所占比例抽取.等可能.=======★适用于由差异明显的几部分构成的总体★ 总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样.抽样比为:k =n N 3.总体分布的估计: (1)一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 ★注:总体分布的密度曲线与横轴围成的面积为1。 (2)茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数.众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

概率论和数理统计知识点总结[超详细版]

《概率论与数理统计》 第一章 概率论的基本概念 §2.样本空间、随机事件 1.事件间的关系 B A ?则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生 B }x x x { ∈∈=?或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ?发生 B }x x x { ∈∈=?且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ?发生 B }x x x { ?∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生 φ=?B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的 且S =?B A φ=?B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件 2.运算规则 交换律A B B A A B B A ?=??=? 结合律)()( )()(C B A C B A C B A C B A ?=???=?? 分配律 )()B (C A A C B A ???=??)( ))(()( C A B A C B A ??=?? 徳摩根律B A B A A B A ?=??=? B — §3.频率与概率 定义 在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事 件A 发生的频数,比值n n A 称为事件A 发生的频率 概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件: (1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P

高中数学选修1-2《统计案例》知识点讲义教学内容

第一章统计案例一、回归分析的基本思想及其初步应用 1、数学变量相关关系 的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不 确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关负相关不相关 (2)相关性系数r(在《必修3》中有介绍) 用相关系数r来衡量两个变量之间的相关关系 ()() ()() 1 22 11 n i i i n n i i i i x x y y r x x y y = == -- = -- ∑ ∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

统计和概率知识点总结

数据的收集、整理与描述 1、全面调查:考察全体对象的调查方式叫做全面调查。 2、抽样调查:调查部分数据,根据部分来估计总体的调查方式称为抽样调查。 3、总体:要考察的全体对象称为总体。 4、个体:组成总体的每一个考察对象称为个体。 5、样本:被抽取的所有个体组成一个样本。 6、样本容量:样本中个体的数目称为样本容量。 7、样本平均数:样本中所有个体的平均数叫做样本平均数。 8、总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。 9、频数:一般地,我们称落在不同小组中的数据个数为该组的频数。 10、频率:频数与数据总数的比为频率。 11、组数和组距:在统计数据时,把数据按照一定的范围分成若干各组,分成组的个数称为组数,每一组两个端点的差叫做组距。 数据的分析 1、平均数:一般地,如果有n 个数 ,,,,21n x x x 那么,)(121n x x x n x +++= 叫做这n 个数的平均数,x 读作“x 拔”。 2、加权平均数:如果n 个数中,1x 出现1f 次,2x 出现2f 次,…,k x 出现k f 次 (这里n f f f k =++ 21)。那么,根据平均数的定义,这n 个数的平均数可以表示为 n f x f x f x x k k ++=2211,这样求得的平均数x 叫做加权平均数,其中k f f f ,,,21 叫做权。 3、中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数(median);如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数。 4、众数:一组数据中出现次数最多的数据就是这组数据的众数(mode )。 5、极差:组数据中的最大数据与最小数据的差叫做这组数据的极差(range)。 6、在一组数据,,,,21n x x x 中,各数据与它们的平均数x 的差的平方的平均数,

(完整版)数学知识点--考点14--统计与统计案例

极差 组数、组距 分组 列表 咼频率/组距 面积=频率= 频数 样本容量 小矩形面积和=1 统计与统计案例 1. 统计的基本思想是用部份来估计总体。 2. 统计中所考察的对象的全体构成的集合看做总体, 构成总体的每个元素作为个体,从总 体中抽取的一部份个体所组成的集合叫做样本,样本中个体的数目叫做样本容量。 一、抽样方法 2.图形特征 1) 茎叶图 2) 直方图 、用样本估计总体 1.数字特征 注意: 2 2 i am b ,贝U i 的平均数为ax b ,方差为a s

3)条形图与直方图的区别:直方图中矩形通常连续排列,条形图则是分开排开; 直方图是用面积表示各 组频率的多少, 高表示每一组的频率除以组距, 组距,条形图的高表示频数的多少,其宽是固定的,表示类别。 三、变量间的相关关系 确定关系:函数关系 2.样本相关系数r : r 0.75时,认为两个变量有很强的线性相关关系。 3. 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法。 过样本中心X, y 2 2 6. 相关指数R : R 的值越大,说明残差平方和越小,即模型的拟合效果起好。 回归效果越好。 7. 回归方程:只适用于研究的样本的总体;具有时间性;样本的取值范围会影响总 体的范围;预报值与精 确值往往不一样。 8. 步骤 宽表示 关系 非确定:相关关系 回归分析 散点图 回归曲线 回归直线 y $x $b X i y i i 1 nxy -2 x y i y X i nx 5.随机误差 e y bX i a 估计值 残差 y i bX i $ 残差分析 形:残差图 数:R 2 0,1 线性回归模型中, R 2表示解释变量对预报变量的贡献率, R 2越接近于 1,表示

高中数学选修1-2《统计案例》知识点讲义汇编

第一章 统计案例 一、回归分析的基本思想及其初步应用 1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关 负相关 不相关 (2)相关性系数r (在《必修3》中有介绍) 用相关系数r 来衡量两个变量之间的相关关系 ()() ()() 1 2 2 1 1 n i i i n n i i i i x x y y r x x y y ===--= --∑∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

人教版高中数学【选修2-3】[知识点整理及重点题型梳理]-《统计案例》单元复习巩固

人教版高中数学选修2-3 知识点梳理 重点题型(常考知识点)巩固练习 《统计案例》单元复习巩固 【学习目标】 1. 了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用. 2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用. 3. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤. 4. 能作出散点图,能求其回归直线方程。 5. 会用所学的知识对简单的实际问题进行回归分析。 【知识网络】 【要点梳理】 要点一、分类变量 有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。 要点诠释: (1)对分类变量的理解。 这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。 (2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。 要点二、2×2列联表 1. 列联表 用表格列出的分类变量的频数表,叫做列联表。 2. 2×2列联表 对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:

这样的表格称为2×2列联表。 要点三:卡方统计量公式 为了研究分类变量X 与Y 的关系,经调查得到一张2×2列联表,如下表所示 统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 22 ()()()()() n ad bc K a b c d a c b d -=++++(n a b c d =+++为样本容量)。 要点四、独立性检验 1. 独立性检验 通过2×2列联表,再通过卡方统计量公式计算2K 的值,利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 2. 变量独立性的判断 通过对2 K 统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断: ①如果2K ≤3.841时,认为事件A 与B 是无关的。 ②如果2K >3.841时,有95%的把握说事件A 与事件B 有关; ③如果2K >6.635时,有99%的把握说事件A 与事件B 有关; 要点诠释: (1)独立性检验一般是指通过计算2 K 统计量的大小对两个事件是否有关进行判断; (2)独立性检验的基本思想类似于反证法。即在H 0:事件A 与B 无关的统计假设下,利用2 K 统计量的大小来决定在多大程度上拒绝原来的统计假设H 0,即拒绝“事件A 与B 无关”,从而认为事件A 与B 有关。独立性检验为假设检验的特例。 (3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把

相关主题