正态分布的数学期望与方差
正态分布:
密度函数为:分布函数为
的分布称为正态分布,记为N(a, σ2).
密度函数为:
或者
称为n元正态分布。其中B是n阶正定对称矩阵,a是任意实值行向量。
称N(0,1)的正态分布为标准正态分布。
(1)验证是概率函数(正值且积分为1)
(2)基本性质:
(3)二元正态分布:
其中,
二元正态分布的边际分布仍是正态分布:
二元正态分布的条件分布仍是正态分布:
即(其均值是x的线性函数)
其中r可证明是二元正态分布的相关系数。
(4)矩,对标准正态随机变量,有
(5)正态分布的特征函数
多元正态分布
(1)验证其符合概率函数要求(应用B为正定矩阵,L为非奇异阵,然后进行向量线性变换)
(2)n元正态分布结论
a) 其特征函数为:
b) 的任一子向量,m≤n 也服从正态分布,分布为其中,为保留B 的第,…行及列所得的m阶矩阵。
表明:多元正态分布的边际分布还是正态分布
c) a,B分别是随机向量的数学期望及协方差矩阵,即
表明:n元正态分布由它的前面二阶矩完全确定
d) 相互独立的充要条件是它们两两不相关
e) 若,为的子向量,其中是,的协方差矩阵,则是,相应分量的协方差构成的相互协方差矩阵。则相互独立的充要条件为=0
f) 服从n元正态分布N(a,b)的充要条件是它的任何一个线性组合服
从一元正态分布
表明:可以通过一元分布来研究多元正态分布
g) 服从n元正态分布N(a,b),C为任意的m×n阶矩阵,则服从m元正态分布
表明:正态变量在线性变换下还是正态变量,这个性质简称正态变量的线性变换不变性
推论:服从n元正态分布N(a,b),则存在一个正交变化U,使得是一个具有独立正态分布分量的随机向量,他的数学期望为Ua,而他的方差分量是B的特征值。
条件分布
若服从n元正态分布N(a,b),,则在给定下,的分布还是正态分布,其条件数学期望:
(称为关于的回归)
其条件方差为:
(与无关)
常见分布的期望和方差 x n (0,1) N()
概率与数理统计重点摘要 1、正态分布的计算:()()( )X F x P X x μ σ -=≤=Φ。 2、随机变量函数的概率密度:X 是服从某种分布的随机变量,求()Y f X =的概率密度:()()[()]'()Y X f y f x h y h y =。(参见P66~72) 3、分布函数(,)(,)x y F x y f u v dudv -∞-∞ = ?? 具有以下基本性质: ⑴、是变量x ,y 的非降函数; ⑵、0(,)1F x y ≤≤,对于任意固定的x ,y 有:(,)(,)0F y F x -∞=-∞=; ⑶、(,)F x y 关于x 右连续,关于y 右连续; ⑷、对于任意的11221212(,),(,),,x y x y x x y y << ,有下述不等式成立: 22122111(,)(,)(,)(,)0F x y F x y F x y F x y --+≥ 4、一个重要的分布函数:1(,)(arctan )(arctan )23 x y F x y πππ2=++22的概率密度为:2222 6(,)(,)(4)(9)f x y F x y x y x y π?==??++ 5、二维随机变量的边缘分布: 边缘概率密度: ()(,)()(,)X Y f x f x y dy f y f x y dx +∞ -∞+∞ -∞ ==?? 边缘分布函数: ()(,)[(,)]()(,)[(,)]x X y Y F x F x f u y dy du F y F y f x v dx dv +∞ -∞-∞+∞ -∞ -∞ =+∞==+∞=?? ?? 二维正态分布的边缘分布为一维正态分布。 6、随机变量的独立性:若(,)()()X Y F x y F x F y =则称随机变量X ,Y 相互独立。简称X 与Y 独立。
常见分布得期望与方差 ?概率与数理统计重点摘要 1、正态分布得计算:。 2、随机变量函数得概率密度:就是服从某种分布得随机变量,求得概率密度:。(参见P66~72) 3、分布函数具有以下基本性质: ⑴、就是变量x,y得非降函数; ⑵、,对于任意固定得x,y有:; ⑶、关于x右连续,关于y右连续; ⑷、对于任意得,有下述不等式成立: 4、一个重要得分布函数:得概率密度为: 5、二维随机变量得边缘分布: 边缘概率密度: 边缘分布函数:二维正态分布得边缘分布为一维正态分布、 6、随机变量得独立性:若则称随机变量X,Y相互独立、简称X与Y独立。 7、两个独立随机变量之与得概率密度:其中Z=X+Y
8、两个独立正态随机变量得线性组合仍服从正态分布,即。 9、期望得性质:……(3)、;(4)、若X,Y 相互独立,则。 10、方差: 。 若X,Y 不相关,则,否则, 11、协方差:,若X,Y 独立,则,此时称:X 与Y 不相关。 12、相关系数:,,当且仅当X 与Y存在线性关系时,且 13、k 阶原点矩:,k 阶中心矩:。 14、切比雪夫不等式:{} {}2 2 () () (),()1D X D X P X E X P X E X εεε ε -≥≤ -<≤- 或、贝努利大数定律:。 15、独立同分布序列得切比雪夫大数定律:因,所以。 16、独立同分布序列得中心极限定理: (1)、当n 充分大时,独立同分布得随机变量之与得分布近似于正态分布。 (2)、对于得平均值,有,,即独立同分布得随机变量得均值当n 充分大时,近似服从正态分布、 (3)、由上可知:{}{}lim ()()()()n n n P a Z b b a P a Z b b a →∞ <≤=Φ-Φ?<≤≈Φ-Φ。 17、棣莫弗-拉普拉斯中心极限定理:设m就是n次独立重复试验中事件A 发生得次数,p 就是事件A 发生得概率,则对任意, , 其中。 (1)、当n 充分大时,m 近似服从正态分布,。 (2)、当n充分大时,近似服从正态分布,。 18、参数得矩估计与似然估计:(参见P 200) 19 20、关于正态总值均值及方差得假设检验,参见P243与P 248。
正态分布的数学期望与方差 正态分布: 密度函数为:分布函数为 的分布称为正态分布,记为N(a, σ2). 密度函数为: 或者 称为n元正态分布。其中B是n阶正定对称矩阵,a是任意实值行向量。 称N(0,1)的正态分布为标准正态分布。 (1)验证是概率函数(正值且积分为1) (2)基本性质: (3)二元正态分布: 其中, 二元正态分布的边际分布仍是正态分布: 二元正态分布的条件分布仍是正态分布:
即(其均值是x的线性函数) 其中r可证明是二元正态分布的相关系数。 (4)矩,对标准正态随机变量,有 (5)正态分布的特征函数 多元正态分布 (1)验证其符合概率函数要求(应用B为正定矩阵,L为非奇异阵,然后进行向量线性变换) (2)n元正态分布结论 a) 其特征函数为: b) 的任一子向量,m≤n 也服从正态分布,分布为其中,为保留B 的第,…行及列所得的m阶矩阵。 表明:多元正态分布的边际分布还是正态分布 c) a,B分别是随机向量的数学期望及协方差矩阵,即 表明:n元正态分布由它的前面二阶矩完全确定 d) 相互独立的充要条件是它们两两不相关 e) 若,为的子向量,其中是,的协方差矩阵,则是,相应分量的协方差构成的相互协方差矩阵。则相互独立的充要条件为=0 f) 服从n元正态分布N(a,b)的充要条件是它的任何一个线性组合服
从一元正态分布 表明:可以通过一元分布来研究多元正态分布 g) 服从n元正态分布N(a,b),C为任意的m×n阶矩阵,则服从m元正态分布 表明:正态变量在线性变换下还是正态变量,这个性质简称正态变量的线性变换不变性 推论:服从n元正态分布N(a,b),则存在一个正交变化U,使得是一个具有独立正态分布分量的随机向量,他的数学期望为Ua,而他的方差分量是B的特征值。 条件分布 若服从n元正态分布N(a,b),,则在给定下,的分布还是正态分布,其条件数学期望: (称为关于的回归) 其条件方差为: (与无关)
13 正态分布的概率密度、分布函数、数学期望与方差 一、设随机变量X 服从正态分布)2,1(2N ,求(1))8.56.1(<≤-X P ;(2))56.4(≥X P . 解:(1) )4.22 1 3.1()8.416.2()8.56.1(<-≤ -=<-≤-=<≤-X P X P X P 8950 .09032.019918.0)]3.1(1[)4.2()3.1()4.2(1,01,01,01,0=+-=--=--=ΦΦΦΦ (2) )78.12 1 78.2(1)56.4(1)56.4(<-< --=<-=≥X P X P X P )]78.2(1)78.1(1)]78.2()78.1([11,01,01,01,0ΦΦΦΦ-+-=---= .0402.09973.09625.02=-- 二、已知某种机械零件的直径X (mm )服从正态分布)6.0,100(2N .规定直径在2.1100±(mm ) 之间为合格品,求这种机械零件的不合格品率. 解:设p 表示这种机械零件的不合格品率,则)2.1100(1)2.1100(≤--=>-=X P X P p . 而)26 .0100 2()6.02.16.01006.02.1( )2.1100(≤-≤-=≤-≤-=≤-X P X P X P 1)2(2)]2(1[)2()2()2(-Φ=Φ--Φ=-Φ-Φ= 9544.019772.02=-?= 故0456.09544.01=-=p . 三、测量到某一目标的距离时发生的误差X (m)具有概率密度 3200 )20(22401)(-- = x e x f π 求在三次测量中至少有一次误差的绝对值不超过30m 的概率. 解:三次测量中每次误差绝对值都超过30米可表为 }30{}30{}30{>?>?>=ξξξD 第三次第二次第一次 因为)40,20(~2 N ξ,所以由事件的相互独立性,有 31,01,033)]25 .0(1)25.1([})3030{(})30{()(ΦΦ-+-=>+-<=>=ξξP ξP D P 13025.05069.0)8944.05987.02(3 3 ≈=--= 于是有 86975.013025.01)(1}30{=-=-= 第9讲随机变量的数学期望与方差 教学目的:1.掌握随机变量的数学期望及方差的定义。 2.熟练能计算随机变量的数学期望与方差。 教学重点: 1.随机变量的数学期望 For personal use only in study and research; not for commercial use 2.随机变量函数的数学期望 3.数学期望的性质 4.方差的定义 For personal use only in study and research; not for commercial use 5.方差的性质 教学难点:数学期望与方差的统计意义。 教学学时:2学时。 For personal use only in study and research; not for commercial use 教学过程: 第三章随机变量的数字特征 §3.1 数学期望 For personal use only in study and research; not for commercial use 在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了。然而,在实际问题中,概率分布一般是较难确定的,而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了。因此,在对随机变量的研究中,确定其某些数字特征是重要的,而在这些数字特征中,最常用的是随机变量的数学期望和方差。 1.离散随机变量的数学期望 我们来看一个问题: 某车间对工人的生产情况进行考察。车工小张每天生产的废品数X 是一个随机变 量,如何定义X 取值的平均值呢? 若统计100天,32天没有出废品,30天每天出一件废品,17天每天出两件废品, 21天每天出三件废品。这样可以得到这100天中每天的平均废品数为 27.1100 213100172100301100320=?+?+?+? 这个数能作为X 取值的平均值吗? 可以想象,若另外统计100天,车工小张不出废品,出一件、二件、三件废品的 天数与前面的100天一般不会完全相同,这另外100天每天的平均废品数也不一定是 1.27。 对于一个随机变量X ,若它全部可能取的值是 ,,21x x , 相应的概率为 ,,21P P , 则对X 作一系列观察(试验)所得X 的试验值的平均值是随机的。但是,如果试验次数 很大,出现k x 的频率会接近于K P ,于是试验值的平均值应接近 ∑∞=1k k k p x 由此引入离散随机变量数学期望的定义。 定义1 设X 是离散随机变量,它的概率函数是 ,2 ,1,)()(====k P x X P x p K K k 如果 ∑∞ =1||k k k p x 收敛,定义X 的数学期望为 ∑∞ ==1)(k k k p x X E 也就是说,离散随机变量的数学期望是一个绝对收敛的级数的和。 例1 某人的一串钥匙上有n 把钥匙,其中只有一把能打开自己的家门,他随意地 试用这串钥匙中的某一把去开门。若每把钥匙试开一次后除去,求打开门时试开次数 的数学期望。 数学期望与方差及正态分布 __________________________________________________________________________________ __________________________________________________________________________________ 1.理解离散型变量的数学期望与方差的概念. 2.熟练掌握离散型变量的数学期望与方差的公式. 3.熟练掌握离散型变量的数学期望与方差的性质. 4.能利用数学期望与方差解决简单的实际问题. 5.理解概率密度曲线和正态分布的概念. 1.离散型随机变量X 的数学期望 一般地,若离散型随机变量X 的概率分布如下表所示,则称______________________为离散型随机变量X 的数学期望,记为______,其中0i p ≥,i =1,2,…,n ,12p p + 1.n p ++=L 2.离散型随机变量X 的方差 则称____________________________________为离散型随机变量X 的方差,记为_________,即2 ; σi p ≥0,i =1,2,…,n ,121,n p p p +++=L ()E X μ= 3.离散型随机变量X 的标准差 随机变量X 的方差也称为X 的概率分布的方差,X 的方差V (X )的算术平方根称为X 的标准差,即σ=_____________ 4.必备公式 (1)离散型随机变量:X 的数学期望(均值)公式、方差公式、标准差公式 E(X)=____________________________; V (X )=_____________________________________________; 5 5 概率与数理统计重点摘要 1、正态分布的计算:()()( )X F x P X x μ σ -=≤=Φ。 2、随机变量函数的概率密度:X 是服从某种分布的随机变量,求()Y f X =的概率密度:()()[()]'()Y X f y f x h y h y =。(参见P66~72) 3、分布函数(,)(,)x y F x y f u v dudv -∞-∞ = ?? 具有以下基本性质: ⑴、是变量x ,y 的非降函数; ⑵、0(,)1F x y ≤≤,对于任意固定的x ,y 有:(,)(,)0F y F x -∞=-∞=; ⑶、(,)F x y 关于x 右连续,关于y 右连续; ⑷、对于任意的11221212(,),(,),,x y x y x x y y << ,有下述不等式成立: 22122111(,)(,)(,)(,)0F x y F x y F x y F x y --+≥ 4、一个重要的分布函数:1(,)(arctan )(arctan )23 x y F x y πππ2=++22的概率密度为:2222 6(,)(,)(4)(9)f x y F x y x y x y π?==??++ 5、二维随机变量的边缘分布: 边缘概率密度: ()(,)()(,)X Y f x f x y dy f y f x y dx +∞ -∞+∞ -∞ ==?? 边缘分布函数: ()(,)[(,)]()(,)[(,)]x X y Y F x F x f u y dy du F y F y f x v dx dv +∞ -∞-∞+∞ -∞ -∞ =+∞==+∞=?? ?? 二维正态分布的边缘分布为一维正态分布。 常见分布的期望和方差 概率与数理统计重点摘要 1、正态分布的计算:()()()X F x P X x μ σ-=≤=Φ。 2、随机变量函数的概率密度:X 是服从某种分布的随机变量,求()Y f X =的概率密度:()()[()]'()Y X f y f x h y h y =。(参见P66~72) 3、分布函数(,)(,)x y F x y f u v dudv -∞-∞=??具有以下基本性质: ⑴、是变量x ,y 的非降函数; ⑵、0(,)1F x y ≤≤,对于任意固定的x ,y 有:(,)(,)0F y F x -∞=-∞=; ⑶、(,)F x y 关于x 右连续,关于y 右连续; ⑷、对于任意的11221212(,),(,),,x y x y x x y y << ,有下述不等式成立: 22122111(,)(,)(,)(,)0F x y F x y F x y F x y --+≥ 4、一个重要的分布函数:1(,)(arctan )(arctan )23 x y F x y πππ2=++22的概率密度为:22226(,)(,)(4)(9)f x y F x y x y x y π?==??++ 5、二维随机变量的边缘分布: 边缘概率密度:()(,)()(,)X Y f x f x y dy f y f x y dx +∞-∞ +∞-∞==? ? 边缘分布函数:()(,)[(,)]()(,)[(,)]x X y Y F x F x f u y dy du F y F y f x v dx dv +∞ -∞ -∞+∞-∞-∞=+∞==+∞=???? 二维正态分布的边缘分布为一维正态分布。 6、随机变量的独立性:若(,)()()X Y F x y F x F y =则称随机变量X ,Y 相互独立。简称X 与Y 独立。 §12.6 离散型随机变量的均值与方差、正态分布 1.离散型随机变量的均值与方差 若离散型随机变量X (1)均值 称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量X 的均值或数学期望,它反映了离散型随机变量取值的平均水平. (2)方差 称D (X )=∑n i = 1 (x i -E (X ))2 p i 为随机变量X 的方差,它刻画了随机变量X 与其均值E (X )的平均偏离程度,其算术平方根D ?X ?为随机变量X 的标准差. 2.均值与方差的性质 (1)E (aX +b )=aE (X )+b . (2)D (aX +b )=a 2D (X ).(a ,b 为常数) 3.两点分布与二项分布的均值、方差 (1)若X 服从两点分布,则E (X )=__p __,D (X )=p (1-p ). (2)若X ~B (n ,p ),则E (X )=__np __,D (X )=np (1-p ). 4.正态分布 (1)正态曲线:函数φμ,σ(x )=12πσe -?x -μ?22σ2,x ∈(-∞,+∞),其中μ和σ为参数(σ>0,μ∈R ).我 们称函数φμ、σ(x )的图象为正态分布密度曲线,简称正态曲线. (2)正态曲线的性质: ①曲线位于x 轴上方,与x 轴不相交; ②曲线是单峰的,它关于直线x =μ对称; ③曲线在x =μ处达到峰值1 σ2π; ④曲线与x 轴之间的面积为__1__; ⑤当σ一定时,曲线的位置由μ确定,曲线随着__μ__的变化而沿x 轴平移,如图甲所示; ⑥当μ一定时,曲线的形状由σ确定,σ__越小__,曲线越“瘦高”,表示总体的分布越集中;σ__越大__,曲线越“矮胖”,表示总体的分布越分散,如图乙所示. (3)正态分布的定义及表示 如果对于任何实数a ,b (a 期望、方差、正态分布 期望、方差知识回顾: 1.数学期望: 一般地,若离散型随机变量ξ的概率分布为 ξ x 1 x 2 … x n … P p 1 p 2 … p n … 则称 =ξE +11p x +22p x …++n n p x … 为ξ的数学期望,简称期望. 特别提醒: 1. 数学期望是离散型随机变量的一个特征数,它反映了离散型随机变量取值的平均水平 2. 平均数、均值:在有限取值离散型随机变量ξ的概率分布中,令=1p =2p …n p =,则有 =1p =2p …n p n 1= =,=ξE +1(x +2x …n x n 1 )?+,所以ξ的数学期望又称为平均数、均值 2.期望的一个性质: ()E a b ξ+=aE b ξ+ 3.若ξ~B (p n ,),则ξE =np 4.方差:ξD =121)(p E x ?-ξ+222)(p E x ?-ξ+…+n n p E x ?-2)(ξ+…. 5.标准差: ξD 的算术平方根ξD 叫做随机变量ξ的标准差,记作σξ. 6.方差的性质: ξξD a b a D 2)(=+; 若ξ~B (p n ,),则=ξD )1(p np - 特别提醒: 1. 随机变量ξ的方差的定义与一组数据的方差的定义式是相同的; 2. 随机变量ξ的方差、标准差也是随机变量ξ的特征数,它们都反映了随机变量取值的稳定与波 动、集中与离散的程度; 3. 标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛 正态分布知识回顾: 1.若总体密度曲线就是或近似地是函数R ,21)(2 22)(∈=--x e x f x σμσ π的图象,则其分布叫正态分布, 常记作),(2σμN .)(x f 的图象称为正态曲线. 三条正态曲线:①5.0,1==σμ;②1,0==σμ;③2,1==σμ,其图象如下图所示: 常见分布的期望和方差 5 5 概率与数理统计重点摘要 1、正态分布的计算:()()( )X F x P X x μ σ -=≤=Φ。 2、随机变量函数的概率密度:X 是服从某种分布的随机变量,求()Y f X =的概率密度:()()[()]'()Y X f y f x h y h y =。(参见P66~72) 3、分布函数(,)(,)x y F x y f u v dudv -∞-∞ = ?? 具有以下基本性质: ⑴、是变量x ,y 的非降函数; ⑵、0(,)1F x y ≤≤,对于任意固定的x ,y 有:(,)(,)0F y F x -∞=-∞=; ⑶、(,)F x y 关于x 右连续,关于y 右连续; ⑷、对于任意的11221212(,),(,),,x y x y x x y y << ,有下述不等式成立: 22122111(,)(,)(,)(,)0F x y F x y F x y F x y --+≥ 4、一个重要的分布函数:1(,)(arctan )(arctan )23 x y F x y πππ2=++22的概率密度为:2222 6(,)(,)(4)(9)f x y F x y x y x y π?==??++ 5、二维随机变量的边缘分布: 边缘概率密度: ()(,)()(,)X Y f x f x y dy f y f x y dx +∞ -∞+∞ -∞ ==?? 边缘分布函数: ()(,)[(,)]()(,)[(,)]x X y Y F x F x f u y dy du F y F y f x v dx dv +∞ -∞-∞+∞ -∞ -∞ =+∞==+∞=?? ?? 二维正态分布的边缘分布为一维正态分布。 为何需要正态分布和方差齐性的检验? 很多时候,我们都需要使用从单一样本中获取的样本信息利用统计推断的方法来估计总体的参数信息,这是一种非常有用的统计方法,但在执行相关推断之前,我们需要验证一些假定,任何一条假定若是不能满足,则得到的统计结论就是无效的。 通常数据的分析假设为:随机数据,独立的,正态分布,等方差,稳定,当然,测量系统的精确性和准确性也是要满足测量要求的。 什么是正态分布假定? 在再进行统计分析之前,需要识别出数据的分布,否则,错误的统计检验将带来一定的风险,许多统计方法在执行之前嘉定数据服从正态分布,比如,单/双样本-T检验,过程能力分析,I-MR和方差分析等。如果数据不满足正态分布,则需要使用非参数方法,利用中位数进行检验而不是均值,也可以使用BOX-COX转换或JOHNSON变换的方法把数据转换为正态分布。 但是需要知道许多统计工具虽然假定数据满足正态但实际上当样本量大于15或20的时候就不需要正态分布了,但是如果样本量小于15且数据不满足正态分布,P值得数据就是错误的,相关统计结论就需要特别注意了。 在Minitab中,有许多方法可以判断数据的分布是否满足正态,下面我们来了解两种比较常用的方法:正态检验和图形化汇总 Minitab的正态检验将生成概率图和执行单样本假设检验来判断数据的分布是否来自满足正态的分布总体,原假设是数据满足正态分布而备择假设是不满足 选择统计—基本统计量—正态检验 下面我们先看看数据的正态检验 图形中的数据点应该在直线的附近,如果有些数据点在尾巴上远离直线也可以接受,但前提条件是必须在置信区间内才可以。 图形中的数据点应该靠近你和分布直线且通过“粗笔检验”,用一只“粗笔”盖在拟合直线上,如果铅笔能盖住所有数据点,则数据满足正态分布 与之相连的Anderson-Darling检验统计量应该很小 P值应该大于选择的Alpha风险(通常取或) Anderson-Darling统计量用来衡量数据点远离拟合直线的程度,是每个数据点到直线距离的平方和,对于一组给定的数据分布来说,分布拟合的越好,该值就会越小。 Minitab描述性统计输出通过图形化汇总直观的展示数据分布和计算了Anderson-Darling数值和P 值,图形化汇总输出四张图形:带有正态拟合线的直方图,箱线图,均值和中位数的95%置信区间图。 接下来分析图形化汇总中的正态检验: 数据通过直方图展示出来,查看图形的分布行形状(对称还是有偏度),数据在图形中是如何延伸的,且需要查看是否存在异常数据 与之相关的Anderson-Darling统计量数值应该很小 P值应该大于选择的Alpha风险(通常取或) 对于一些流程来说,比如时间和循环周期的数据,数据永远不会满足正态分布的,不满足正态分布的数据对于一些统计方法是适用的,但需要明确数据需要满足一些特殊需求。 什么是等方差假定? 通常,方差是指数据的分布离散程度,统计分析中,比如方差分析(ANOVA)中,嘉定虽然不同的样本数据来自不同均值的抽样总体,它们应该有相同的方差,方差齐性是指不同样本的方差大体相同,如果方差非齐性会影响第一类风险且导致错误的结论,如果比较两个或两个以上样本均值,比如双样本T检验和ANOVA中,如果方差显著有差异将会掩盖掉均值的差异信息并导致错误的结论。 Minitab提供了几种可以执行等方差检验的方法,可以参考Minitab的帮助来决定基于不同的数据类型该选择哪种方法,当然,也可以通过使用Minitab协助来验证该假定(技巧:当使用协助,点 概率与统计 知识点一:常见的概率类型与概率计算公式;类型一:古典概型; 1、古典概型的基本特点: (1)基本事件数有限多个; (2)每个基本事件之间互斥且等可能;2、概率计算公式: A事件发生的概率 () A P A= 事件所包含的基本事件数 总的基本事件数。 类型二:几何概型; 1、几何概型的基本特点: (1)基本事件数有无限多个; (2)每个基本事件之间互斥且等可能; 2、概率计算公式: A事件发生的概率 () A P A= 构成事件的区域长度(或面积或体积或角度)总的区域长度(或面积或体积或角度); 注意: 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;b5E2RGbCAP (2)如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪一个是等可能的; 例如:等腰ABC ?中,角C=23π ,则: (1) 若点M 是线段AB 上一点,求使得AM AC ≤的概率; (2) 若射线CA 绕着点C 向射线CB 旋转,且射线CA 与线段AB 始终相交且交点是M ,求使得AM AC ≤的概率; 解读:第一问中明确M 为AB 上动点,即点M 是在AB 上均匀分布, 所以这一问应该是长度之比,所求概率: 13P = 。 而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率: 2755 = = 1208P ?;p1EanqFDPw 知识点二:常见的概率计算性质; 类型一:事件间的关系与运算; A+B<和事件):表示A 、B 两个事件至少有一个发生; A B ?<积事件):表示A 、B 两个事件同时发生; A <对立事件):表示事件A 的对立事件; 类型二:复杂事件的概率计算公式; 1、 和事件的概率: ()=()()()P A B P A P B P A B ++-? <1)特别的,若A 与B 为互斥事件,则: ()=()()P A B P A P B ++ <2)对立事件的概率公式: ()1()P A P A =- 概率分布以及期望和方差 上课时间: 上课教师: 上课重点:掌握两点分布、超几何分布、二项分布、正态分布的概率分布及其期望和方差 上课规划:解题技巧和方法 一两点分布 ⑴两点分布 如果随机变量X的分布列为 X 10 P p q 其中01 p <<,1 q p =-,则称离散型随机变量X服从参数为p的二点分布.二点分布举例:某次抽查活动中,一件产品合格记为1,不合格记为0,已知产品的合格率为80%,随机变量X为任意抽取一件产品得到的结果,则X 的分布列满足二点分布. X 10 P 0.8 0.2 两点分布又称01-分布,由于只有两个可能结果的随机试验叫做伯努利试验,所以这种分布又称为伯努利分布. (2)典型分布的期望与方差: 二点分布:在一次二点分布试验中,离散型随机变量X的期望取值为p,在n次二点分布试验中,离散型随机变量X的期望取值为np. 知识内容 典例分析 1、在抛掷一枚图钉的随机试验中,令10X ?=? ?,针尖向上; ,针尖向下. ,如果针尖向上的 概率为p ,试写出随机变量X 的概率分布. 2、从装有6只白球和4只红球的口袋中任取一只球,用X 表示“取到的白球个数”,即???=,当取到红球时, ,当取到白球时, 01X ,求随机变量X 的概率分布. 3、若随机变量X 的概率分布如下: X 1 P 29C C - 38C - 试求出C ,并写出X 的分布列. 3、抛掷一颗骰子两次,定义随机变量 ?? ?=)(,1)(,0的点数数等于第二次向上一面当第一次向上一面的点 面的点数数不等于第二次向上一当第一次向上一面的点 ξ 试写出随机变量ξ的分布列. 4、篮球运动员比赛投篮,命中得1分,不中得0分,已知运动员甲投篮命 均值、方差、正态分布学生用 (总7页) -CAL-FENGHAI.-(YICAI)-Company One1 -CAL-本页仅作为文档封面,使用请直接删除 § 离散型随机变量的均值与方差、正态分布 1.离散型随机变量的均值与方差 若离散型随机变量X 的分布列为 X x 1 x 2 … x i … x n P p 1 p 2 … p i … p n (1)均值 称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量X 的均值或数学期望,它反映了离散型随机变量取值的平均水平. (2)方差 称D (X )=∑n i =1 (x i -E (X ))2 p i 为随机变量X 的方差,它刻画了随机变量X 与其均值E (X )的平均偏离程度,其算术平方根D X 为随机变量X 的标准差. 2.均值与方差的性质 (1)E (aX +b )=aE (X )+b . (2)D (aX +b )=a 2 D (X ).(a ,b 为常数) 3.两点分布与二项分布的均值、方差 (1)若X 服从两点分布,则E (X )=__p __,D (X )=p (1-p ). (2)若X ~B (n ,p ),则E (X )=__np __,D (X )=np (1-p ). 4.正态分布 (1)正态曲线:函数φμ,σ(x )=1 2πσ e -x -μ2 2σ2 ,x ∈(-∞,+∞),其中μ和σ为参数 (σ>0,μ∈R ).我们称函数φμ、σ(x )的图象为正态分布密度曲线,简称正态曲线. (2)正态曲线的性质: ①曲线位于x 轴上方,与x 轴不相交; ②曲线是单峰的,它关于直线x =μ对称; ③曲线在x =μ处达到峰值1 σ2π; ④曲线与x 轴之间的面积为__1__; ⑤当σ一定时,曲线的位置由μ确定,曲线随着__μ__的变化而沿x 轴平移,如图甲所示; ⑥当μ一定时,曲线的形状由σ确定,σ__越小__,曲线越“瘦高”,表示总体的分布越集中; σ__越大__,曲线越“矮胖”,表示总体的分布越分散,如图乙所示. 人教版高中数学 数学期望与方差及正态分布 __________________________________________________________________________________ __________________________________________________________________________________ 1.理解离散型变量的数学期望与方差的概念. 2.熟练掌握离散型变量的数学期望与方差的公式. 3.熟练掌握离散型变量的数学期望与方差的性质. 4.能利用数学期望与方差解决简单的实际问题. 5.理解概率密度曲线和正态分布的概念. 1.离散型随机变量X 的数学期望 一般地,若离散型随机变量X 的概率分布如下表所示,则称1122n n x p x p x p +++为离散型随机变量X 的数学期望,记为()E X ,其中0i p ≥,i =1,2,…,n ,12p p + 1.n p + += 一般地,若离散型随机变量X 的概率分布如下表所示, 则称2 2 21122()()()n n x p x p x p μμμ-+-++-为离散型随机变量X 的方差,记为()V X ,即2 ; σi p ≥0,i =1,2,…,n ,121,n p p p +++=()E X μ= 3.离散型随机变量X 的标准差 随机变量X 的方差也称为X 的概率分布的方差,X 的方差V (X )的算术平方根称为X 的标准差, 即σ=4.必备公式 (1)离散型随机变量:X 的数学期望(均值)公式、方差公式、标准差公式 E(X)=1122n n x p x p x p ++ +; V (X )=2 2 1122()()x p x p μμ-+-+2()n n x p μ+-; σ =. (2)二项分布的数学期望、方差的计算公式 当X ~B (n ,p )时,E (X )=np ;V (X )=np(1-p). 5.离散型随机变量方差的性质 设ξ是离散型随机变量,则其方差具有如下性质: (1)V (k )=0(k 为常数); (2)2 ();V k k V ξξ= (3)();V k V ξξ+= (4)2()(,).V a b a V a b ξξ+=∈R 6.概率密度曲线 (1)若数据无限增多且组距无限缩小,那么频率直方图的顶边无限缩小乃至形成一条光滑的曲线,我们将此曲线称为概率密度曲线. (2) 正态密度曲线的函数表达式为22 ()2()e ,,0,x P x x μσσμ--=∈>∈R R 7.正态分布 (1)若X 是一个随机变量,对任给区间(a ,b ],P (a 常见分布的期望和方差文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208] 概率与数理统计重点摘要 1、正态分布的计算:()()( )X F x P X x μ σ -=≤=Φ。 2、随机变量函数的概率密度:X 是服从某种分布的随机变量,求()Y f X =的概率密度:()()[()]'()Y X f y f x h y h y =。(参见P66~72) 3、分布函数(,)(,)x y F x y f u v dudv -∞-∞=??具有以下基本性质: ⑴、是变量x ,y 的非降函数; ⑵、0(,)1F x y ≤≤,对于任意固定的x ,y 有:(,)(,)0F y F x -∞=-∞=; ⑶、(,)F x y 关于x 右连续,关于y 右连续; ⑷、对于任意的11221212(,),(,),,x y x y x x y y << ,有下述不等式成立: 4、一个重要的分布函数:1(,)(arctan )(arctan )23 x y F x y πππ2 = ++22的概率密度为:22226 (,)(,)(4)(9) f x y F x y x y x y π?==??++ 5、二维随机变量的边缘分布: 边缘概率密度: ()(,)()(,)X Y f x f x y dy f y f x y dx +∞ -∞+∞ -∞ ==?? 边缘分布函数: ()(,)[(,)]()(,)[(,)]x X y Y F x F x f u y dy du F y F y f x v dx dv +∞ -∞-∞+∞ -∞ -∞ =+∞==+∞=?? ?? 二维正态分布的边缘 分布为一维正态分布。 离散型随机变量的期望、方差和正态分布 【知识回顾】 1. 期望:若离散型随机变量 ξ ,当 ξ=x i 的概率为 P ( ξ=x i ) =P i ( i =1,2 ,…,n ,…),则称 E ξ=∑x i p i 为 ξ 的数学期望,反映了ξ 的平均值. 2. 方差:称 D ξ=∑( x i * E ξ ) 2 p i 为随机变量 ξ 的均方差,简称方差 .ξ D 叫标准差,反映了ξ 的 离散程度. 3. 性质:(1)E ( a ξ+ b )=aE ξ+b ,D ( a ξ+ b ) =a 2D ξ(a 、 b 为常数) . (2)若ξ~B ( n ,p ),则 E ξ=np , D ξ=npq ( q =1*p ). 4 .总体密度曲线: 样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概 率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条 光滑曲线, 这条曲线叫做总体密度曲线. 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间 (a , b ) 内取值的 概率等于总体密度曲线,直线 x =a , x =b 及 x 轴所围图形的面积. 观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种 特征的总体密度曲线一般可用下面函数的图象来表示或近似表示: ),(,21 )(2 2)(+∞-∞∈= -- x e x f x σμσπ 式中的实数 μ、) 0(>σσ是参数,分别表示总体的平均数与标准差,函数 ) (x f 称为正态函数,) (x f 的图象称为正态曲线.正态分布一般记为 ),(2σμN 5 .正态分布) ,(2σμN 是由均值 μ 和标准差 σ 唯一决定的分布, 随机变量 X 的取值区间在(a , b] 上 的概率等于总体密度函数在 [a , b]上的定积分值. 也就是随机变量 X 的取值区间在(a , b] 上的概 率等于正态曲线与直线 x=a , x=b 及x 轴所围成的封闭图形的面积. 6 .正态曲线的性质: ( 1)曲线在 x 轴的上方,与 x 轴不相交 (2)曲线关于直线x=μ 对称 (3)当x=μ时,曲线 位于最高点 (4)当x <μ 时,曲线上升(增函数);当x >μ 时,曲线下降(减函数) 并且当曲线向左、 右两边无限延伸时,以x 轴为渐近线,向它无限靠近 ( 5) μ一定时,曲线的形状由 σ 确定 σ 越大,曲线越“矮胖”,总体分布越分散; σ 越 小.曲线越“高”.总体分布越集中 .随机变量的数学期望与方差
北师大版高数选修23第6讲:数学期望与方差及正态分布(1)
常见分布的期望和方差
常见分布的期望和方差
均值方差正态分布学生用
高二正态分布(期望、方差)讲义
常见分布的期望和方差78835
为何需要正态分布和方差齐性的检验
概率期望与方差的计算和性质
概率分布以及期望和方差
均值、方差、正态分布学生用
人教版高中数学选修2-3第6讲:数学期望与方差及正态分布(教师版)
常见分布的期望和方差
离散型随机变量的期望、方差和正态分布