第四章 随机变量的数字特征
㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置. 1、数学期望的定义
(1) 定义 离散型和连续型随机变量X 的数学期望定义为
{}?????==?∑∞∞
- d )( )()( ,
,
连续型离散型x x xf x X x X k
k k P E
其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在. ①常见的离散型随机变量的数学期望
1、离散型随机变量的数学期望
设离散型随机变量的概率分布为
,若,则称级数为随
机变量
的数学期望(或称为均值),记为
, 即
2、两点分布的数学期望
设服从0—1分布,则有
,根据定义,的数学期望为
.
3、二项分布的数学期望
设服从以为参数的二项分布,,则。
4、泊松分布的数学期望
设随机变量
服从参数为的泊松分布,即,从而有
。
①常见的连续型随机变量的数学期望
1)均匀分布
设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a
= 则 =
∴ E (ξ)=(a+b )/2. 即数学期望位于区间的中点.
2)正态分布
设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:
(σ>0,- <μ<+ )
则令得
∴ E(ξ)=μ .
3)指数分布
设随机变量服从参数为的指数分布,的密度函数为
,则.
(2) 随机变量的函数的数学期望设)
(x
g
y=为连续函数或分段连续函数,而X是任一随机变量,则随机变量)
(X
g
Y=的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出Y的概率分布再求其数学期望;对于二元函数)
,
(Y
X
g
Z=,有类似的公式:
(){}
?
?
?
?
?=
=
=
?
∑
∞
∞
.
;
(连续型)
离散型
-
d)
(
)
(
)
(
)
(
x
x
f
x
g
x
X
x
g
X
g
Y k
k
k
P
E
E
()
(){}()
()()()
?
?
?
?
?=
=
=
=
??
∑∑
∞
∞
-
∞
∞
-
.
;
连续型
离散型
d
d
,
,
,
,
,
y
x
y
x
f
y
x
g
y
Y
x
X
y
x
g
Y
X
g
Z
i j
j
i
j
i
P
E
E
设(,)
X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,
i j ij
P X a Y b p i j
====
如果级数
(,)
i j ij
j i
g a b p
∑∑
绝对收敛,则(,)
X Y的函数(,)
g X Y的数学期望为
[(,)](,)
i j ij
j i
E g X Y g a b p
=∑∑
;特别地
();()
i ij j ij
i i j i
E X a p E Y b p
==
∑∑∑∑
.
设X为连续型随机变量,其概率密度为()
f x,如果广义积分()()
g x f x dx
+∞
-∞
?绝对收敛,则X的函数()
g X的数学期望为[()]()()
E g X g x f x dx
+∞
-∞
=?.
设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分
(,)(,)g x y f x y dxdy
+∞+∞
-∞
-∞
??
绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为
[(,)](,)(,)E g x y g x y f x y dxdy
+∞
+∞
-∞
-∞
=?
?
; 特别地
()(,)E x xf x y dxdy +∞+∞
-∞
-∞
=?
?
,
()(,)E Y yf x y dxdy
+∞
+∞
-∞-∞
=??
.
注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
2、数学期望的性质
(1) 对于任意常数c ,有c c =E . 例E[E(X)]=E(X) (2) 对于任意常数λ,有X X
E E λλ=.例:E(aX+b)=aE(X)+b
(3) 对于任意m X X X ,,,21 ,有()m m X X X X X X E E E E +++=+++ 2121. (4) 如果m X X X ,,,21 相互独立,则()m m X X X X X X E E E E
2121=.(注:相互独立
有后面的结论成立,但这是单向性的,即不能有结论推出独立) ㈡ 方差和标准差 表征随机变量取值分散或集中程度的数字特征. 1、方差的定义 称222)()(X X X X X E E E E D -=-=
为随机变量X 的方差,称X
D =σ
为随机变量X 的标准差.随机变量X 的方差有如下计算公式:
(){}()???????-=-=?∑∞
∞
-.;
连续型离散型 )( d )( )( 2
2x x f X x x X X x X k
k k E P E D (4.3) 2、常见分布的方差
(1)两点分布
设ξ~(0-1),其概率分布为: P (ξ=1)=p , P (ξ=0)=1-p =q (0
设ξ~B (n ,p ), 其概率分布为:
(k =0, 1, 2,…,n ) (0
(此处运用组合数公式 )
=
=,
(运用二项分布的数学期望公式知 )
E (ξ2)=np (n -1)p +np ,
∴ D (ξ)=E (ξ2)-(E (ξ))2=np (1-p ). (3)均匀分布
设ξ~U [a , b ] ( a < b ),它的概率密度函数为:
E (ξ)=(a +b )/2 ,
.
∴ D (ξ)=E (ξ2)-(E (ξ))2=(b -a )2/12. (4)正态分布
设ξ~N (μ, σ2),它的概率密度函数为: (σ>0,-∞<μ<+∞) E (ξ)=μ
(令t =(x -μ)/σ)
=σ2 ∴ D (ξ)=σ2.
(5)指数分布
2、方差的性质 (1)
0≥X D ,并且0=X D 当且仅当X
(以概率1)为常数;
(2) 对于任意实数λ,有X
X D D 2λλ=;(方差对随机变量前面的常数具有平方作用)
(3) 若m X X X ,,,21 两两独立或两两不相关,则
()m m X X X X X X D D D D +++=+++ 2121.
(4)D(X)≥0,D(X)=0的充要条件是P {X=E (X )}=1或者P{X=C}=1. (5)设X 是一个随机变量,c 是常数,则D(X+c)=D(X).例:D (kξ+c )= k 2D (ξ); ㈢ 切比雪夫不等式
我们知道方差)(X D 是用来描述随机变量X 的取值在其数学期望)(X E 附近的离散程度的,因此,对任意的正数ε,事件ε≥-)(X E X 发生的概率应该与)(X D 有关,而这种关系用数学形式表示出来,就是下面我们要学习的切比雪夫不等式。
定理1 设随机变量X 的数学期望)(X E 与方差)(X D 存在 ,则对于任意正数ε,不等式 2
)
(])([ εεX D X E X P ≤
≥- (1) 或 2
)
(1])([ ε
εX D X E X P -
≥<- (2)
都成立。不等式(1)和(2)称为切比雪夫不等式。
切比雪夫不等式给出了在随机变量X 的分布未知的情况下,只利用X 的数学期望和方差即可对X 的概率分布进行估值的方法,这就是切比雪夫不等式的重要性所在。
例1 已知正常男性成人血液中,每毫升含白细胞数的平均值是7300,均方差是700,利用切比雪夫不等式估计每毫升血液含白细胞数在9400~5200之间的概率。
解 设X 表示每毫升血液中含白细胞个数,则
700)()(,7300)(===X D X X E σ
而}2100|7300{|1}2100|7300{|}94005200{≥--=≤-=≤≤X P X P X P
又912100700}2100|7300{|2
2=≤≥-X P 所以9
8
}94005200{≥≤≤X P ㈢ 协方差和相关系数
考虑二维随机向量),(Y X ,其数字特征包括每个变量的数学期望和方差,以及X 和Y 的联合数字特征——协方差和相关系数.
1、协方差和相关系数的定义
(1) 协方差 随机变量X 和Y 的协方差定义为
Y X XY Y Y X X Y X E E E E E E -=--=))((),cov(,
其中
{}()()()???????===??∑∑∞∞-∞
∞
-.;连续型离散型 d d , , y x y x xyf y Y x X y x XY i j
j i j i P E (2) 相关系数 随机变量X 和Y 的相关系数定义为
()y
x Y X XY Y X Y X σσρE E E D D -==
,cov .
2、协方差的性质 设随机变量X 和Y 的方差存在,则它们的协方差也存在. (1) 若X 和Y 独立,则0),cov(=Y X ;对于任意常数c ,有0),cov(=c X .
(2)
),cov(),cov(X Y Y X =.
(3) 对于任意实数a 和b ,有),cov(),cov(Y X ab bY aX =.
(4) 对于任意随机变量Z Y X ,,,有
.
,
),cov(),cov(),cov( ),cov(),cov(),cov(Z X Y X Z Y X Z Y Z X Z Y X +=++=+
(5) 对于任意X 和Y ,有()Y X Y X D D ≤,cov .
(等号成立,且当仅当存在常数啊,a ,b 使P{Y=a+bX}=1成立)
(6) 对于任意X 和Y ,有),cov(2)(Y X Y X Y X
±+=±D D D .
3、相关系数的性质 相关系数的如下三条基本性质,决定了它的重要应用.设ρ——X 和Y 的相关系数,,,,,2
22
121Y X Y X D D E E ====σσμμ
(1)
11≤≤-ρ.
(2) 若X 和Y 相互独立,则ρ=0;但是,当ρ=0时X 和Y 却未必独立. (3)
1=ρ的充分必要条件是X 和Y (以概率1)互为线性函数.
(4)对随机变量x ,y ,下列事件等价: ①cov (X,Y )=0;
②X 和Y 不相关;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y)
三条性质说明,随着变量X 和Y 之间的关系由相互独立到互为线性函数,它们的相关系数的绝对值
ρ
从0增加到1,说明相关系数可以做两个变量统计相依程度的度量.
4、随机变量的相关性 假设随机变量X 和Y 的相关系数ρ存在.若ρ= 0,则称X 和Y 不相关,
否则称X 和Y 相关.
(1) 若两个随机变量独立,则它们一定不相关,而反之未必;
(2) 若X 和Y 的联合分布是二维正态分布,则它们“不相关”与“独立”等价.
㈣ 矩 在力学和物理学中用矩描绘质量的分布.概率统计中用矩描绘概率分布.常用的矩有两大类:原点矩和中心矩.数学期望是一阶原点矩,而方差是二阶中心矩.
1、原点矩 对任意实数0≥k ,称k
k X E =α为随机变量X的k 阶原点矩,简称k 阶
矩.X
E 1
=α.原点矩的计算公式为:
{}???????===?∑∞
∞
-.;
连续型离散型 d )( )()( x x f x x X x X k
i i k i k
k P E α 一阶原点矩是数学期望()E X ; 2、中心矩 称()
k
k
X X E E -=μ为随机变量X的k 阶中心矩.二阶中心矩是方差D(X);
3.混合中心矩随机变量(,)X Y 的(,)k l 阶混合原点矩定义为()k
l
E X Y ;随机变量(,)X Y 的(,)
k l 阶混合中心矩定义为[(())(())]k l
E X E X Y E Y --.(1,1)阶混合中心矩为协方差cov(,)X Y . (四)常用分布的数字特征
9.1当X 服从二项分布(,)B n p 时, (),()(1)E X np D X np p ==-. 9.2 当X 服从泊松分布()p λ时, (),()E X D X λλ==,
9.3 当X 服从区间(,)a b 上均匀分布时,
2
()(),()212a b b a E X D X +-==
9.4 当X 服从参数为λ的指数分布时,
2
11
(),()E X D X λλ== 9.5 当X 服从正态分布2(,)N μσ时, 2
(),()E X D X μσ==.
9.6 当(,)X Y 服从二维正态分布
22
1212(,,,,)N μμσσρ时, 211(),()E X D X μσ==;222(),()E Y D Y μσ==;12cov(,),XY X Y ρσσρρ==
三、典型例题及其分析
例4.2.1 一台设备由三大部件构成,在设备运转中各部件需要调整的概率相应为0.10,0.20和0.30,假设各部件的状态相互独立,以
X 表示同时需要调整的部件数,试求X 的数学期望EX 和方差DX .
【思路】 关键是求出X 的分布律,然后用定义计算EX .
【解】 引入事件:
{} i=1,2,3.i A i =第个部件需要调整
根据题设,三部件需要调整的概率分别为
()()()1230.10,0.20,0.30.P A P A P A ===
由题设部件的状态相互独立,于是有 ()()
()()()1231230 0.90.80.70.504.
P X P A A A P A P A P A ====??=
()(
)
12312312310.10.80.70.90.20.70.90.80.3 0.398
P X P A A A A A A A A A ==??=??+??+??=()()
12312312320.10.20.70.10.80.30.90.20.3 0.092;
P X P A A A A A A A A A ==??=??+??+??=
于是
的分布律为
从而
00.50410.39820.09230.006
0.6,
i i i
EX x p ==?+?+?+?=∑
22222200.50410.39820.09230.006
0.820.
i i i
EX x p ==?+?+?+?=∑
故
()2
220.8200.60.46.DX EX EX =-=-=
【解毕】
【技巧】 本题的关键是引入事件
i A ,将X
的分布律求出,因此,可以发现求期望和方差的难点转到了求
X
的分布.同
时,方差的计算一般均通过公式()
2
2DX
EX EX =-来进行.
例4.2.3 设X 是一随机变量,其概率密度为
()1, 10,1, 01,0, x x f x x x +-≤≤??
=-<≤???
其他.
求DX .
(1995年考研题) 【解】
()()()()()()()01
1
011
2
2
2
2
2
1
110.
.11211 6
EX xf
x dx x x dx x x dx EX
x f
x dx x x dx x x dx x x dx
+∞
-∞-+∞
-∞
-=
=++-==
=++-=-=
?
???
???
于是
()2
21.6
DX EX EX =-= 【解毕】
【技巧】 在计算数学期望和方差时,应首先检验一下
()f x 的奇偶性,这样可利用对称区间上奇偶函数的积分公式简化
求解,比如本题中,
()f x 为偶函数,故()0.EX xf x dx +∞
-∞
=
=?同样DX 的计算也可直接简化.
例4.2.4 已知连续型随机变量X 的密度函数为
(
)2
21
, - x f x -+-= ∞∞求EX 与DX . (1987年考研题) 【思路】 一种求法是直接利用数学期望与方差的定义来求.另一种方法是利用正态分布的形式及其参数的含义. 【解】 (方法1)直接法. 由数学期望与方差的定义知 ( )( ) ( ) ()( ) () 2 2 2 2 11111 1. x x x x EX xf x dx xe dx e dx x e dx e dx +∞ +∞ +∞ +∞ -------∞ +∞ --== = -= =? ? ? ?? ()() ()( ) ( ) 2 2 2 2 2 2 12 111 .2 x t t DX E X EX x f x dx x dx t e e dt +∞ +∞ ---∞ -∞ +∞ +∞ ---∞ -∞ =-=-=-= = ??? ? (方法2) 利用正态分布定义. 由于期望为μ,方差为2 σ ()()2 2 2.x x μσ-- -∞<<+∞所以把()f x 变形为 ()( )2 2 1212 x f x e π -- ?= 易知, ()f x 为11, 2N ?? ???的概率密度,因此有1 1,.2 EX DX == 【技巧】 解决本题的关键是要善于识别常用分布的密度函数,不然的话,直接计算将会带来较大的工作量.反过来,用正 态分布的特性也可以来求积分 2 kx e dx +∞ --∞ ?等. (2)若干计算公式的应用 主要包括随机变量函数的数学期望公式,数学期望与方差的性质公式的应用. 例4.2.5 设X 表示10次独立重复射击中命中目标的次数,每次射中目标的概率为0.4,求2 EX . (1995年考研题) 【解】 由题意知()~10,0.4X B 于是100.44,EX =?=()100.410.4 2.4.DX =??-= 由() 2 2DX EX EX =-可推知()2 2 22.4418.4.EX DX EX =+=+= 【寓意】 本题考查了两个内容,一是由题意归结出随机变量X 的分布;二是灵活应用方差计算公式,如果直接求解,那 么() 10 102 2100 0.410.4k k k K EX k C -==-∑的计算是繁琐的. 例4.2.6 设X 服从参数1λ =的指数分布,求()2X E X e -+.(1992年考研题) 【解】 由题设知,X 的密度函数为 (), 0, 0, 0. x e x f x x -?>=? ≤? 且1EX =,又因为()2220 1,3X x x x Ee e f x dx e e dx +∞ +∞ -----∞ = = =?? 从而 ()2214 1.33 X X E X e EX Ee --+=+=+= 【解毕】 【寓意】 本题的目的是考查常见分布的分布密度(或分布律)以及它们的数字特征,同时也考查了随机变量函数的数学期望的求法. 例4.2.7 设二维随机变量(),X Y 在区域(){},:01,G x y x y x =<<<内服从均匀分布, 求随机变量21Z X =+的方差.DZ 【解】 由方差的性质得知 ()214DZ D X DX =+= 又由于 X 的边缘密度为 ()()1, 01 ,0, .2, 01 0, x X x dy x f x f x y dy x x +∞ - -∞ ?<= =??? <=? ??? 其他其他. 于是