搜档网
当前位置:搜档网 › 概率论与数理统计 知识点总复习

概率论与数理统计 知识点总复习

概率论与数理统计 知识点总复习
概率论与数理统计 知识点总复习

随机事件和概率 第一节 基本概念

1、排列组合初步 (1)排列组合公式

)!

(!

n m m P n m -= 从m 个人中挑出n 个人进行排列的可能数。

)!

(!!

n m n m C n m -=

从m 个人中挑出n 个人进行组合的可能数。

(2)加法原理(两种方法均能完成此事):m+n

某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。

(3)乘法原理(两个步骤分别不能完成这件事):m ×n

某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m ×n 种方法来完成。 (4)一些常见排列

① 特殊排列 相邻 彼此隔开

顺序一定和不可分辨

② 重复排列和非重复排列(有序) ③ 对立事件 ④ 顺序问题

2、随机试验、随机事件及其运算 (1)随机试验和随机事件

如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。 (2)事件的关系与运算 ①关系:

如果事件A 的组成部分也是事件B 的组成部分,(A 发生必有事件B 发生):B A ?

如果同时有

B A ?,A B ?,则称事件A 与事件B 等价,或称A 等于B :A=B 。

A 、

B 中至少有一个发生的事件:A B ,或者A +B 。

属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也可表示为

A-AB 或者B A ,它表示A 发生而B 不发生的事件。

A 、

B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可能同时发生,称事

件A 与事件B 互不相容或者互斥。基本事件是互不相容的。

Ω-A 称为事件A 的逆事件,或称A 的对立事件,记为A 。它表示A 不发生的事

件。互斥未必对立。 ②运算:

结合率:A(BC)=(AB)C A ∪(B ∪C)=(A ∪B)∪C

分配率:(AB)∪C=(A ∪C)∩(B ∪C) (A ∪B)∩C=(AC)∪(BC)

德摩根率:

=∞==1

1

i i

i i A

A

B A B A =,B A B A =

3、概率的定义和性质 (1)概率的公理化定义 设Ω为样本空间,

A 为事件,对每一个事件A 都有一个实数

P(A),若满足下

列三个条件:

1° 0≤P(A)≤1, 2° P(Ω) =1

3° 对于两两互不相容的事件1A ,

2A ,…有

∑∞=∞==???? ??11)(i i i i A P A P

常称为可列(完全)可加性。 则称P(A)为事件A 的概率。

(2)古典概型(等可能概型)

1° {}n ωωω 21,=

Ω,

2° n

P P P n 1)()()(21=

==ωωω 。 设任一事件

A ,它是由m ωωω 21,组成的,则有

P(A)=

{})()()(21m ωωω =)()()(21m P P P ωωω+++

n m =

基本事件总数

所包含的基本事件数A = 4、五大公式(加法、减法、乘法、全概、贝叶斯) (1)加法公式

P(A+B)=P(A)+P(B)-P(AB)

当P(AB)=0时,P(A+B)=P(A)+P(B) (2)减法公式 P(A-B)=P(A)-P(AB)

当B ?A 时,P(A-B)=P(A)-P(B) 当A=Ω时,P(B )=1- P(B) (3)条件概率和乘法公式

定义 设A 、B 是两个事件,且P(A)>0,则称

)()

(A P AB P 为事件A 发生条件下,事件B

发生的条件概率,记为=)/(A B P )

()

(A P AB P 。

条件概率是概率的一种,所有概率的性质都适合于条件概率。 例如P(Ω/B)=1?P(B /A)=1-P(B/A) 乘法公式:)/()()

(A B P A P AB P =

更一般地,对事件A 1,A 2,…A n ,若P(A 1A 2…A n-1)>0,则有

21(A A P …)n A )|()|()(213121A A A P A A P A P =……21|(A A A P n …)1-n A 。

(4)全概公式 设事件

n B B B ,,,21 满足

1°n B B B ,,,21 两两互不相容,),,2,1(0)(n i B P i =>,

n

i i

B A 1

=?,

则有

)|()()|()()|()()(2211n n B A P B P B A P B P B A P B P A P +++= 。

此公式即为全概率公式。 (5)贝叶斯公式

设事件1B ,2B ,…,n B 及

A 满足

1° 1B ,2B ,…,n B 两两互不相容,

)(Bi P >0,=i 1,2,…,n ,

2° n

i i

B A 1

=?,

0)(>A P ,

∑==

n

j j

j

i i i B A P B P B A P B P A B P 1

)

/()()

/()()/(,i=1,2,…n 。

此公式即为贝叶斯公式。

)(i B P ,

(1=i ,2,…,n ),通常叫先验概率。)/(A B P i ,(1=i ,2,…,n ),通常称为后验概率。如果我们把A 当作观察的“结果”,而1B ,2B ,…,n B 理解为“原因”,则贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。

5、事件的独立性和伯努利试验 (1)两个事件的独立性 设事件A 、B 满足

)()()(B P A P AB P =,则称事件A 、B 是相互独立的

(这个性质不是想当然成立的)。

若事件

A 、

B 相互独立,且0)(>A P ,则有

)()()

()()()()|(B P A P B P A P A P AB P A B P ===

所以这与我们所理解的独立性是一致的。 若事件

A 、

B 相互独立,则可得到A 与B 、A 与B 、A 与B 也都相互独立。

(证明)

由定义,我们可知必然事件Ω和不可能事件?与任何事件都相互独立。(证明) 同时,?与任何事件都互斥。

(2)多个事件的独立性

设ABC 是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A 、B 、C 相互独立。 对于n 个事件类似。 两两互斥→互相互斥。 两两独立→互相独立? (3)伯努利试验

定义 我们作了n 次试验,且满足 ◆ 每次试验只有两种可能结果,

A 发生或A 不发生;

◆ n 次试验是重复进行的,即A 发生的概率每次均一样;

每次试验是独立的,即每次试验

A 发生与否与其他次试验A 发生与否是

互不影响的。

这种试验称为伯努利概型,或称为n 重伯努利试验。 用

p 表示每次试验A 发生的概率,

则A 发生的概率为q p =-1,用)(k P n 表示n

重伯努利试验中

A 出现)0(n k k ≤≤次的概率,

k

n k k

n n q p k P C -=)(,

n k ,,2,1,0 =。

随机变量及其分布 第一节 基本概念

在许多试验中,观察的对象常常是一个随同取值的量。例如掷一颗骰子出现的点数,它本身就是一个数值,因此P(A)这个函数可以看作是普通函数(定义域和值域都是数字,数字到数字)。但是观察硬币出现正面还是反面,就不能简单理解为普通函数。但我们可以通过下面的方法使它与数值联系起来。当出现正面时,规定其对应数为“1”;而出现反面时,规定其对应数为“0”。于是

==)(ωX X ??

?,当反面出现

,当正面出现01

X

为随机变量。又由于

X

是随着试验结果(基本事件ω)不同而变化的,所以X

实际上是基本事件ω的函数,即X=X(ω)。同时事件A 包含了一定量的ω(例如古典概型中A 包含了ω1,ω2,…ωm ,共m 个基本事件),于是P(A)可以由P(X(ω))来计算,这是一个普通函数。

定义 设试验的样本空间为Ω,如果对Ω中每个事件ω都有唯一的实数值X=X(ω)与之对应,则称X=X(ω)为随机变量,简记为X 。

有了随机变量,就可以通过它来描述随机试验中的各种事件,能全面反映试验的

情况。这就使得我们对随机现象的研究,从前一章事件与事件的概率的研究,扩大到对随机变量的研究,这样数学分析的方法也可用来研究随机现象了。

一个随机变量所可能取到的值只有有限个(如掷骰子出现的点数)或可列无穷多个(如电话交换台接到的呼唤次数),则称为离散型随机变量。像弹着点到目标的距离这样的随机变量,它的取值连续地充满了一个区间,这称为连续型随机变量。 1、随机变量的分布函数 (1)离散型随机变量的分布率

设离散型随机变量X 的可能取值为X k (k=1,2,…)且取各个值的概率,即事件(X=X k )的概率为

P(X=x k )=p k ,k=1,2,…,

则称上式为离散型随机变量X 的概率分布或分布律。有时也用分布列的形式给

出:

,,,,,,,,|

)(2121k k k p p p x x x x X P X =。

显然分布律应满足下列条件: (1)0≥k p , ,2,1=k ,

(2)

∑∞

==1

1

k k p 。

(2)分布函数

对于非离散型随机变量,通常有0)(==x X P ,不可能用分布率表达。例如

日光灯管的寿命X ,0)(0==x X P 。所以我们考虑用X

落在某个区间],(b a 内

的概率表示。

定义 设X 为随机变量,x 是任意实数,则函数

)()(x X P x F ≤=

称为随机变量X 的分布函数。

)()()(a F b F b X a P -=≤< 可以得到X 落入区间],(b a 的概率。也就

是说,分布函数完整地描述了随机变量X 随机取值的统计规律性。

分布函数)(x F 是一个普通的函数,它表示随机变量落入区间(– ∞,x]内的概率。

)(x F 的图形是阶梯图形, ,,21x x 是第一类间断点,随机变量X

在k x 处

的概率就是)(x F 在k x 处的跃度。

分布函数具有如下性质: 1° ,1)(0≤≤

x F +∞<<∞-x ;

2° )(x F 是单调不减的函数,即21x x <时,有 ≤)(1x F )(2x F ;

3° 0)(lim )

(==-∞-∞

→x F F x , 1)(lim )(==+∞+∞

→x F F x ;

4° )()

0(x F x F =+,即)(x F 是右连续的;

5° )0()()(--==x F x F x X P 。

(3)连续型随机变量的密度函数 定义 设)(x F 是随机变量

X

的分布函数,若存在非负函数

)(x f ,对任意实数x ,

?∞

-=x

dx

x f x F )()(,

则称

X

为连续型随机变量。

)(x f 称为X

的概率密度函数或密度函数,简称概率

密度。

)(x f 的图形是一条曲线,称为密度(分布)曲线。

由上式可知,连续型随机变量的分布函数)(x F 是连续函数。 所以,

)

()()()()()(1221212121x F x F x X x P x X x P x X x P x X x P -=<<=<≤=≤<=≤≤

密度函数具有下面4个性质: 1° 0)(≥x f 。

?

+∞

-=1

)(dx x f 。

1

)()(==+∞?

+∞∞

-dx x f F 的几何意义;在横轴上面、密度曲线下面的全部面积

等于1。

如果一个函数)(x f 满足1°、2°,则它一定是某个随机变量的密度函数。

)(21x X x P ≤<=)()(12x F x F -=?2

1

)(x x dx x f 。

4° 若

)(x f 在x 处连续,则有)()(x f x F ='。

dx x f dx x X x P )()(≈+≤<

它在连续型随机变量理论中所起的作用与k k p x X P ==)(在离散型随机变量理

论中所起的作用相类似。

)

(),(,独立性古典概型,五大公式,A P A E →→

Ω→ω

)()()()(x X P x F x X X ≤=→≤→ωω

对于连续型随机变量X

,虽然有0)(==x X P ,但事件)(x X =并非是不可能

事件?。

?+=+≤<≤=h

x x

dx x f h x X x P x X P )()()(

令0→h ,则右端为零,而概率0)(≥=x X P ,故得0)(==x X P 。

不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 2、常见分布 ①0-1分布

P(X=1)=p, P(X=0)=q ②二项分布

在n 重贝努里试验中,设事件A 发生的概率为p 。事件A 发生的次数是随机变量,

设为X ,则X 可能取值为n ,,2,1,0 。

k

n k k

n n q p k P k X P C -===)()(, 其中

n k p p q ,,2,1,0,10,1 =<<-=,

则称随机变量X 服从参数为n ,

p 的二项分布。记为),(~p n B X 。

n

k n k k n

n n n n

p q p q p npq q k X P X

C C ,,,,,,|)(2221 ---=

容易验证,满足离散型分布率的条件。 当1=n

时,k k q p k X P -==1)(,1.0=k ,这就是(0-1)分布,所以(0-1)

分布是二项分布的特例。 ③泊松分布 设随机变量

X

的分布律为

λλ-=

=e k k X P k

!

)(,0>λ, 2,1,0=k ,

则称随机变量

X 服从参数为λ的泊松分布,记为

)(~λπX 或者P(λ)。

泊松分布为二项分布的极限分布(np=λ,n →∞)。

如飞机被击中的子弹数、来到公共汽车站的乘客数、机床发生故障的次数、自动控制系统中元件损坏的个数、某商店中来到的顾客人数等,均近似地服从泊松分布。 ④超几何分布

),min(,2,1,0,)(n M l l k C C C k X P n

N

k

n M

N k M ==?==-- 随机变量X 服从参数为n,N,M 的超几何分布。 ⑤几何分布

,3,2,1,)(1===-k p q k X P k ,其中p ≥0,q=1-p 。

随机变量X 服从参数为p 的几何分布。 ⑥均匀分布 设随机变量X

的值只落在[a ,b]内,其密度函数

)(x f 在[a ,b]上为常数k ,即

??

?=,0,

)(k x f 其他,

其中k=

a

b -1

, 则称随机变量X 在[a ,b]上服从均匀分布,记为X~U(a ,b)。 分布函数为

?∞

-=

=x

dx x f x F )()(

当a ≤x 1

21,x x )内的概率为

P(

??

-==<<2

1

21

1

)()21x x x x a b dx x f x X x a

b x x dx --=12

⑦指数分布

设随机变量X 的密度函数为

其中0>λ,则称随机变量X 服从参数为λ的指数分布。 X 的分布函数为

记住几个积分:

,10

=?+∞

-dx xe x

,20

2=?+∞

-dx e x x

)!1(0

1-=?+∞

--n dx e x x

n ?+∞

--=Γ0

1 )(dx e x x αα, )()1(αααΓ=+Γ

0, x

x -- a ≤x ≤b

1, x>b 。

a ≤x ≤b

=)(x f

,x e λλ- 0≥x ,

0, 0

=

)(x F ,1x e λ-- 0

≥x ,

,0 x<0。

⑧正态分布 设随机变量X

的密度函数为

22)(21

)(σμσπ--

=

x e

x f , +∞<<∞-x ,

其中μ、0>σ为常数,则称随机变量X

服从参数为

μ、σ的正态分布或

高斯(Gauss )分布,记为),(~2

σμN X 。

)(x f 具有如下性质:

)(x f 的图形是关于μ=x 对称的;

2° 当μ=x 时,σ

πμ21)(=

f 为最大值;

)(x f 以ox 轴为渐近线。

特别当σ固定、改变μ时,)(x f 的图形形状不变,只是集体沿ox 轴平行移动,

所以μ又称为位置参数。当μ固定、改变σ时,)(x f 的图形形状要发生变化,随σ变大,)(x f 图形的形状变得平坦,所以又称σ为形状参数。

若),(~2

σμN X ,则X

的分布函数为

dt

e

x F x

t ?

---

=

2

22)(21

)(σμπσ

。。

参数0

=μ、1=σ

时的正态分布称为标准正态分布,记为)1,0(~N X ,其密度

函数记为

2

221)(x e x -=

π

?,+∞<<∞-x ,

分布函数为

dt

e

x x

t ?

--

Φ2

221)

。)(x Φ是不可求积函数,其函数值,已编制成表可供查用。

φ(x)和Φ(x)的性质如下:

1° φ(x)是偶函数,φ(x)=φ(-x);

2° 当x=0时,φ(x)=

π

21为最大值;

3° Φ(-x)=1-Φ(x)且Φ(0)=2

1

如果X ~),(2

σ

μN ,则

σ

μ

-X ~)1,0(N 。

所以我们可以通过变换将)(x F 的计算转化为)(x Φ的计算,而)(x Φ的值是可以

通过查表得到的。

??

?

??-Φ-??? ??-Φ=≤<σμσμ1221)(x x x X x P 。

分位数的定义。 3、随机变量函数的分布 随机变量Y 是随机变量

X

的函数)(X g Y

=,若X

的分布函数)(x F X

或密度函

)(x f X 知道,则如何求出)(X g Y =的分布函数)(y F Y 或密度函数)(y f Y 。

(1)X 是离散型随机变量 已知X 的分布列为

,,,,,,,,)(2121n n i p p p x x x x X P X

=,

显然,)(X g Y

=的取值只可能是 ),(,),(),(21n x g x g x g ,若)(i x g 互不相

等,则Y 的分布列如下:

,,,,),(,),(),()(2121n n i p p p x g x g x g y Y P Y

=,

若有某些)(i x g 相等,则应将对应的i P 相加作为)(i x g 的概率。 (2)

X

是连续型随机变量

先利用X 的概率密度f X (x)写出Y 的分布函数F Y (y),再利用变上下限积分的求导公式求出f Y (y)。

二维随机变量及其分布 第一节 基本概念

1、二维随机变量的基本概念

(1)二维离散型随机变量联合概率分布及边缘分布

如果二维随机向量ξ(X ,Y )的所有可能取值为至多可列个有序对(x,y )时,则称ξ为离散型随机量。理解:

(X=x,Y=y )≡(X=x ∩Y=y ) 设

ξ

=(X ,Y )的所有可能取值为

)

,2,1,)(,( =j i y x j i ,且事件

{ξ=),(j i y x }的概率为p ij,,称

),2,1,()},(),{( ===j i p y x Y X P ij j i

为ξ=(X ,Y )的分布律或称为X 和Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:

这里p ij 具有下面两个性质: (1)p ij ≥0(i,j=1,2,…); (2)

.1=∑∑

ij i

j

p

对于随机向量(X ,Y ),称其分量X (或Y )的分布为(X ,Y )的关于X (或Y )的边缘分布。上表中的最后一列(或行)给出了X 为离散型,并且其联合分布律为

),2,1,()},(),{( ===j i p y x Y X P ij j i ,

则X 的边缘分布为 ),2,1,()( ====∑?j i p x X P P ij j

i i ;

Y 的边缘分布为 ),2,1,()( ====∑?j i p y Y P P ij i

i i

(2)二维连续型随机向量联合分布密度及边缘分布 对于二维随机向量

)

,(Y X =ξ,如果存在非负函数

),)(,(+∞<<-∞+∞<<-∞y x y x f ,使对任意一个其邻边分别平行于坐标

轴的矩形区域D ,即D={(X,Y)|a

??=∈D

dxdy y x f D Y X P ,),(}),{(

则称ξ为连续型随机向量;并称f(x,y)为ξ=(X ,Y )的分布密度或称为X 和Y 的联合分布密度。

分布密度f(x,y)具有下面两个性质: (1) f(x,y)≥0; (2)

??

+∞∞-+∞

-=.1),(dxdy y x f

一般来说,当(X ,Y )为连续型随机向量,并且其联合分布密度为f(x,y),则X 和Y 的边缘分布密度为

.),()(),()(?

?

+∞

-+∞

-==dx y x f y f dy y x f x f Y X ,

注意:联合概率分布→边缘分布

(3)条件分布

当(X ,Y )为离散型,并且其联合分布律为

),,2,1,()},(),{( ===j i p y x Y X P ij j i

在已知X=x i 的条件下,Y 取值的条件分布为

,)|(?

=

==i ij i j p p x X y Y P

其中p i ?, p ?j 分别为X ,Y 的边缘分布。

当(X ,Y )为连续型随机向量,并且其联合分布密度为f(x,y),则在已知Y=y 的条件下,X 的条件分布密度为

)

()

,()|(y f y x f y x f Y =

在已知X=x 的条件下,Y 的条件分布密度为

)

()

,()|(x f y x f x y f X =

其中

0)(,0)(>>y f x f Y X 分别为X ,Y 的边缘分布密度。

(4)常见的二维分布

①均匀分布

设随机向量(X ,Y )的分布密度函数为

???

???

?∈=其他

,0),(1

),(D

y x S y x f D

其中S D 为区域D 的面积,则称(X ,Y )服从D 上的均匀分布,记为(X ,Y )~U (D )。 例如图3.1、图3.2和图3.3。

图3.1

O

2 x

图3.2 图3.3

②正态分布

设随机向量(X ,Y )的分布密度函数为

,121

),(2222121211221))((2)1(21

2

??

?

?

???

????

? ??----???? ??----=

σμ

σσμμρσμρρ

σπσy y x x e

y x f

其中1||,0,0,,2121<>>ρσσμμ,共5个参数,则称(X ,Y )服从二维正态

分布,

记为(X ,Y )~N ().,,,222

1

,21ρσσμμ

由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,反推则错。

即X ~N ().(~),,2

2,22

11σμσμN Y

(5)二维随机向量联合分布函数及其性质

设(X ,Y )为二维随机变量,对于任意实数x,y,二元函数

},{),(y Y x X P y x F ≤≤=

称为二维随机向量(X ,Y )的分布函数,或称为随机变量X 和Y 的联合分布函数。

分布函数是一个以全平面为其定义域,以事件

})(,)(|),{(2121y Y x X ≤<-∞≤<-∞ωωωω的概率为函数值的一个实值

函数。分布函数F(x,y)具有以下的基本性质: (1);1),(0≤≤

y x F

(2)F (x,y )分别对x 和y 是非减的,即

当x 2>x 1时,有F (x 2,y )≥F(x 1,y);当y 2>y 1时,有F(x,y 2) ≥F(x,y 1); (3)F (x,y )分别对x 和y 是右连续的,即

);0,(),(),,0(),(+=+=y x F y x F y x F y x F

(4).1),(,0),(),(),(=+∞+∞=-∞=-∞=-∞-∞F x F y F F

2、随机变量的独立性 (1)一般型随机变量 F(X,Y)=F X (x)F Y (y)

(2)离散型随机变量

j i ij p p p ??=

例3.5:二维随机向量(X ,Y )共有六个取正概率的点,它们是:(1,-1),(2,-1),(2,0),2,2),(3,1),(3,2),并且(X ,Y )取得它们的概率相同,则(X ,Y )的联合分布及边缘分布为

(3)连续型随机变量 f(x,y)=f X (x)f Y (y)

联合分布→边缘分布→f(x,y)=f X (x)f Y (y)

直接判断,充要条件: ①可分离变量

②正概率密度区间为矩形

例3.6:如图3.1,f(x,y)=8xy, f X (x)=4x 3

, f Y (y)=4y-4y 3

,不独立。 例3.7:f(x,y)=?

??≤≤≤≤其他,01

0,20,2

y x Axy

(4)二维正态分布

,121

),(2222121211221))((2)1(21

2

???

?

???????

?

??-+---???

? ??----=

σμ

σσμμρσμρρ

σπσy y x x e

y x f

ρ=0

(5)随机变量函数的独立性

若X 与Y 独立,h,g 为连续函数,则:h (X )和g (Y )独立。 例如:若X 与Y 独立,则:3X+1和5Y-2独立。

3、简单函数的分布

两个随机变量的和Z=X+Y ①离散型: ②连续型

f Z (z)=dx x z x f ?+∞

--),(

两个独立的正态分布的和仍为正态分布(22

2121,σσμμ++)。 2、随机变量的独立性

例3.17:设(X ,Y )的联合分布密度为

??

?

?

?≤≤≤+=.

,0,

10),

(),(其他x y y x C y x f

(1) 求C ;

(2) 求X ,Y 的边缘分布; (3) 讨论X 与Y 的独立性; (4) 计算P (X+Y ≤1)。 3、简单函数的分布

随机变量的数字特征 第一节 基本概念

1、一维随机变量的数字特征 (1)一维随机变量及其函数的期望 ①设X 是离散型随机变量,其分布律为P(

k x X =)=p k ,k=1,2,…,n ,

∑==n

k k

k p x X E 1

)(

期望就是平均值。 ③数学期望的性质 (1) E(C)=C (2) E(CX)=CE(X)

(3) E(X+Y)=E(X)+E(Y),∑∑===n i n

i i

i

i

i

X E C X C E 1

1

)()(

(4) E(XY)=E(X) E(Y),充分条件:X 和Y 独立; 充要条件:X 和Y 不相关。 (5) Y=g(X)

离散:∑==n

i k

k p x g Y E 1

)()

(

连续:?+∞

-=

dx x xf X E )()(

?+∞

-=

dx x f x g Y E )()()(

(2)方差

D(X)=E[X-E(X)]2,方差

)()(X D X =σ,标准差

①离散型随机变量

∑-=k

k

k p X E x X D 2)]([)(

②连续型随机变量

?+∞

--=dx x f X E x X D )()]([)(2

③方差的性质

(1) D(C)=0;E(C)=C

(2) D(aX)=a 2D(X); E(aX)=aE(X) (3) D(aX+b)= a 2D(X); E(aX+b)=aE(X)+b

(4) D(X)=E(X 2)-E 2(X)

(5) D(X+Y)=D(X)+D(Y),充分条件:X 和Y 独立; 充要条件:X 和Y 不相关。

D(X ±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。

E(X+Y)=E(X)+E(Y),无条件成立。

类似的,n 个相互独立的正态分布的线性组合,仍服从正态分布),(2

σ

μN 。

∑=i

i i C μμ, ∑=i

i i C 2

22σσ

(3)常见分布的数学期望和方差

①0-1分布

E(X)=p,D(X)=pq ②二项分布 X~B(n,p),k

n

k

k

n

n

q

p

C

k

P-

=

)

(,(k=0,1,2…n)E(X)=np,D(X)=npq

③泊松分布 P(λ) P(X=k)=

!k

e x

k-

λ

,k=0,1,2…

E(X)= λ, D(X)= λ

④超几何分布

n

N

k

n

M

N

k

M

C

C

C

k

X

P

-

-

=

=)

(

E(X)=

N

nM

⑤几何分布1

)

(-

=

=k

pq

k

X

P,k=0,1,2…

E(X)=

p

1

, D(X)=

2

p

q

⑥均匀分布 X~U[a,b],f(x)=

a

b-

1

,[a, b ]

E(X)=

2

b

a+

, D(X)=

12

)

(2

a

b-

⑦指数分布 f(x)= x

λ-,(x>0)

E(X)=λ1

, D(X)=2

1

λ

⑧正态分布 X ~N(μ,σ2

),2

2

2)(21)(σμσ

π--

=

x e

x f

E(X)= μ, D(X)= σ

2

2、二维随机变量的数字特征 (1)协方差和相关系数

对于随机变量X 与Y ,称它们的二阶混合中心矩11μ为X 与Y 的协方差或相关矩,记

为),cov(Y X XY 或σ,即

))].())(([(11Y E Y X E X E XY --==μσ

与记号XY σ相对应,X 与Y 的方差D (X )与D (Y )也可分别记为XX σ与YY σ。 协方差有下面几个性质: (i) cov (X, Y)=cov (Y , X); (ii) cov(aX,bY)=ab cov(X,Y);

(iii) cov(X 1+X 2, Y)=cov(X 1,Y)+cov(X 2,Y); (iv)

cov(X,Y)=E(XY)-(E(X))(E(Y)).

对于随机变量X 与Y ,如果D (X )>0, D(Y)>0,则称

)

()(Y D X D XY

σ

为X 与Y 的相关系数,记作XY ρ(有时可简记为ρ)。

|ρ|≤1,当|ρ|=1时,称X 与Y 安全相关:

完全相关??

?-==时,

负相关,当时,

正相关,当11ρρ

而当0=ρ

时,称X 与Y 不相关。

与相关系数有关的几个重要结论 (i )

若随机变量X 与Y 相互独立,则0=XY ρ;反之不真。

(ii )

若(X ,Y )~N (ρσσμμ,,,,2

22

121)

,则X 与Y 相互独立的充要条件是0=ρ

,即X 和Y 不相关。

(iii ) 以下五个命题是等价的:

①0=XY

ρ;

②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).

(2)二维随机变量函数的期望

???????=??∑∑∞+∞∞

+∞

--为连续型。,

为离散型;

,),(),(),(),(),()],([Y X dxdy y x f y x G Y X p y x G Y X G E i j ij j i

(3)原点矩和中心矩

①对于正整数k ,称随机变量X 的k 次幂的数学期望为X 的k 阶原点矩,记为v k ,即

u k =E(X k

), k=1,2, ….

于是,我们有

??????

?=?∑∞+∞

-.

,)(续型时为连当为离散型时,

当X dx x p x X p x u k i

i k i k

②对于正整数k ,称随机变量X 与E (X )差的k 次幂的数学期望为X 的k 阶中心矩,

记为k μ,即

.,2,1,))(( =-=k X E X E k k μ

于是,我们有

??????

?--=?∑∞+∞

-.

,)())(())((续型时为连当为离散型时,

当X dx x p X E x X p X E x u k i

i k i k

③对于随机变量X 与Y ,如果有)(l k

Y X E 存在,则称之为X 与Y 的k+l 阶混合原

点矩,记为kl u ,即

))].(())([(Y E Y X E X E u k kl --=

大数定律和中心极限定理

第一节 基本概念

1、切比雪夫不等式

设随机变量X 具有数学期望E (X )=μ,方差D (X )=σ2

,则对于任意正数ε,有下列切比雪夫不等式

2

2

)(ε

σεμ≤≥-X P

切比雪夫不等式给出了在未知X 的分布的情况下,对概率

)(εμ≥-X P

的一种估计,它在理论上有重要意义。 2、大数定律

(1)切比雪夫大数定律 (要求方差有界)

设随机变量X 1,X 2,…相互独立,均具有有限方差,且被同一常数C 所界:D (X i )

.1)(11lim 11=???

? ??<-∑∑==∞→εn

i i n i i n X E n X n P

特殊情形:若X 1,X 2,…具有相同的数学期望E (X I )=μ,则上式成为

.11lim 1=???

? ??<-∑=∞→εμn i i n X n P 或者简写成:

()

.1lim =<-∞

→εμX P n

切比雪夫大数定律指出,n 个相互独立,且具有有限的相同的数学期望与方差的随机变量,当n 很大时,它们的算术平均以很大的概率接近它们的数学期望。

(2)伯努利大数定律

设μ是n 次独立试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意的正数ε,有

.1lim =???

?

??<-∞→εμp n P n

伯努利大数定律说明,当试验次数n 很大时,事件A 发生的频率与概率有较大判别的可能性很小,即

.0lim =???

?

??≥-∞→εμp n P n 这就以严格的数学形式描述了频率的稳定性。

(3)辛钦大数定律 (不要求存在方差)

设X 1,X 2,…,X n ,…是相互独立同分布的随机变量序列,且E (X n )=μ,则对于任意的正数ε有

.11lim 1=???

?

??<-∑=∞→εμn i i n X n P

3、中心极限定理

(1)列维-林德伯格定理

设随机变量X 1,X 2,…相互独立,服从同一分布,且具有相同的数学期望和方差:

),2,1(0)(,)(2 =≠==k X D X E k k σμ,则随机变量

σ

μ

n n X

Y n

k k

n ∑=-=

1

的分布函数F n (x )对任意的实数x ,有

?

∑∞

--

=∞

→∞→=???

?

???

???????≤-=x

t n k k n n n dt e

x n n X P x F .21lim )(lim 2

12

πσμ

或者简写成:

)1,0(/N n

X n ??→?-∞

→σμ

此定理也称为独立同分布的中心极限定理。

(2)棣莫弗-拉普拉斯定理

设随机变量X 1,…X n 均为具有参数n, p(0

?

--

→=??

?

???????≤--=x

t n n dt e

x p np np X P .21)1(lim 2

2

π

例5.3:某车间有200台车床,在生产时间内由于需要检修、调换刀具、变换位置、调换工件等常需停车。设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1Kw ,问应供应该车间多少瓦电力,才能以99.9%的概率保证该车间不会因供电不足而影响生产。

数理统计的基本概念 第一节 基本概念

1、总体、个体和样本 (1)总体与样本

总体

在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为

总体(或母体);而把总体中的每一个单元称为样品(或个体)。在以后的讨论中,我们总是把总体看成一个具有分布的随机变量(或随机向量)。

例如单正态总体X ,用

),(~2σμN X

来表示

我们把从总体中抽取的部分样品n x x x ,,,21 称为样本。样本中所含的样品

数称为样本容量,一般用n 表示。为了使抽取的样本很好地反映总体地信息,最常用的方法是“简单随机抽样”:

(1)代表性。即每一样品X i 与总体X 同分布; (2)独立性。即样品抽取互相间不影响。

此时的样本是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。

注意:在泛指任一次抽取的结果时,n x x x ,,,21 表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21 表示n 个具体的数值(样本值)。我们称之为样本的两重性。 (2)样本函数与统计量

设n x x x ,,,21 为总体的一个样本,称

?

?=

(n x x x ,,,21 )

为样本函数,其中?为一个连续函数。如果?中不包含任何未知参数,则称?(n x x x ,,,21 )为一个统计量。

2、统计量 (1)常用统计量

样本均值

.11

∑==n

i i x n x

样本方差

∑=--=n

i i

x x n S 12

2.)(11 (与概率论中的方差定义不同)

样本标准差

.)(111

2∑=--=n

i i x x n S 样本k 阶原点矩

∑===n i k

i k k x n M 1

.,2,1,1

样本k 阶中心矩

∑==-='n

i k i k

k x x n M 1

.,3,2,)(1 (二阶中心矩∑=-=n i i X X n S 1

2

2

)(1*与概率论中的方差

定义相同)

(2)统计量的期望和方差

μ=)(X E ,n

X D 2

)(σ=

22)(σ=S E ,2

21)*(σn

n S E -=

, 其中∑=-=n i i X X n S 1

2

2

)(1*,为二阶中心矩。

3、三个抽样分布(χ2

、t 、F 分布) (1)χ2

分布

设n 个随机变量n X X X ,,,21 相互独立,且服从标准正态分布,可以证明:它们的平方和

∑==n

i i X W 12

的分布密度为

???????<≥??? ??Γ=--.

0,

0,

0221

)(2

122u u e u n u f u

n n

我们称随机变量W 服从自由度为n 的2

κ分布,记为W ~2

κ(n),其中

.20

1

2dx e x n x n

-∞+-?=??? ??Γ 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。

2κ 分布满足可加性:设

),(2i i n Y κ-

).(~211

2k k

i i n n n Y Z +++=∑= κ

注意两个结果:E(χ2

)=n ,D(χ2

)=2n

(2)t 分布

设X ,Y 是两个相互独立的随机变量,且

),(~),1,0(~2n Y N X κ

可以证明:函数

n

Y X T /=

的概率密度为

2

121221)(+-

???

? ?

?+??

?

??Γ?

??

??+Γ=n n t n n n t f π

).(+∞<<-∞t

我们称随机变量T 服从自由度为n 的t 分布,记为T ~t(n)。 注意两个结果:E(T)=0,D(T)=2

-n n

(n>2)

(3)F 分布

设)(~),(~22

12

n Y n X κκ,且X 与Y 独立,可以证明:2

1

//n Y n X F =的概率

密度函数为

?????

????<≥???

? ??+???

?

???

?? ??Γ??? ??Γ???

??+Γ=+-

-.

0,

0,0,1222)(2

2112

2

2121212

111y y y n n y n n n n n n y f n n n n

我们称随机变量F 服从第一个自由度为n 1,第二个自由度为n 2的F 分布,记为F ~f(n 1,

n 2).

正态分布αα

μμ-=-1,

)()(1n t n t αα-=-,

)

,(1

),(12211n n F n n F αα=

-

4、正态总体下统计量的分布和性质

注意一个定理:X 与2

S 独立。

(1)正态分布 设

n x x x ,,,21 为来自正态总体),(2σμN 的一个样

本,则样本函数 ).1,0(~/N n

x u

def

σμ

-

(2)t-分布 设

n x x x ,,,21 为来自正态总体),(2σμN 的一个样

本,则样本函数

),1(~/--n t n

S x t

def

μ

其中t(n-1)表示自由度为n-1的t 分布。

(3)2

κ 分布

n x x x ,,,21 为来自正态总体),(2σμN 的一个样

本,则样本函数

),1(~)1(22

2

--n S n w

def

κσ

其中)1(2

-n κ表示自由度为n-1的2κ分布。

(4)F 分布 设n x x x ,,,21 为来自正态总体),(2

σ

μN 的一个样本,

n y y y ,,,21 为来自正态总体),(2

2σμN 的一个样本,则样本函数

),1,1(~//212

2

222

121--n n F S S F

def

σσ

其中

,)(112

1

1211∑=--=n i i

x x n S ;)(112

1

222

2∑=--=n i i

y y n S )1,1(21--n n F 表示第一自由度为11-n ,第二自由度为12-n 的F 分布。

第七章 参数估计 第一节 基本概念

1、点估计的两种方法 (1)矩法

所谓矩法就是利用样本各阶原点矩与相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体X 的分布中包含有未知数m θθθ,,,21 ,则其分布函数可以表成

).,,,;(21m x F θθθ 显示它的

k 阶原点矩),,2,1)((m k X E v k k

==中也

包含了未知参数

m θθθ,,,21 ,即

)

,,,(21m k k v v θθθ =。又设

n x x x ,,,21 为总体X 的n 个样本值,其样本的k 阶原点矩为

∑=∧

=n i k

i

k x n v 1

1

).,,2,1(m k =

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有

??????

?

?

??

?

???

?===∑∑∑=∧

∧∧=∧∧∧=∧∧

∧n i m i m m n i i m n i i m x n v x n v x n v 121122121

211.1),,,(,1),,,(,

1),,,(θθθθθθθθθ 由上面的m 个方程中,解出的m 个未知参数)

,,,(21∧

∧∧m θθθ 即为参数

(m θθθ,,,21 )的矩估计量。

相关主题