搜档网
当前位置:搜档网 › _Matlab在概率统计中的应用

_Matlab在概率统计中的应用

_Matlab在概率统计中的应用
_Matlab在概率统计中的应用

第8章 Matlab在概率统计中的应用

概率论与数理统计是研究和应用随机现象统计规律性的一门数学科学。其应用十分广泛,几乎遍及所有科学领域、工农业生产和国民经济各部门。本章将利用Matlab来解决概率统计学中的概率分布、数字特征、参数估计以及假设检验等问题。

8.1 数据分析

8.1.1 几种均值

在给定的一组数据中,要进行各种均值的计算,在Matlab中可由以下函数实现。

mean 算术平均值函数。对于向量X,mean (X) 得到它的元素的算术平均值;

对于矩阵,mean (X)得到X各列元素的算术平均值,返回一个行向量。

nanmean 求忽略NaN的随机变量的算术平均值。

geomean 求随机变量的几何平均值。

harmmean 求随机变量的和谐平均值。

trimmean 求随机变量的调和平均值。

8.1.2 数据比较

在给定的一组数据中,还常要对它们进行最大、最小、中值的查找或对它们排序等操作。Mtalab中也有这样的功能函数。

max 求随机变量的最大值元素。

nanmax 求随机变量的忽略NaN的最大值元素。

min 求随机变量的最小值元素。

nanmin 求随机变量的忽略NaN的最小值元素。

median 求随机变量的中值。

nanmedian 求随机变量的忽略NaN的中值。

mad 求随机变量的绝对差分平均值。

sort 对随机变量由小到大排序。

sortrows 对随机矩阵按首行进行排序。

range 求随机变量的值的范围,即最大值与最小值的差(极差)。

8.1.3 累和与累积

求向量或矩阵的元素累和或累积运算是比较常用的两类运算,在Matlab中可由以下函数实现。

sum 若X为向量,sum (X)为X中各元素之和,返回一个数值;若X为矩阵,sum (X)为X中各列元素之和,返回一个行向量。

nansum 忽略NaN求向量或矩阵元素的累和。

cumsum 求当前元素与所有前面位置的元素和。返回与X同维的向量或矩阵。

cumtrapz 梯形累和函数。

prod 若X为向量,prod (X)为X中各元素之积,返回一个数值;若X为矩阵,prod (X)为X中各列元素之积,返回一个行向量。

cumprod 求当前元素与所有前面位置的元素之积。返回与X同维的向量或矩阵。8.2 离散型随机变量的概率及概率分布

8.2.1 几个常见分布

8.2.1.1 二项分布

设随机变量X 的分布律为:

P {X = k } = C n k p k (1-p) n

- k k = 0, 1, 2, …, n

其中:0< p <1,n 为独立重复试验的总次数,k 为n 次重复试验中事件A 发生的次数,p 为每次试验事件A 发生的概率。则称X 服从二项分布,记为X~B (n, p)。 8.2.1.2 Poisson 分布

设随机变量X 的分布律为:

0;,2,1,0!

}{>==

=-λλλ k e k k x P k

则称X 服从参数为λ的Poisson 分布,记为X~P (λ)。Poisson 是二项分布的极限分布,当二项分布中的n 较大而p 又较小时,常用Poisson ,λ= np 。 8.2.1.3 超几何分布

设一批同类产品共N 件,其中有M 件次品,从中任取n (n ≤N)件,其次品数X 恰为k 件的概率分布为:

),min(,,2,1,0,}{M n k C C C k X P n

N

k n M

N k M ===--

则称次品数X 服从参数为 (N, M, n)的超几何分布。超几何分布用于无放回抽样,当N 很大而n 较小时,次品率N

M

p =在抽取前后差异很小,就用二项分布近似代替超几何分布,其中二项分布的N

M

p =。而且在一定条件下,也可用Poisson 分布近似代替超几何分布。

8.2.2 概率密度函数值

无论是离散分布还是连续分布,在Matlab 中,都用通用函数pdf 或专用函数来求概率密度函数值。而对于离散型随机变量,取值是有限个或可数个,因此,其概率密度函数值就是某个特定值的概率,即利用函数pdf 求输入分布的概率。 1. 通用概率密度函数pdf 计算特定值的概率

命令:pdf

格式为:Y = pdf (‘name ’, k, A) Y = pdf (‘name ’, k, A, B) Y = pdf (‘name ’, k, A, B, C)

说明:返回以name 为分布,在随机变量X = k 处,参数为A 、B 、C 的概率密度值;对离散型随机变量X ,返回X = k 处的概率值,name 为分布函数名。

常见的分布有:

name = bino (二项分布),hyge (超几何分布),geo (几何分布),poiss (Poisson 分布)。 2. 专用概率密度函数计算特定值的概率 (1)二项分布的概率值

命令:binopdf

格式:binopdf (k,n,p)

说明:等同于pdf (‘bino ’, k, n, p)。n —试验总次数;p —每次试验事件A 发生的概率;k —事件A 发生k 次。

(2)Poisson 分布的概率值 命令:poisspdf

格式:poisspdf (k, Lambda)

说明:等同于pdf (‘poiss’, k, Lam bda),参数Lambda = np 。 (3)超几何分布的概率值 命令:hygepdf

格式:hygepdf (k, N, M, n)

说明:等同于pdf (‘hyge’, k, N, M, n),N—产品总数,M—次品总数,n—抽取总数(n≤N),k—抽得次品数。

3. 通用函数cdf用来计算随机变量X≤k的概率之和(累积概率值)

命令:cdf

格式:cdf (‘name’, k, A)

cdf (‘name’, k, A, B)

cdf (‘name’, k, A, B, C)

说明:返回以name为分布、随机变量X≤k的概率之和(即累积概率值),name为分布函数名。

4. 专用函数计算累积概率值(随机变量X≤k的概率之和,即分布函数)

(1)二项分布的累积概率值

命令:binocdf

格式:binocdf (k, n, p)

(2)Poisson分布的累积概率值

命令:poisscdf

格式:poisscdf (k, Lambda)

(3)超几何分布的累积概率值

命令:hygecdf

格式:hygecdf (k, N, M, n)

8.2.2.1 二项分布

1.求n次独立重复试验中事件A恰好发生k次的概率P。

命令:pdf

或binopdf

格式:pdf (‘bino’, k, n, p)

或binopdf (k, n, p)

说明:该命令的功能是计算二项分布中事件A恰好发生k次的概率。pdf为通用函数,bino表示二项分布,binopdf为专用函数,n为试验总次数,k为n次试验中,事件A发生的次数,p为每次试验事件A发生的概率。

2.在n次独立重复试验中,事件A至少发生k次的概率P_s。

命令:cdf

或binocdf

格式:cdf (‘bino’, k, n, p)

或binocdf (k, n, p)

说明:该命令的功能是返回随机变量X≤k的概率之和(即累积概率值)。其中cdf为通用函数,binocdf为专用函数,n为试验总次数,k为n次试验中,事件A发生的次数,p 为每次试验事件A发生的概率。

所以,至少发生k次的概率为

P_s = 1- cdf (‘bino’, k-1, n, p) 或P_s = 1- binocdf (k-1, n, p)

例8-1某机床出次品的概率为0.01,求生产100件产品中:

(1)恰有1件次品的概率;

(2)至少有1件次品的概率。

解:此问题可看作是100次独立重复试验,每次试验出次品的概率为0.01。

(1)恰有1件次品的概率

在Matlab命令窗口键入:

>> p=pdf('bino',1,100,0.01) %利用通用函数计算恰好发生k次的概率

p =

0.3697

或在Matlab命令窗口键入:

>> p=binopdf(1,100,0.01) %利用专用函数计算恰好发生k 次的概率 p =

0.3697

(2)至少有1件次品的概率 在Matlab 命令窗口键入:

>> p=1-cdf('bino',0,100,0.01) % cdf 是用来计算X ≤k 的累积概率值的通用函数,这里是计算X ≥1的概率值。

p =

0.6340

或在Matlab 命令窗口键入: >> p=1-binocdf(0,100,0.01) p =

0.6340

8.2.2.2 Poisson 分布

在二项分布中,当n 的值很大,p 的值很小,而np 又较适中时,用Poisson 分布来近似二项分布较好(一般要求λ= np<10)。

1. n 次独立重复试验中,事件A 恰好发生k 次的概率P_k 。 命令:pdf

或 poisspdf

格式:pdf (‘poiss ’, k, Lambda) 或 poisspdf (k, Lambda)

说明:在Matlab 中,poiss 表示Poisson 分布。该命令返回事件恰好发生k 次的概率。 2. n 次独立重复试验中,事件A 至少发生k 次的概率P (1)累积概率值 命令:cdf

或 poisscdf

格式:cdf (‘poiss ’, k, Lambda) 或 poisscdf (k, Lambda)

说明:该函数返回随机变量X ≤k 的概率之和,Lambda = np (2)A 至少发生k 次的概率P_k

P_k = 1- cdf (‘poiss ’, k -1, Lambda) 或 P_k = 1- poisscdf (k -1, Lambda)

例8-2 自1875年到1955年中的某63年间,某城市夏季(5—9月间)共发生暴雨180次,试求在一个夏季中发生k 次(k = 0, 1, 2, …, 8)暴雨的概率P k (设每次暴雨以1天计算)。

解:一年夏天共有天数为

n = 31+30+31+31+30 = 153

故可知夏天每天发生暴雨的概率约为153

63180

?=p ,很小,n = 153较大,可用Poisson

分布近似λ= np =

63

180

。 在Matlab 编辑器中编写M 文件:LX0802.m p=input('input p=') n=input('input n=') lambda=n*p

for k=1:9 %循环变量的最小取值是从k = 1开始。 p_k(k)=poisspdf(k-1,lambda); end p_k

在Matlab 的命令窗口键入LX0802,回车后按提示输入p 和n 的值,显示如下: input p=180/(63*153)

p =

0.0187

input n=153

n =

153

lamda =

2.8571

p_k =

Columns 1 through 7

0.0574 0.1641 0.2344 0.2233 0.1595 0.0911 0.0434

Columns 8 through 9

0.0177 0.0063

注意:在Matlab中,p_k (0)被认为非法,因此应避免。

例8-3某市公安局在长度为t的时间间隔内收到的呼叫次数服从参数为t/2的Poisson 分布,且与时间间隔的起点无关(时间以小时计)。

求:(1)在某一天中午12时至下午3时没有收到呼叫的概率;

(2)某一天中午12时至下午5时至少收到1次呼叫的概率。

解:在此题中,Lamda = t/2

设呼叫次数X为随机变量,则该问题转化为:

(1)求P{X = 0};

(2)求1-P{X≤0}。

解法一:在Matlab命令窗口键入:

>> poisscdf (0,1.5) %X = 0表示0次呼叫,Lambda = t/2 = 1.5

ans =

0.2231

即(1)中没有收到呼叫的概率为0.2231。

>> 1-poisscdf (0,2.5)

ans =

0.9179

即(2)中至少收到1次呼叫的概率为0.9179。

解法二:

由于呼叫次数X≤0就是呼叫0次,即X = 0。因此,此题也可用poisspdf求解。即:poisspdf (0, 1.5)和1-poisspdf (0, 2.5)。

8.2.2.3 超几何分布

1.设N为产品总数,M为其中次品总数,n为随机抽取件数(n≤N),则次品数X恰为k件的概率p_k(k = 0, 1, 2, …, min (n, M))可由下列命令求得:

命令:pdf

或hygepdf

格式:pdf (‘hyge’, k, N, M, n)

或hygepdf (k, N, M, n)

2. 累积概率值的求法:

命令:cdf

或hygecdf

格式:cdf (‘hyge’, k, N, M, n)

或hygecdf (k, N, M, n)

说明:该函数的功能是返回次品数X≤k的概率之和。

例8-4设盒中有5件同样的产品,其中3件正品,2件次品,从中任取3件,求不能取得次品的概率。

解:在Matlab编辑器中编辑M文件:LX0802.m

N=input('input N=')

M=input('input M=')

n=input('input n=')

for k=1:M+1

p_k=hygepdf(k-1,N,M,n) end

在Matlab 的命令窗口键入LX0804,回车后按提示输入N 、M 、n 的值,显示如下: input N=5 N = 5 input M=2 M = 2 input n=3 n = 3 p_k =

0.1000 p_k =

0.6000 p_k =

0.3000

这里,p_k=(0.1000 0.6000 0.3000)表示取到次品数分别为X = 0, 1, 2的概率。

8.3 连续型随机变量的概率及其分布

8.3.1 几个常见的分布

8.3.1.1 均匀分布

若随机变量X 的概率密度为

???

??≤≤-=其它

1)(b x a a

b x p ,

则称X 在区间[a, b]上服从均匀分布,记为X~U (a, b)。

8.3.1.2 指数分布

若随机变量X 的概率密度为

??

?<≥=-0

0)(x x e x p x

λλ,其中0>λ为常数

则称X 服从参数为λ的指数分布,记为E (λ)。 8.3.1.3 正态分布

若随机变量X 的概率密度为

∞<<∞-=

--

x e

x p x 2

22)(21

)(σμσ

π

其中μ,)0(>σσ是两个常数,

则称X 服从参数为μ,σ的正态分布,记为X~N (μ,2

σ)。 8.3.1.4 Γ分布

??

???≤>Γ=--0

)()(1x x e x x p x βαααβ, 其中0>α,0>β

记为:),(βαΓ 8.3.1.5 β分布

???

??<<-ΓΓ+Γ=--其它

10)1()

()()()(11

x x x x p βαβαβα, 其中0>α,0>β

记为:),(βαβ

8.3.1.6 2χ分布(卡方分布)

X 的分布密度为

????

???<≥Γ=-

-0

00

)

2(21)(2122x x e x n x p x

n n

, n 为正整数,则称X 为服从自由度为

n 的2χ分布,记为:X~2

χ(n )。

8.3.1.7 t 分布

若随机变量t 的分布密度为

)1()2

()21

(

)(2

12

∞<<∞-+Γ+Γ=+-t n t n n n t p n π,

n 为正整数,则称t 为服从自由度为n 的t 分布,记为:T~ t (n)。 8.3.1.8 F 分布

若随机变量x 的分布密度为

?

??????≤>+?ΓΓ+Γ=+-00

0)

()2()2()2()(22121121

2

122221121x x n x n x n n n n n n x p n n n n n ,n 1,n 2为正整数,则称X 服从第一自由度为n 1,第二自由度为n 2的F 分布,记为:X~F (n 1, n 2)。

8.3.2 概率密度函数值

连续型随机变量:如果存在一非负可积函数0)(≥x p ,使对于任意实数b a ≤,X 在区间),(b a 上取值的概率为:?=<

a dx x p

b X a P )(}{,则函数)(x p 称作随机变量X 的概率密

度函数。通用函数pdf 和专用函数用来求密度函数)(x p 在某个点x 处的值。

1. 利用概率密度函数值通用函数pdf 计算 格式:pdf (‘name ’, x, A) pdf (‘name ’, x, A, B) pdf (‘name ’, x, A, B, C)

说明:返回以name 为分布的随机变量在X = x 处、参数为A 、B 、C 的概率密度函数值。name 取值如下表8.1所示。

2.利用专用函数计算概率

例8-5 计算正态分布N (0,1)在点0.7733的概率密度值。

解:在Matlab命令窗口键入:

>> pdf('norm',0.7733,0,1) %利用通用函数

ans =

0.2958

>> normpdf(0.7733,0,1) %利用专用函数

ans =

0.2958

两者计算结果完全相同。

例8-6绘制卡方分布密度函数在n分别等于1,5,15时的图形。

解:在Matlab编辑器中编辑M文件:LX0806.m

x=0:0.1:30;

y1=chi2pdf(x,1);

plot(x,y1,':')

hold on

y2=chi2pdf(x,5);

plot(x,y2,'+')

y3=chi2pdf(x,15);

plot(x,y3,'o')

axis([0,30,0,0.2])

xlabel('图8.1')

在命令窗口键入LX0806,回车后得结果为图8.1。

8.3.3 累积概率函数值(分布函数)

连续型随机变量的累积概率函数值是指随机变量X≤x的概率之和。即:

P{X≤x}=?∞-x dt t p)(

也就是连续型随机变量的分布函数F (x),F (x)既可以用通用函数,也可用专用函数来计算。通常用这些函数计算随机变量落在某个区间上的概率和随机变量X的分布函数F (x)。

1. 利用通用函数cdf计算累积概率值

格式:cdf (‘name’, x, A)

cdf (‘name’, x, A, B)

cdf (‘name’, x, A, B, C)

说明:返回随机变量X≤x的概率之和。name为上述分布函数名。

2. 利用专用函数计算累积概率值

其命令函数是在上述分布后面加上cdf,其用法同专用函数计算概率密度函数值。

如正态分布的累积概率值:

命令函数为:normcdf (x, mu, sigma)

则显示结果为F (x) =?∞-x dt t p)(的值。

例8-7某公共汽车站从上午7:00起每15分钟来一班车。若某乘客在7:00到7:30间的任何时刻到达此站是等可能的,试求他侯车的时间不到5分钟的概率。

解:设乘客7点过X分钟到达此站,则X在[0,30]内服从均匀分布,当且仅当他在时间间隔(7:10,7:15)或(7:25,7:30)内到达车站时,侯车时间不到5分钟。故其概率为:p = P{10

在Matlab编辑器中建立M文件LX0807.m如下:

format rat

p1=unifcdf(15,0,30)-unifcdf(10,0,30);

p2=unifcdf(30,0,30)-unifcdf(25,0,30);

p=p1+p2

运行结果为:

p =

1/3

例8-8 设X~N (3, 22),求P{22},P{X>3}。

解:在Matlab编辑器中编辑M文件LX0808.m如下:

p1=normcdf(5,3,2)-normcdf(2,3,2)

p2=normcdf(10,3,2)-normcdf(-4,3,2)

p3=1-normcdf(2,3,2)+normcdf(-2,3,2) p4=1-normcdf(3,3,2) 运行结果为: p1 =

0.5328 p2 =

0.9995 p3 =

0.6977 p4 =

0.5000

例8-9 设随机变量X 的概率密度为

???

??≥<-=1

||01||1)(2

x x x c x p

(1)确定常数c ;

(2)求X 落在区间)2

1,21(-内的概率;

(3)求X 的分布函数F (x)。 解:(1)在Matlab 编辑器中建立M 文件LX08091.m 如下: syms c x

p_x=c/sqrt(1-x^2); F_x=int(p_x,x,-1,1) 运行结果为: F_x = pi*c

由pi*c=1得 c=1/pi

(2)在Matlab 编辑器中建立M 文件LX08092.m 如下: syms x

c='1/pi'; %'1/pi'不加单引号“’’”,其结果的表达式有变化。 p_x=c/sqrt(1-x^2); format rat

p1=int(p_x,x,-1/2,1/2) 运行结果为: p1 = 1/3

(3)在Matlab 编辑器中建立M 文件LX08093.m 如下: syms x t c='1/pi';

p_t=c/sqrt(1-t^2); F_x=int(p_t,t,-1,x) 运行结果为: F_x =

1/2*(2*asin(x)+pi)/pi >> simple(F_x) ans =

asin(x)/pi+1/2

所以X 的分布函数为:F (x) = ??

??

?≥<≤-+<111121

arcsin 00

x x x x π

例8-10 设lnX ~ N (1, 22),求P{22

1

<

解:利用对数分布累积专用函数,在Matlab 命令窗口键入: >> p=logncdf(2,1,2)-logncdf(1/2,1,2) p =

0.2404

8.3.4 逆累积概率值

已知分布和分布中的一点,求此点处的概率值要用到累积概率函数cdf ,当已知概率值而需要求对应概率的分布点时,就要用到逆累积概率函数icdf ,icdf 返回某给定概率值下随机变量X 的临界值,实际上就是cdf 的逆函数,在假设检验中经常用到。

即:已知F (x) = P{X ≤x},求x

逆累积概率值的计算有下面两种方法。 8.3.4.1 通用函数icdf

格式:icdf (‘name ’, p, a 1, a 2, a 3)

说明:返回分布为name ,参数为a 1, a 2, a 3累积概率值为p 的临界值,这里name 与前面相同。

如:p = cdf (‘name ’, x, a 1, a 2, a 3) 则:x = icdf (‘name ’, p, a 1, a 2, a 3)

例8-11设X~N (3, 22),确定c ,使得P{X>c} = P{Xc} = P{Xc} = P{X> c=icdf('norm',0.5,3,2) 运行结果为: c = 3

例8-12 在假设检验中,求临界值问题:

已知:05.0=α,查自由度为10的双边界检验t 分布临界值。 解:在Matlab 命令窗口键入: >> t0=icdf('t',0.025,10) 运行结果为: t0 =

-2.2281

8.3.4.2 专用函数-inv

如:norminv (p, mu, sigma) %正态逆累积分布函数,返回临界值。用法与前面类似。 关于常用临界值函数可查表8.3:

例8-13 公共汽车门的高度是按成年男子与车门顶碰头的机会不超过1%设计的。设男子身高X (单位:cm )~ N (175, 36),求车门的最低高度。

解:设h 为车门高度,X 为男子身高,求满足条件P{X>h}≤0.01的h ,即P{X> h=norminv(0.99,175,6) h =

188.9581

例8-14 设二维随机向量(X, Y)的联合密度为

???≥≥=+-其它0

,0),()(y x e y x p y x

求:(1)P{0

解:在Matlab 编辑器中编辑M 文件LX0814.m 如下: syms x y f=exp(-x-y);

p_XY=int(int(f,y,0,1),x,0,1) p_G=int(int(f,y,0,1-x),x,0,1) 运行结果为: p_XY =

exp(-2)-2*exp(-1)+1 p_G =

-2*exp(-1)+1

8.4 数字特征

随机变量的数字特征是概率统计学的重要内容。在对随机变量的研究中,如果对随机变量的分布不需要作全面的了解,那么只需要知道它在某一方面的特征就够了。这些特征的数就是随机变量的数字特征。

8.4.1 随机变量的期望

期望是随机变量的所有可能取值乘以相应的概率值之和,即 ∑∞

==1k k k p x EX

其中k p 是对应于k x 的概率,即权重。

n

p k 1

=

是常用的情况:给定一组样本值x = [x 1, x 2, …, x n ] ∑∞

==1

1k k x n EX

此时,期望称为样本均值。

8.4.1.1 离散型随机变量X 的期望计算

1. 函数:sum %求和 格式:sum (X)

说明:若X 为向量,则sum (X)为X 中的各元素之和,返回一个数值; 若X 为矩阵,则sum (X)为X 中各列元素之和,返回一个行向量。 2. 函数:mean 格式:mean (X)

说明:若X 为向量,则mean (X)为X 中的各元素的算术平均值,返回一个数值; 若X 为矩阵,则mean (X)为X 中各列元素的算术平均值,返回一个行向量。 例

求EX ,解:在Matlab 编辑器中建立M 文件LX0815.m : X=[-2 -1 0 1 2];

p=[0.3 0.1 0.2 0.1 0.3]; EX=sum(X*p') Y=X.^2-1; EY=sum(Y*p') 运行结果为: EX = 0 EY =

1.6000 或

X=[-2 -1 0 1 2];

p=[0.3 0.1 0.2 0.1 0.3]; EX=sum(X.*p) Y=X.^2-1; EY=sum(Y.*p) EX = 0 EY =

1.6000

例8-16 随机抽取6个滚珠测得直径如下:(单位:mm ) 14.70 15.21 14.90 14.91 15.32 15.32 试求样本均值。

解:在Matlab 命令窗口键入:

>> X=[14.70 15.21 14.90 14.91 15.32 15.32]; >> mean(X) ans =

15.0600

8.4.1.2 连续型随机变量的期望

若随机变量X 的概率密度为p (x),则X 的期望为:

?

∞+∞

-=dx x xp EX )(

若下式右端积分绝对收敛,则X 的函数f (X)的期望为: ?

∞+∞

-=dx x p x f X Ef )()()(

例8-17 已知随机变量X 的概率密度

???<<=其它0

1

03)(2x x x p

求EX 和E (4X-1)。

解:在Matlab 编辑器中建立M 文件LX0817.m : syms x p_x=3*x^2;

EX=int(x*p_x,0,1)

EY=int((4*x-1)*p_x,0,1) 运行结果为: EX = 3/4 EY = 2

例8-18 设随机变量X 的概率密度为

∞<<∞-=-x e x p x ,2

1

)(||

求EX 。

解:在Matlab 编辑器中建立M 文件LX0818.m : syms x

p_x=1/2*exp(-abs(x)); EX=int(x*p_x,-inf,inf) 运行结果为: EX = 0

8.4.2 方差

方差是随机变量的个别偏差的平方的期望: DX = E (X-EX)2 = EX 2-(EX)2 标准差:DX X =)(σ

对于样本x = [x 1, x 2, …, x n ],有

样本方差:21

2

)(11∑=--=n i i x x n S 样本标准差:21

)(11∑=--=n

i i x x n S 8.4.2.1 离散型随机变量的方差 1. 方差

DX = E (X-EX)2 = EX 2-(EX)2

在Matlab 中用sum 函数计算:

设X 的分布律为P{X = x k } = p k ,k = 1, 2, … 则方差 DX = sum (X - EX).^2.*p

或 DX = sum (X .^2.*p) - (EX).^2 标准差:DX X =)(σ = sqrt (DX) 例

求DX ,解:在Matlab 编辑器中建立M 文件LX0819.m : X=[-2 -1 0 1 2];

p=[0.3 0.1 0.2 0.1 0.3]; EX=sum(X.*p) Y=X.^2-1 EY=sum(Y.*p)

DX=sum(X.^2.*p)-EX.^2 DY=sum(Y.^2.*p)-EY.^2 运行结果为: EX = 0 Y =

3 0 -1 0 3 EY =

1.6000 DX =

2.6000 DY =

3.0400 2. 样本方差

设随机变量X 的样本为x = [x 1, x 2, …, x n ],由于X 取x i 的概率相同且均为1/n ,因此可以用上面的方法计算方差。另一方面,在Matlab 中又有专门的函数var 计算样本方差。

函数:var %计算一组采集数据即样本的方差

格式:var (X) %var (X) = 21

2

)(11∑=--=n i i x x n S ,若X 为向量,则返回向量

的样本方差;若X 为矩阵,则返回矩阵列向量的样本方差构成的行向量。

var (X, 1) %返回向量(矩阵)X 的简单方差(即置前因子为1/n 的方差) var (X, w) %返回向量(矩阵)X 的以w 为权重的方差 函数:std %计算一组采集数据即样本的标准差 格式:std (X) %返回向量(矩阵)X 的样本标准差即:

std (X) = 21

)(11∑=--=n

i i x x n S std (X, 1) %返回向量(矩阵)X 的标准差(置前因子为1/n )

std (X, 0) %与std (X)相同 std (X, flag, dim) %返回向量(矩阵)X 中维数为dim 的标准差值,其中flag=0时,

置前因子为1/(n-1);否则置前因子为1/n 。

例8-20 求下列样本的样本方差和样本标准差,方差和标准差 14.70 15.21 14.90 14.91 15.32 15.32 解:在Matlab 编辑器中建立M 文件LX0820.m : X=[14.70 15.21 14.90 14.90 15.32 15.32]; DX=var(X,1) %方差 sigma=std(X,1) %标准差 DX1=var(X) %样本方差 sigma1=std(X) %样本标准差 运行结果为: DX =

0.0559 sigma = 0.2364 DX1 = 0.0671 sigma1 = 0.2590

8.4.2.2 连续型随机变量的方差

利用 DX = E (X-EX)2 = EX 2-(EX)2 求解。 设X 的概率密度为p (x) 则 ?∞+∞

-=dx x xp EX )(

?∞+∞

--=dx x p EX x DX )()(2

或 22))(()(?

?

∞+∞

-∞+∞

--=dx x xp dx x p x DX

在Matlab 中,视具体情况实现。

例8-21 设X 的密度函数为

??

?

??≥<-=1

||01||11)(2

x x x x p π

求DX ,D (2X+1)。

解:在Matlab 编辑器中建立M 文件LX0821.m : syms x

px=1/(pi*sqrt(1-x^2)); EX=int(x*px,-1,1)

DX=int(x^2*px,-1,1)-EX^2 y=2*x+1;

EY=int(y*px,-1,1)

DY=int(y^2*px,-1,1)-EY^2

运行结果为:

EX =

DX =

1/2

EY =

1

DY =

2

8.4.3 常用分布的期望与方差求法

在统计工具箱中,用‘stat’结尾的函数可以计算给定参数的某种分布的均值和方差。见下表:

例8-22求参数为0.12和0.34的β分布的期望和方差。

解:在Matlab命令窗口键入:

>> [m,v]=betastat(0.12,0.34)

结果为:

m =

0.2609

v =

0.1321

例8-23按规定,某型号的电子元件的使用寿命超过1500小时为一级品,已知一样品20只,一级品率为0.2。问这样品中一级品元件的期望和方差为多少?

解:分析可知此电子元件中一级品元件分布为二项分布,可使用binostat函数求解。在Matlab命令窗口键入:

>> [m,v]=binostat(20,.2)

结果为:

m =

4

v =

3.2000

结果说明一级品元件的期望为4,方差为3.2。

例8-24求参数为8的Poisson分布的期望和方差。

解:

>> [m,v]=poisstat(8) m = 8 v = 8

由此可见Poisson 分布参数λ的值与它的期望和方差是相同的。

8.5 二维随机向量的数字特征

8.5.1 期望

1. 若(X, Y)的联合分布律为

P{X = x i , Y = y j }= p ij i = 1, 2, …; j = 1, 2, … 则Z = f (X, Y)的期望为:

EZ = E f (X, Y) = ∑∑i

j

ij j i p y x f ),(

2. 若(X, Y)的联合密度为p (x, y),则Z = f (X, Y)的期望为: EZ = E f (X, Y) =??∞+∞

-∞

+∞-dxdy y x p y x f ),(),(

3. 若(X, Y)的边缘概率密度为p X (x),p Y (y),则

?

??∞+∞-∞

+∞-∞+∞-==d x d y

y x xp dx x xp EX X ),()( ?

??

+∞

-∞

+∞-∞+∞

-==d x d y

y x yp dy y yp EY Y ),()( ???∞+∞-∞

+∞

-∞+∞--=-=d x d y y x p EX x dx x p EX x DX X ),()()()(22

???

+∞-∞

+∞

-∞+∞

--=-=dxdy y x p EY y dy y p EY y DY Y ),()

()()(2

2

例8-25 设(X, Y)的联合分布为

Z = X -Y 解:在Matlab 编辑器中建立M 文件LX0825.m : X=[-1 2]; Y=[-1 1 2]; for i=1:2 for j=1:3

Z(i,j)=X(i)-Y(j); end

end %该循环计算X -Y 的值Z p=[5/20 2/20 6/20;3/20 3/20 1/20];

EZ=sum(sum(Z.*p)) %将Z 与p 对应相乘相加 运行结果为: EZ =

-0.5000

例8-26 射击试验中,在靶平面建立以靶心为原点的直角坐标系,设X 、Y 分别为弹着点的横坐标和纵坐标,它们相互独立且均服从N (0, 1),求弹着点到靶心距离的均值。

解:弹着点到靶心的距离为22Y X Z +=,求EZ

其联合分布密度为

+∞<<∞-+∞<<∞-=+-y x e y x p y x ,21),()

22(21

π

在Matlab 编辑器中建立M 文件LX0826.m : syms x y r t

pxy=1/(2*pi)*exp(-1/2*(x.^2+y.^2));

EZ=int(int(r*1/(2*pi)*exp(-1/2*r^2)*r,r,0,inf),t,0,2*pi) %利用极坐标计算较简单 运行结果为: EZ =

1/2*2^(1/2)*pi^(1/2)

即 EZ = 2

8.5.2 协方差

对于二维随机向量(X, Y),期望EX 、EY 分别反映X 、Y 各自的均值,而方差DX 、DY 也仅仅反映分量X 、Y 对各自均值的离散程度。因此还需要研究X 与Y 之间相互联系的程度。协方差是体现这一程度的一个很重要的概念。

设(X, Y)是一个二维随机向量,若E[(X -EX)(Y -EY)]存在,则称之为X ,Y 的协方差,记为cov (X, Y)或XY σ。

即:cov (X, Y) = E[(X -EX)(Y -EY)] = E (XY)-EX*EY 特别地:cov (X, X) = E[(X -EX)2] = EX 2 - (EX)2 cov (Y , Y) = E[(Y -EY)2] = EY 2 - (EY)2 Matlab 提供了求样本协方差的函数:

cov (X) %X 为向量时,返回此向量的方差;X 为矩阵时,返回此矩阵的协方差矩

阵,此协方差矩阵对角线元素为X 矩阵的列向量的方差值。

cov (X, Y) %返回X 与Y 的协方差,且X 与Y 同维。

cov (X, 0) %返回X 的样本协方差,置前因子为1/(n-1)与cov (X)相同。 cov (X, 1) %返回X 的协方差,置前因子为1/n 。 cov (X, Y)与cov (X, Y , 1)的区别同上。

说明:用命令函数cov 时,X ,Y 分别为样本点。 例8-27 设(X, Y)的联合密度为

?????≤≤≤≤+=其它0

2

0,20)(81

),(y x y x y x p

求DX ,DY 和cov (X, Y)。

解:???∞+∞-∞

+∞-∞+∞-==dxdy y x xp dx x xp EX X ),()(

?

??

+∞

-∞

+∞-∞+∞

-==d x d y

y x yp dy y yp EY Y ),()( 在Matlab 编辑器中建立M 文件LX0827.m :

syms x y

pxy=1/8*(x+y);

EX=int(int(x*pxy,y,0,2),0,2) EY=int(int(y*pxy,x,0,2),0,2) EXX=int(int(x^2*pxy,y,0,2),0,2) EYY=int(int(y^2*pxy,x,0,2),0,2) EXY=int(int(x*y*pxy,x,0,2),0,2) DX=EXX-EX^2 DY=EYY-EY^2 DXY=EXY-EX*EY 运行结果为: EX = 7/6

EY = 7/6 EXX = 5/3 EYY = 5/3 EXY = 4/3 DX = 11/36 DY = 11/36 DXY = -1/36

例8-28 求向量a = [1 2 1 2 2 1]的协方差。 解:在Matlab 命令窗口键入: >> a=[1 2 1 2 2 1]; >> cov(a) ans =

0.3000

例8-29 求矩阵的协方差。 解:在Matlab 窗口键入: >> d=rand(2,6) d =

0.9218 0.1763 0.9355 0.4103 0.0579 0.8132 0.7382 0.4057 0.9169 0.8936 0.3529 0.0099 >> cov1=cov(d) cov1 =

0.0169 -0.0211 0.0017 -0.0444 -0.0271 0.0737 -0.0211 0.0263 -0.0021 0.0555 0.0338 -0.0922 0.0017 -0.0021 0.0002 -0.0045 -0.0027 0.0075 -0.0444 0.0555 -0.0045 0.1168 0.0713 -0.1942 -0.0271 0.0338 -0.0027 0.0713 0.0435 -0.1185 0.0737 -0.0922 0.0075 -0.1942 -0.1185 0.3226

8.5.3 相关系数

相关系数是体现随机变量X 和Y 相互联系程度的度量。 设(X, Y)的协方差为cov (X, Y),且DX>0,DY>0,则称YY

XX XY σσσ即

DY

DX Y X ),(cov 为

X 与Y 的相关系数,记为XY ρ。

当XY ρ= 0时,称X 与Y 不相关。

Matlab 提供了求样本相关系数的函数。

corrcoef (X,Y) %返回列向量X ,Y 的相关系数。

corrceof (X) %返回矩阵X 的列向量的相关系数矩阵。 例8-30 设(X, Y)的联合分布律为

求X 与Y XY XY 解:在Matlab 编辑器中建立M 文件LX0830.m :

format rat %有理格式输出 X=[-1 2]; Y=[-1 1 2];

PXY=[5/20 2/20 6/20;3/20 3/20 1/20]; %X 、Y 的联合分布 PX=sum(PXY') %X 的边缘分布 PY=sum(PXY) %Y 的边缘分布 EX=sum(X.*PX) %X 的期望 EY=sum(Y.*PY)

EXX=sum(X.^2.*PX) %计算EX 2 EYY=sum(Y.^2.*PY)

DX=EXX-EX^2 %X 的方差 DY=EYY-EY^2

XY=[1 -1 -2;-2 2 4]; %XY 的取值 EXY=sum(sum(XY .*PXY))

DXY=EXY-EX*EY %X 与Y 的协方差 ro_XY=DXY/sqrt(DX*DY) %X 与Y 的相关系数 运行结果为: PX =

13/20 7/20 PY =

2/5 1/4 7/20 EX =

1/20 EY =

11/20 EXX =

41/20 EYY =

41/20 DX =

819/400 DY =

699/400 EXY =

-1/4 DXY =

-111/400 ro_XY =

-365/2488

即:XY σ= -111/400,XY ρ= -365/2488

例8-31 设(X, Y)在单位圆G={(x,y)|x 2+y 2≤1}上服从均匀分布,即有联合密度

???

??>+≤+=10

11

),(2222y x y x y x p π

求XX σ,XY σ,YY σ,XY ρ。

Matlab 概率论与数理统计

Matlab 概率论与数理统计一、m atlab基本操作 1.画图 hold off; x=0:0.1:2*pi; y=sin(x); plot(x,y,'-r'); x1=0:0.1:pi/2; y1=sin(x1); hold on; fill([x1, pi/2],[y1,1/2],'b'); hold off; x=[0,60];y0=[0,0];y60=[60,60]; x1=[0,30];y1=x1+30; x2=[30,60];y2=x2-30; xv=[0 0 30 60 60 30 0];yv=[0 30 60 60 30 0 0]; fill(xv,yv,'b'); hold on; plot(x,y0,'r',y0,x,'r',x,y60,'r',y60,x,'r'); plot(x1,y1,'r',x2,y2,'r'); yr=unifrnd (0,60,2,100); plot(yr(1,:),yr(2,:),'m.') axis('on'); axis('square'); axis([-20 80 -20 80 ]);

2. 排列组合 C=nchoosek(n,k):k n C C =,例nchoosek(5,2)=10, nchoosek(6,3)=20. prod(n1:n2):从n1到n2的连乘 【例01.03】至少有两个人生日相同的概率 公式计算n n n n N N n N N N N n N N N C n p )1()1(1)! (! 1!1+--?-=--=- = 365364 (3651)365364 3651 11365365365365 rs rs rs ?-+-+=- =-? rs=[20,25,30,35,40,45,50]; %每班的人数 p1=ones(1,length(rs)); p2=ones(1,length(rs)); % 用连乘公式计算 for i=1:length(rs) p1(i)=prod(365-rs(i)+1:365)/365^rs(i); end % 用公式计算(改进) for i=1:length(rs) for k=365-rs(i)+1:365 p2(i)=p2(i)*(k/365); end ; end % 用公式计算(取对数)

Matlab概率统计工具箱(3)

Matlab概率统计工具箱(3) 4.8 假设检验 4.8.1 已知,单个正态总体的均值μ的假设检验(U检验法) 函数ztest 格式h = ztest(x,m,sigma) % x为正态总体的样本,m为均值μ0,sigma为标准差,显著性水平为0.05(默认值) h = ztest(x,m,sigma,alpha) %显著性水平为alpha [h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail) %sig为观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间,zval为统计量的值. 说明若h=0,表示在显著性水平alpha下,不能拒绝原假设; 若h=1,表示在显著性水平alpha下,可以拒绝原假设. 原假设:, 若tail=0,表示备择假设:(默认,双边检验); tail=1,表示备择假设:(单边检验); tail=-1,表示备择假设:(单边检验). 例4-74 某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015.某日开工后检验包装机是否正常,随机地抽取所包装的糖9袋,称得净重为(公斤)

0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512 问机器是否正常 解:总体μ和σ已知,该问题是当为已知时,在水平下,根据样本值判断μ=0.5还是.为此提出假设: 原假设: 备择假设: >> X=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512 ]; >> [h,sig,ci,zval]=ztest(X,0.5,0.015,0.05,0) 结果显示为 h = 1 sig = 0.0248 %样本观察值的概率 ci = 0.5014 0.5210 %置信区间,均值0.5在此区间之外 zval = 2.2444 %统计量的值 结果表明:h=1,说明在水平下,可拒绝原假设,即认为包装机工作不正常.

概率特性仿真实验与程序-Matlab仿真-随机数生成-负指数分布-k阶爱尔兰分布-超指数分布

概率特性仿真实验与程序-Matlab 仿真-随机数生成-负指数分布-k 阶 爱尔兰分布-超指数分布 使用Java 中的SecureRandom .nextDouble()生成一个0~1之间的随机浮点数,然后使用反函数法生成一个符合指数分布的随机变量(反函数求得为λ) 1ln(R x --=)。指数分布的 参数λ为getExpRandomValue 函数中的参数lambda 。生成一个指数分布的随机变量的代码如下,后面都将基于该函数生成一组负指数分布、K 阶爱尔兰分布、2阶超指数分布随机变量,然后将生成的随机数通过matlab 程序进行仿真,对随机数的分布特性进行验证。 生成一组参数为lambda (λ)的负指数分布的随机变量 通过下面的函数生成一组λ参数为lambda 的随机变量,其中size 表示随机变量的个数。通过该函数生成之后,可以将这些随机值保存在文件中,以备分析和验证,比如保存在exp.txt 文件中,供下面介绍的matlab 程序分析。 通过genExp (1000000, 0.2)生成1000000个参数为0.2的随机变量,然后保存到exp.txt 中,然后使用下面的matlab 程序对这些随机数的性质进行验证,如果这些随机数符合λ=0.2的负指数分布,则其均值应为1/λ,即1/0.2=5,其方差应为1/λ2=1/(0.2*0.2)=25。然后对这些随机数的概率分布进行统计分析,以长度为1的区间为统计单位,统计各区间内随机数出现的频数,求出在各区间的概率,绘制图形,与参数为λ的真实负指数分布曲线进行对比。下图为matlab 代码

如下图所示,均值为4.996423,约等于5,方差为24.96761,约等于25,与实际情况相符。此外,通过matlab统计的概率密度函数曲线与真实曲线基本重合(其中在0-1之间没有重合的原因是,实际情况是在0-1之间有无数个点,而matlab统计时以1为一个区间进行统计,只生成了一个统计项,而这无数个点的概率全部加到1点处,因此两条线没有重合,而且1点处的值远大于实际值,如果统计单位划分越细,0-1之间的拟合度更高),表明生成的随机数符合负指数分布。

Matlab 概率论与数理统计

Matlab 概率论与数理统计一、matlab基本操作 1.画图 【例01.01】简单画图 【例01.02】填充,二维均匀随机数 hold off; x=[0,60];y0=[0,0];y60=[60,60]; x1=[0,30];y1=x1+30;

2. 排列组合 C=nchoosek(n,k):k n C C =,例nchoosek(5,2)=10, nchoosek(6,3)=20. prod(n1:n2):从n1到n2的连乘 【例01.03】至少有两个人生日相同的概率 公式计算n n n n N N n N N N N n N N N C n p )1()1(1)! (! 1!1+--?-=--=- = 365364(3651)3653643651 11365365365365 rs rs rs ?-+-+=- =-?

二、随机数的生成 3.均匀分布随机数 rand(m,n); 产生m行n列的(0,1)均匀分布的随机数rand(n); 产生n行n列的(0,1)均匀分布的随机数 【练习】生成(a,b)上的均匀分布 4.正态分布随机数 randn(m,n); 产生m行n列的标准正态分布的随机数【练习】生成N(nu,sigma.^2)上的正态分布 5.其它分布随机数

三、一维随机变量的概率分布 1. 离散型随机变量的分布率 (1) 0-1分布 (2) 均匀分布 (3) 二项分布:binopdf(x,n,p),若~(,)X B n p ,则{}(1)k k n k n P X k C p p -==-, ‘当n 较大时二项分布近似为正态分布 x=0:100;n=100;p=0.3; y= binopdf(x,n,p); plot(x,y,'b-',x,y,'r*')

matlab在统计数据的描述性分析的应用

统计数据的描述性分析 一、实验目的 熟悉在matlab中实现数据的统计描述方法,掌握基本统计命令:样本均值、样本中位数、样本标准差、样本方差、概率密度函数pdf、概率分布函数df、随机数生成rnd。 二、实验内容 1 、频数表和直方图 数据输入,将你班的任意科目考试成绩输入 >> data=[91 78 90 88 76 81 77 74]; >> [N,X]=hist(data,5) N = 3 1 1 0 3 X = 75.7000 79.1000 82.5000 85.9000 89.3000 >> hist(data,5)

2、基本统计量 1) 样本均值 语法: m=mean(x) 若x 为向量,返回结果m是x 中元素的均值; 若x 为矩阵,返回结果m是行向量,它包含x 每列数据的均值。 2) 样本中位数 语法: m=median(x) 若x 为向量,返回结果m是x 中元素的中位数; 若x 为矩阵,返回结果m是行向量,它包含x 每列数据的中位数3) 样本标准差 语法:y=std(x) 若x 为向量,返回结果y 是x 中元素的标准差; 若x 为矩阵,返回结果y 是行向量,它包含x 每列数据的标准差

std(x)运用n-1 进行标准化处理,n是样本的个数。 4) 样本方差 语法:y=var(x); y=var(x,1) 若x 为向量,返回结果y 是x 中元素的方差; 若x 为矩阵,返回结果y 是行向量,它包含x 每列数据的方差 var(x)运用n-1 进行标准化处理(满足无偏估计的要求),n 是样本的个数。var(x,1)运用n 进行标准化处理,生成关于样本均值的二阶矩。 5) 样本的极差(最大之和最小值之差) 语法:z= range(x) 返回结果z是数组x 的极差。 6) 样本的偏度 语法:s=skewness(x) 说明:偏度反映分布的对称性,s>0 称为右偏态,此时数据位于均值右边的比左边的多;s<0,情况相反;s 接近0 则可认为分布是对称的。 7) 样本的峰度 语法:k= kurtosis(x) 说明:正态分布峰度是3,若k 比3 大得多,表示分布有沉重的尾巴,即样本中含有较多远离均值的数据,峰度可以作衡量偏离正态分布的尺度之一。 >> mean(data) ,

MATLAB计算概率

一、实验名称 已知随机向量(X ,Y )独立同服从标准正态分布,D={(x,y)|a0&&e<6 if e==1

p=erchong(a,b,c,d) end if e==2 p=wangge(a,b,c,d); end if e==3 p=fenbu(a,b,c,d); end if e==4 p=mente(a,b,c,d); end if e==5 [X,Y]=meshgrid(-3:0.2:3); Z=1/(2*pi)*exp(-1/2*(X.^2+Y.^2)); meshz(X,Y,Z); end e=input('请选择: \n'); end % ===============================用二重积分计算function p=erchong(a,b,c,d) syms x y; f0=1/(2*pi)*exp(-1/2*(x^2+y^2)); f1=int(f0,x,a,b); %对x积分 f1=int(f1,y,c,d); %对y积分 p=vpa(f1,9); % ================================等距网格法function p=wangge(a,b,c,d) syms x y ; n=100; r1=(b-a)/n; %求步长 r2=(d-c)/n; za(1)=a;for i=1:n,za(i+1)=za(i)+r1;end %分块 zc(1)=c;for j=1:n,zc(j+1)=zc(j)+r2;end for i=1:n x(i)=unifrnd(za(i),za(i+1));end %随机取点 for i=1:n y(i)=unifrnd(zc(i),zc(i+1));end s=0; for i=1:n for j=1:n s=1/(2*pi)*exp(-1/2*(x(i)^2+y(j)^2))+s;%求和end end p=s*r1*r2;

(完整版)Matlab概率论与数理统计

Matlab 概率论与数理统计 、matlab 基本操作 1. 画图 【例01.01】简单画图 hold off; x=0:0.1:2*pi; y=sin (x); plot(x,y, '-r'); x1=0:0.1:pi/2; y1=s in( x1); hold on; fill([x1, pi/2],[y1,1/2], 'b'); 【例01.02】填充,二维均匀随机数 hold off ; x=[0,60];y0=[0,0];y60=[60,60]; x1=[0,30];y1=x1+30; x2=[30,60];y2=x2-30; plot(x,y0, 'r' ,y0,x, plot(x1,y1, 'r' ,x2,y2, yr=u nifrnd (0,60,2,100); plot(yr(1,:),yr(2,:), axis( 'on'); axis( 'square' ); axis([-20 80 -20 80 ]); xv=[0 0 30 60 60 30 0];yv=[0 30 60 60 30 0 0]; fill(xv,yv, 'b'); hold on ; 'r' ,x,y60, 'r' ,y60,x, 'r') 'r'); 'm.')

2. 排列组合 k C=nchoosek(n,k) : C C n ,例 nchoosek(5,2)=10, nchoosek(6,3)=20. prod(n1:n2):从 n1 至U n2 的连乘 【例01.03】至少有两个人生日相同的概率 365 364|||(365 rs 1) rs 365 365 364 365 rs 1 365 365 365 rs=[20,25,30,35,40,45,50]; %每班的人数 p1= on es(1,le ngth(rs)); p2=on es(1,le ngth(rs)); %用连乘公式计算 for i=1:le ngth(rs) p1(i)=prod(365-rs(i)+1:365)/365A rs(i); end %用公式计算(改进) for i=1:le ngth(rs) for k=365-rs(i)+1:365 p2(i)=p2(i)*(k/365); end ; end %用公式计算(取对数) for i=1:le ngth(rs) p1(i)=exp(sum(log(365-rs(i)+1:365))-rs(i)*log(365)); end 公式计算P 1 n!C N N n N! 1 (N n)! 1 N n N (N 1) (N n 1)

概率统计计算及MATLAB实现.doc

《概率统计计算及其MATLAB实现》共分为六章和一个附录,前两章主要介绍概率论和随机变量的基本知识,第三章至第五章是数理统计内容,第六章是随机过程计算及其仿真,最后,附录部分对MATLAB的基本知识进行了简介。主要内容涉及概率及其计算、变量分布及其相关计算、数字特征和中心极限定理、描述统计、参数估计和假设检验、方差分析和回归分析、泊松过程、马氏链、布朗运动、风险模型等的计算和模拟。另外还涉及MATLAB矩阵的运算和操作、微积分运算、代数方程(组)求解、画图和程序流程控制等内容。 目录 1 概率计算及变量分布 1.1 概率定义及其计算 1.2 随机变量及其分布 1.3 随机变量函数及其分布 1.4有关古典概率实际问题的MATLAB模拟 习题1 2常见分布及数字特征 2.1 常见的离散型分布 2.2 常见的连续型分布 2.3 随机变量的数字特征 2.4 有关常见分布的MATLAB模拟 习题2 3样本描述及抽样分布 3.1 数据的整理和显示 3.2 数据预处理及其他描述分析 3.3抽样分布 习题3 4参数估计与假设检验 4.1 参数估计 4.2正态总体参数的假设检验 4.3 其他常用的假设检验 4.4几个常用的非参数假设检验 习题4 5方差分析与回归分析 5.1 单因素方差分析 5.2 双因素方差分析 5.3 线性回归分析 5.4 逐步回归与其他几个回归 习题5

6随机过程计算与仿真 6.1 随机过程的基本概念 6.2 泊松过程的计算与仿真6.3 马氏链的计算与仿真 6.4布朗运动计算与仿真 6.5 风险模型的计算与仿真习题6 附录MATLAB简介 1 矩阵与相关运算 2微积分与代数方程基本求解3 画图与编程

Matlab笔记——数值计算—概率篇017

17. 数值计算—概率篇 一、计算组合数、排列数 !n——factorial(n)或prod(1:n) k C——nchoosek(n,k) n k A——factorial(n)/factorial(n-k) n 二、生成随机数 1. rand(m,n) ——生成m×n的服从[0,1]上均匀分布的随机数; 用a + (b-a).*rand(m,n)生成m×n的服从[a,b]上均匀分布的随机数。 2. 二项分布与正态分布随机数 binornd(N,P,m,n)——生成m×n的服从二项分布B(N,P)的随机数; normrnd(MU,SIGMA,m,n) ——生成m×n的服从正态分布N(MU,SIGMA2)的随机数; 3. 通用格式: 分布缩写+rnd(分布参数, m,n) 或random(‘分布名或缩写’, 分布参数, m,n) 可以用来生成m×n该分布的随机数。各种分布名见下图:

4. 使用randsample和randsrc函数生成指定离散分布随机数 X=randsample(N, k, replace, w)

N相当于[1:N], 也可以是具有确定值的向量;k表示生成k个随机数;replace=’true’表示可重复,或’false’表示不可重复(默认);w是权重向量。 X= randsrc(m,n,[x; p]) 生成m×n的随机矩阵,服从取值为向量x, 对应概率为向量p的离散分布。 例1 设离散型随机变量X服从如下分布: 生成服从3×5的该分布的随机数。 代码: xvalue = [-2 -1 0 1 2]; xp = [0.05 0.2 0.5 0.2 0.05]; % 调用randsample函数生成100个服从指定离散分布的随机数 x = randsample(xvalue, 15, true, xp); reshape(x,[3 5]) % 调用randsrc函数生成10*10的服从指定离散分布的随机数矩阵 y = randsrc(3,5,[xvalue;xp]) 运行结果:ans = 0 0 1 0 0 0 0 0 -1 -1 1 1 0 0 1 y = -1 -1 1 1 -1 -1 0 0 2 0 -1 0 -1 0 0

概率部分MATLAB实验一(随机变量)

概率部分MATLAB实验一 (随机变量及其分布) 一、实验学时 2学时 二、实验目的 1、掌握随机数的产生与操作命令 2、掌握计算概率的命令 3、掌握离散型与连续型随机变量有关的操作命令 4、理解随机变量的分布 三、实验准备 1、复习随机变量及分布函数的概念 2、复习离散型随机变量及其分布律和分布函数 3、复习连续型随机变量及其概率密度函数和分布函数 四、实验内容 1、常见离散型随机变量分布的计算及图形演示 (1)0-1分布、二项分布、泊松分布概率的计算; (2)0-1分布、二项分布、泊松分布的分布函数的计算;2、常见连续型随机变量分布的计算及图形演示 (1)均匀分布、指数分布、正态分布概率密度函数的计算;(2)均匀分布、指数分布、正态分布的分布函数的计算; 3、求单个随机变量落在某个区间内的概率 4、求一个随机变量的函数的分布的计算

五、软件命令 MATLAB随机变量命令

六、实验示例 (一)关于概率密度函数(或分布律)的计算 1、一个质量检验员每天检验500个零件。如果1%的零件有缺陷,一天内检验员没有发现有缺陷零件的概率是多少?检验员发现有缺陷零件的数量最有可能是多少? 【理论推导】设X 表示检验员每天发现有缺陷零件的数量,X 服从二项分布B(500,0.01)。 (1)50050000 500 99.0)01.01(01.0)0(=-==C X P (2)500*1%=5 【计算机实现的命令及功能说明】 利用二项分布的概率密度函数binopdf()计算 格式:Y=binopdf(X,N,P) 说明:(1)根据相应的参数N,P 计算X 中每个值的二项分布概率密度。

matlab概率统计函数

matlab概率统计函数 函数名对应分布的概率密度函数 betapdf 贝塔分布的概率密度函数binopdf 二项分布的概率密度函数 chi2pdf 卡方分布的概率密度函数 exppdf 指数分布的概率密度函数 fpdf f分布的概率密度函数 gampdf 伽玛分布的概率密度函数 geopdf 几何分布的概率密度函数hygepdf 超几何分布的概率密度函数normpdf 正态(高斯)分布的概率密度函数lognpdf 对数正态分布的概率密度函数nbinpdf 负二项分布的概率密度函数ncfpdf 非中心f分布的概率密度函数nctpdf 非中心t分布的概率密度函数 ncx2pdf 非中心卡方分布的概率密度函数poisspdf 泊松分布的概率密度函数raylpdf 雷利分布的概率密度函数 tpdf 学生氏t分布的概率密度函数unidpdf 离散均匀分布的概率密度函数unifpdf 连续均匀分布的概率密度函数weibpdf 威布尔分布的概率密度函数 表Ⅰ-2 累加分布函数 函数名对应分布的累加函数 betacdf 贝塔分布的累加函数 binocdf 二项分布的累加函数 chi2cdf 卡方分布的累加函数 expcdf 指数分布的累加函数 fcdf f分布的累加函数 gamcdf 伽玛分布的累加函数 geocdf 几何分布的累加函数 hygecdf 超几何分布的累加函数 logncdf 对数正态分布的累加函数 nbincdf 负二项分布的累加函数 ncfcdf 非中心f分布的累加函数 nctcdf 非中心t分布的累加函数 ncx2cdf 非中心卡方分布的累加函数normcdf 正态(高斯)分布的累加函数poisscdf 泊松分布的累加函数 raylcdf 雷利分布的累加函数 tcdf 学生氏t分布的累加函数

基于MATLAB的概率统计数值实验

基于MATLAB的概率统计数值实验 三、数理统计 1. Matlab统计工具箱中常见的统计命令 2. 直方图和箱线图实验 3. 抽样分布实验 4. 参数估计和假设检验实验 1

Matlab统计工具箱中常见的统计命令 1、基本统计量 对于随机变量x,计算其基本统计量的命令如下: ●均值:mean(x) 标准差:std(x) ●中位数:median(x) 方差:var(x) ●偏度:skewness(x) 峰度:kurtosis(x) 2、频数直方图的描绘 ●A、给出数组data的频数表的命令为:[N,X]=hist(data,k) ●此命令将区间[min(data),max(data)]分为k个小区间(缺省为10),返回数组 data落在每一个小区间的频数N和每一个小区间的中点X。 ●B、描绘数组data的频数直方图的命令为:hist(data,k) 2

3、参数估计 ●A、对于正态总体,点估计和区间估计可同时由以下命令获得: ●[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha) ●此命令在显著性水平alpha下估计x的参数(alpha缺省值为5%),返回值 muhat是均值的点估计值,sigmahat是标准差的点估计值,muci是均值的区 间估计,sigmaci是标准差的区间估计。 ●B、对其他分布总体,两种处理办法:一是取容量充分大的样本,按中 心极限定理,它近似服从正态分布,仍可用上面估计公式计算;二是使用特定分布总体的估计命令,常用的命令如: ●[muhat,muci]=expfit(x,alpha) ●[lambdahat, lambdaci]=poissfit(x,alpha) ●[phat, pci]=weibfit(x,alpha)3

Matlab概率函数大全

Matlab概率函数大全 统计工具箱函数 表Ⅰ-1 概率密度函数 函数名对应分布的概率密度函数 betapdf 贝塔分布的概率密度函数binopdf 二项分布的概率密度函数 chi2pdf 卡方分布的概率密度函数 exppdf 指数分布的概率密度函数 fpdf f分布的概率密度函数 gampdf 伽玛分布的概率密度函数 geopdf 几何分布的概率密度函数hygepdf 超几何分布的概率密度函数normpdf 正态(高斯)分布的概率密度函数lognpdf 对数正态分布的概率密度函数nbinpdf 负二项分布的概率密度函数ncfpdf 非中心f分布的概率密度函数nctpdf 非中心t分布的概率密度函数 ncx2pdf 非中心卡方分布的概率密度函数poisspdf 泊松分布的概率密度函数raylpdf 雷利分布的概率密度函数 tpdf 学生氏t分布的概率密度函数unidpdf 离散均匀分布的概率密度函数unifpdf 连续均匀分布的概率密度函数weibpdf 威布尔分布的概率密度函数 表Ⅰ-2 累加分布函数 函数名对应分布的累加函数 betacdf 贝塔分布的累加函数 binocdf 二项分布的累加函数 chi2cdf 卡方分布的累加函数 expcdf 指数分布的累加函数 fcdf f分布的累加函数 gamcdf 伽玛分布的累加函数 geocdf 几何分布的累加函数 hygecdf 超几何分布的累加函数 logncdf 对数正态分布的累加函数 nbincdf 负二项分布的累加函数 ncfcdf 非中心f分布的累加函数 nctcdf 非中心t分布的累加函数 ncx2cdf 非中心卡方分布的累加函数normcdf 正态(高斯)分布的累加函数poisscdf 泊松分布的累加函数 raylcdf 雷利分布的累加函数 tcdf 学生氏t分布的累加函数

概率论matlab实验报告

概率论与数理统计matlab上机 实验报告 班级: 学号: 姓名: 指导老师:

实验一常见分布的概率密度、分布函数生成 [实验目的] 1. 会利用MATLAB软件计算离散型随机变量的概率,连续型随机变量概率密度值。 2.会利用MATLAB软件计算分布函数值,或计算形如事件{X≤x}的概率。 3.会求上α分位点以及分布函数的反函数值。 [实验要求] 1.掌握常见分布的分布律和概率密度的产生命令,如binopdf,normpdf 2. 掌握常见分布的分布函数命令,如binocdf,normcdf 3. 掌握常见分布的分布函数反函数命令,如binoinv,norminv [实验内容] 常见分布的概率密度、分布函数生成,自设参数 1、X~B(20,0.4) (1)P{恰好发生8次}=P{X=8} (2)P{至多发生8次}=P{X<=8} (1)binopdf(8,20,0.4) ans = 0.1797 (2)binocdf(8,20,0.4) ans = 0.5956 2、X~P(2) 求P{X=4} poisspdf(4,2) ans = 0.0902 3、X~U[3,8] (1)X=5的概率密度 (2)P{X<=6}

(1)unifpdf(5,3,8) ans = 0.2000 (2)unifcdf(6,3,8) ans = 0.6000 4、X~exp(3) (1)X=0,1,2,3,4,5,6,7,8时的概率密度 (2)P{X<=8} 注意:exp(3)与教材中参数不同,倒数关系(1)exppdf(0:8,3) ans = Columns 1 through 3 0.3333 0.2388 0.1711 Columns 4 through 6 0.1226 0.0879 0.0630 Columns 7 through 9 0.0451 0.0323 0.0232 (2)expcdf(8,3) ans = 0.9305 5、X~N(8,9) (1)X=3,4,5,6,7,8,9时的概率密度值

MATLAB概率习题

数学实验(概率论)题目一.用MATLAB 计算随机变量的分布 1.用MA TLAB 计算二项分布 在一级品率为0.2的大批产品中,随机地抽取20个产品,求其中有2个一级品的概率。 1. 用MA TLAB 计算泊松分布 用MATLAB 计算:保险公司售出某种寿险保单2500份.已知此项寿险每单需交保费120元,当被保人一年内死亡时,其家属可以从保险公司获得2万元的赔偿(即保额为2万元).若此类被保人一年内死亡的概率0.002,试求: (1)保险公司的此项寿险亏损的概率; (2)保险公司从此项寿险获利不少于10万元的概率; (3)获利不少于20万元的概率. 3.用MA TLAB 计算均匀分布 乘客到车站候车时间ξ ()0,6U ,计算()13P ξ<≤。 4.用MA TLAB 计算指数分布 用MA TLAB 计算:某元件寿命ξ服从参数为λ(λ=1 1000-)的指数分布.3个这样的元件使用1000小时后,都没有损坏的概率是多少? 5。用MATLAB 计算正态分布 某厂生产一种设备,其平均寿命为10年,标准差为2年.如该设备的寿命服从正态分布,求寿命不低于9年的设备占整批设备的比例? 二.用MATLAB 计算随机变量的期望和方差 1.用MA TLAB 计算数学期望 (1)用MATLAB 计算离散型随机变量的期望 1)。一批产品中有一、二、三等品、等外品及废品5种,相应的概率分别为0.7、0.1、0.1、0.06及0.04,若其产值分别为6元、5.4元、5元、4元及0元.求产值的平均值 2)。已知随机变量X 的分布列如下:{}k k X p 21 == ,,2,1n k =计算.EX (2)用MATLAB 计算连续型随机变量的数学期望 假定国际市场上对我国某种商品的年需求量是一个随机变量ξ(单位:吨),服从区间[],a b 上的均匀分布,其概率密度为: 1()0 a x b x b a ??≤≤?=-???其它 计算我国该种商品在国际市场上年销售量的期望.ξE . (3)用MATLAB 计算随机变量函数的数学期望 假定国际市场每年对我国某种商品的需求量是随机变量X (单位:吨),服从[20,40]上的均匀分布,已知该商品每售出1吨,可获利3万美元,若销售不出去,则每吨要损失1万美元,如何组织货源,才可使收益最大? 2. 用MA TLAB 计算方差

matlab 概率工具箱

4.5.4 方差 命令求样本方差 函数var 格式D=var(X) %var(X)=,若X为向量,则返回向量的样本方差. D=var(A) %A为矩阵,则D为A的列向量的样本方差构成的行向量. D=var(X, 1) %返回向量(矩阵)X的简单方差(即置前因子为的方差) D=var(X, w) %返回向量(矩阵)X的以w为权重的方差 命令求标准差 函数std 格式std(X) %返回向量(矩阵)X的样本标准差(置前因子为)即: std(X,1) %返回向量(矩阵)X的标准差(置前因子为) std(X, 0) %与std (X)相同 std(X, flag, dim) %返回向量(矩阵)中维数为dim的标准差值,其中flag=0时,置前因子为;否则置前因子为. 例4-41 求下列样本的样本方差和样本标准差,方差和标准差 14.70 15.21 14.90 15.32 15.32 解: >>X=[14.7 15.21 14.9 14.91 15.32 15.32]; >>DX=var(X,1) %方差 DX = 0.0559 >>sigma=std(X,1) %标准差 sigma = 0.2364 >>DX1=var(X) %样本方差 DX1 = 0.0671 >>sigma1=std(X) %样本标准差 sigma1 = 0.2590

命令忽略NaN的标准差 函数nanstd 格式y = nanstd(X) %若X为含有元素NaN的向量,则返回除NaN外的元素的标准差,若X为含元素NaN的矩阵,则返回各列除NaN外的标准差构成的向量. 例4-42 >> M=magic(3) %产生3阶魔方阵 M = 8 1 6 3 5 7 4 9 2 >> M([1 6 8])=[NaN NaN NaN] %替换3阶魔方阵中第1,6,8个元素为NaN M = NaN 1 6 3 5 NaN 4 NaN 2 >> y=nanstd(M) %求忽略NaN的各列向量的标准差 y = 0.7071 2.8284 2.8284 >> X=[1 5]; %忽略NaN的第2列元素 >> y2=std(X) %验证第2列忽略NaN元素的标准差 y2 = 2.8284 命令样本的偏斜度 函数skewness 格式y = skewness(X) %X为向量,返回X的元素的偏斜度;X为矩阵,返回X各列元素的偏斜度构成的行向量. y = skewness(X,flag) %flag=0表示偏斜纠正,flag=1(默认)表示偏斜不纠正. 说明偏斜度样本数据关于均值不对称的一个测度,如果偏斜度为负,说明均值左边的数据比均值右边的数据更散;如果偏斜度为正,说明均值右边的数据比均值左边的数据更散,因而正态分布的偏斜度为0;偏斜度是这样定义的:

相关主题