搜档网
当前位置:搜档网 › 第三讲概率分布

第三讲概率分布

第三讲概率分布
第三讲概率分布

第三讲 概率分布

一、 概率与频率的关系

A 是一个随机事件,进行了n 次随机试验,随机事件A 发生了m 次,则随机事件A 发生的频率为n m f n =,当n →∞时,随机事件A 发生的频率n m f n =趋向一个常数π,这个常数π就是随机事件A 发生的概率。记为P(A)。

二、 下面将借用一个例子介绍连续型随机变量的密度函数及其意义。

例:在某地区7岁正常发育的男孩中随机抽110个人,测量他们的身高,并以身高观察值为数据,作下列直方图,但这种直方图与频数图仅有一处不同:这种直方图的纵坐标=频率/组距,称这种直方图为频率密度图。

为了较清楚地介绍下面两个概念:

1. 概率密度曲线

2. 随机变量落在一个区间的概率=在该区间的概率密度曲线下的面积。

下面将讨论下列情况

目前组距为5cm ,纵坐标=频率/组距,横坐标为身高

●每一块直方条的面积=直方条顶点纵坐标值×组距=频率。

●因为各个组段的频率之和=1,所以这种直方条图的面积为1。

●n越来越大时,每个组段的频率越来越趋向于对应的概率,由此可以得

到:随机抽一个男孩,其身高落在各个组段的概率。

假定:上述各个组段的概率如下:

P(110cm≤身高<115cm)= 0.1532

注意:在这时,组距为5cm,纵坐标=概率/组距,横坐标为身高,所以这个概率就是在110cm≤身高<115cm,对应区间的直方条面积

(因为面积=纵坐标×组距=概率)。

P(身高≥140cm)=0.0003 小概率事件

这个概率等于身高≥140cm所对应区间的直方条面积

P(105cm≤身高<120cm)= 0.0440+0.1532+0.2936=0.4908

这个概率等于105cm≤身高<120cm所对应区间的直方条面积

P(身高<120cm)= 0.0006 +0.0049 +0.0440+0.1532 +0.2936=0.4963

这个概率等于这5个区间直方条的面积。

●由此可知:如果一个区间是由上述若干个组段构成的,则计算

身高落在某个区间的概率=计算这个区间中的各个直方条之和面积。

●但无法由上述信息计算P(106cm≤身高<122cm)等。只能计算上述给定的

区间的概率,不能计算任意区间的概率。

●对于上述直方图,任意的组距而言,计算概率问=计算直方图面积。因

此当组距逐渐减小,上述计算概率的问题对应计算直方条面积的问题仍

然成立。

●当组距趋向于0时,直方条宽度趋向0,直方条趋向垂直的直线,相邻

的直方条顶点用直线连接,构成一条曲线,这条曲线称为概率密度曲线,由于上述计算概率的问题对应计算概率密度曲线下的面积问题。

正态分布曲线

本例的7岁男孩的身高概率密度曲线描述了7岁男童身高的分布(图2.4)。此曲线呈钟型,两头低中间高,左右对称,近似于数学上的正态曲线。

若描述指标X分布的曲线对应于数学上的正态曲线,则称该指标X服从正态分布。

a b c

图2.4 频率分布逐渐接近正态分布示意图

2 正态分布的两个参数

正态概率密度曲线(简称正态曲线)的函数表达式为:

2

2

()

2

()

x

f x e

μ

σ

--

=x

-∞<<∞(2.17)

在此函数式中有4个常数:e为自然对数的底,π为圆周率,除这两个确定的常数外,还有两个不确定的常数μ与σ,它们被称为是正态分布的参数。参数μ是正态总体的均数,它描述了正态分布的集中趋势位置。参数σ是正态总体的标准差,它描述正态分布的离散程度(又称为变异程度),σ越小,分布越集中,σ越大,分布越离散。不同的μ、不同的σ,对应于不同的正态分布(图2.5)。

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0123456

图2.5 不同均数μ、不同标准差σ的正态分布示意图

图2.5中的正态曲线1的μ=2.4,σ=0.8;

正态曲线2的μ=3.4,σ=0.8;

正态曲线3的μ=3.4,σ=1.2。

由上述曲线图可知:曲线1与曲线2的形状相同,但峰的位置不同。

曲线2与曲线3的形状不同,但峰的位置相同。

请想像一下:

● 如果总体均数μ=100并且σ非常小,σ几乎接近0,这个正态分布的图是

如何的?这种资料的特点是怎么样的?

● 如果总体均数μ=100并且σ非常大,这个正态分布的图是如何的?

由于大部分的研究资料都可以认为近似正态分布以及偏态分布的资料在大样本时,其样本均数可以逼近正态分布,所以我们将重点介绍正态分布。

因此可知:

● 正态分布曲线的形状取决于总体标准差σ。σ越大,变量的取值(即数据)的离散程度就越大。

● 正态分布曲线的位置取决于总体均数μ

例如1995年某市7岁男童身高X 服从均数为121.9(cm )、标准差为4.5(cm )的正态分布,可记为)5.4,9.121(~2N X 。

正态分布概率密度曲线特征:

1. 直线X =μ是正态分布的对称轴。

2. 正态曲线下X >μ与X <μ范围的面积相等,意味着正态变量取值X >μ与

X <μ范围的概率相等,均为50%。

3. 靠近X =μ 处曲线下的面积较集中,两边逐渐减少,意味着正态变量取值靠近X =μ 处的概率较大,两边逐渐减少。

4. 对于正态概率密度曲线而言,总体均数μ和总体标准差σ一确定,正态概率密度曲线就唯一确定了。

3正态分布变量的取值规律

随机变量在任意),(21x x 内的取值概率P =该概率密度曲线下在),(21x x 的面积。

● 因此只要知道正态分布的总体均数与总体标准差,就可以计算变量X 落在任意一个区间的概率=该区间的概率密度曲线下的面积。

(因为由总体均数与总体标准差唯一确定概率密度曲线,由概率密度曲线确定曲线下的面积)。

● 特别有用的3个范围及其取值概率(见下图,注意:曲线下的整个面积为1):

1. 在σμ64.1±范围内取值概率约为0.90 (α=0.1)

2. 在σμ96.1±范围内取值概率约为0.95 (α=0.05)

3. 在σμ58.2±范围内取值概率约为0.99 (α=0.01)

设X服从N(μ,σ2),请问:

a)X<μ+1.64σ的概率

b)X>μ+1.64σ的概率

c)X<μ+1.96σ的概率

d)X=μ的概率

(二) 标准正态分布与正态分布的概率计算

1 标准正态分布

如果X服从正态分布,并且总体均数μ=0和σ=1,则称X服从标准的正态分布N(0,1)。标准正态分布的概率计算可以查表或大多数统计软件都提供相应的命令或模块进行计算。

Stata软件计算标准正态分布的左侧累计概率函数为norm(x)=P(X

准化变换,把一般正态分布N(μ,σ2)转换为标准正态分布N(0,1),然后计算或查表,得到对应的概率。

设X~N(μ,σ2),则X

u

μσ-

=服从标准正态分布N(0,1)。应用举例:设X~N(120,62),计算

a)概率P(X<140)

b)概率P(110

c)概率P(X>125) 解:令1206X u -=,X=140代入,得到206

u =,即:X<140 u<3.333

因为概率P(110

X=110和X=132分别代入1206X u -=,对应得到106

u -=和u=2

因为概率P(X>125)=1-P(X<125)

因此X=125分别代入1206X u -=,对应得到56

u =

问题:

1. 如果随机在这个总体中抽一个样本,样本量为6。若这个总体为N(100,42),则请想像一下这个样本中的数据分布是怎样的?

2. 如果某变量的取值,在取对数后称正态分布,则称该变量服从对数正态分布。试问:如何描述这个变量的平均水平比较好?

统计学统计学概率与概率分布练习题

第5章 概率与概率分布 练习题 5.1 写出下列随机事件的基本空间: (1) 抛三枚硬币。 (2) 把两个不同颜色的球分别放入两个格子。 (3) 把两个相同颜色的球分别放入两个格子。 (4) 灯泡的寿命(单位:h )。 (5) 某产品的不合格率(%)。 5.2 假定某布袋中装有红、黄、蓝、绿、黑等5个不同颜色的玻璃球,一次从中取出3个球, 请写出这个随机试验的基本空间。 5.3 试定义下列事件的互补事件: (1) A ={先后投掷两枚硬币,都为反面}。 (2) A ={连续射击两次,都没有命中目标}。 (3) A ={抽查三个产品,至少有一个次品}。 5.4 向两个相邻的军火库发射一枚导弹,如果命中第一个和第二个军火库的概率分别是、, 而且只要命中其中任何一个军火库都会引起另一个军火库的爆炸。试求炸毁这两个军火库的概率有多大。 5.5 已知某产品的合格率是98%,现有一个检查系统,它能以的概率正确的判断出合格品, 而对不合格品进行检查时,有的可能性判断错误(错判为合格品),该检查系统产生错判的概率是多少 5.6 有一男女比例为51:49的人群,已知男人中5%是色盲,女人中%是色盲,现随机抽中 了一个色盲者,求这个人恰好是男性的概率。 根据这些数值,分别计算: (1) 有2到5个(包括2个与5个在内)空调器出现重要缺陷的可能性。 (2) 只有不到2个空调器出现重要缺陷的可能性。 (3) 有超过5个空调器出现重要缺陷的可能性。 5.8 设X 是参数为4=n 和5.0=p 的二项随机变量。求以下概率: (1))2(

5.9 一条食品生产线每8小时一班中出现故障的次数服从平均值为的泊松分布。求: (1) 晚班期间恰好发生两次事故的概率。 (2) 下午班期间发生少于两次事故的概率。 (3) 连续三班无故障的概率。 5.10 假定X 服从12=N ,7=n ,5=M 的超几何分布。求: (1))3(=X P 。(2))2(≤X P 。(3))3(>X P 。 5.11 求标准正态分布的概率: (1))2.10(≤≤Z P 。 (2))49.10(≤≤Z P 。 (3))048.0(≤≤-Z P 。 (4))037.1(≤≤-Z P 。 (5))33.1(>Z P 。 5.12 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据(单位:L )如下: 试判断该种汽车的耗油量是否近似服从正态分布 5.13 设X 是一个参数为n 和p 的二项随机变量,对于下面的四组取值,说明正态分布是否 为二项分布的良好近似 (1)30.0,23==p n 。(2)01.0,3==p n 。 (3)97.0,100==p n 。(4)45.0,15==p n 。

正态概率图(normal probability plot)

正态概率图(normal probability plot) 方法演变:概率图,分位数-分位数图( Q- Q) 概述 正态概率图用于检查一组数据是否服从正态分布。是实数与正态分布数据之间函数关系的散点图。如果这组实数服从正态分布,正态概率图将是一条直线。通常,概率图也可以用于确定一组数据是否服从任一已知分布,如二项分布或泊松分布。 适用场合 ·当你采用的工具或方法需要使用服从正态分布的数据时; ·当有50个或更多的数据点,为了获得更好的结果时。 例如: ·确定一个样本图是否适用于该数据; ·当选择作X和R图的样本容量,以确定样本容量是否足够大到样本均值服从正态分布时;·在计算过程能力指数Cp或者Cpk之前; ·在选择一种只对正态分布有效的假设检验之前。 实施步骤 通常,我们只需简单地把数据输入绘图的软件,就会产生需要的图。下面将详述计算过程,这样就可以知道计算机程序是怎么来编译的了,并且我们也可以自己画简单的图。 1将数据从小到大排列,并从1~n标号。 2计算每个值的分位数。i是序号: 分位数=(i-0.5)/n 3找与每个分位数匹配的正态分布值。把分位数记到正态分布概率表下面的表A.1里面。然后在表的左边和顶部找到对应的z值。 4根据散点图中的每对数据值作图:每列数据值对应个z值。数据值对应于y轴,正态分位数z值对应于x轴。将在平面图上得到n个点。 5画一条拟合大多数点的直线。如果数据严格意义上服从正态分布,点将形或一条直线。将点形成的图形与画的直线相比较,判断数据拟合正态分布的好坏。请参阅注意事项中的典型图

形。可以计算相关系数来判断这条直线和点拟合的好坏。 示例 为了便于下面的计算,我们仅采用20个数据。表5. 12中有按次序排好的20个 值,列上标明“过程数据”。 下一步将计算分位数。如第一个值9,计算如下: 分位数=(i-0.5)/n=(1-0.5)/20=0.5/20=0.025 同理,第2个值,计算如下: 分位数=(i-0.5)/n=(2-0.5)/20=1.5/20=0.075 可以按下面的模式去计算:第3个分位数=2.5÷20,第4个分位数=3 5÷20 以此类推直到最后1个分位数=19. 5÷20。 现在可以在正态分布概率表中查找z值。z的前两 个阿拉伯数字在表的最左边一列,最后1个阿拉伯数 字在表的最顶端一行。如第1个分位数=0. 025,它位 于-1.9在行与0.06所在列的交叉处,故z=-1.96。 用相同的方式找到每个分位数。 如果分位数在表的两个值之间,将需要用插值法 进行求解。例如:第4个分位数为0. 175,它位于0.1736 与0.1762之间。0.1736对应的z值为-0.94,0.1762 对应的z值为-0.93,故 这两数的中间值为z=-0.935。 现在,可以用过程数据和相应的z值作图。图表5. 127显示了结果和穿过这些点的直线。注意:在图形的两端,点位于直线的上侧。这属于典型的右偏态数据。图表5.128显示了数据的直方图,可进行比较。 概率图( probability plot) 该方法可以用于检验任何数据的已知分布。这时我们不是在正态分布概率表中查找分位数,而是在感兴趣的已知分布表中查找它们。 分位数-分位数图(quantile-quantile plot) 同理,任意两个数据集都可以通过比较来判断是否服从同一分布。计算每个分布的分位数。一个数据集对应于x轴,另一个对应于y轴。作一条45°的参照线。如果这两个数据集来自同一分布,那么这些点就会靠近这条参照线。 注意事项 ·绘制正态概率图有很多方法。除了这里给定的程序以外,正态分布还可以用概率和百分数来表示。实际的数据可以先进行标准化或者直接标在x轴上。 ·如果此时这些数据形成一条直线,那么该正态分布的均值就是直线在y轴截距,标准差就是直线斜率。 ·对于正态概率图,图表5.129显示了一些常见的变形图形。 短尾分布:如果尾部比正常的短,则点所形成的图形左边朝直线上方弯曲,右边朝直线下方弯曲——如果倾斜向右看,图形呈S型。表明数据比标准正态分布时候更加集中靠近均值。 长尾分布:如果尾部比正常的长,则点所形成的图形左边朝直线下方弯曲,右边朝直线上方弯曲——如果倾斜向右看,图形呈倒S型。表明数据比标准正态分布时候有更多偏离的数据。

常用概率分布(习题与答案)

第五章 常用概率分布习题(附答案) 一、选择题 1. 估计正常成年女性红细胞计数的95%医学参考值范围时,应用( A. )。 A.)96.1,96.1(s x s x +- B.)96.1,96.1(x x s x s x +- C.)645.1(lg lg x x s x +> D.)645.1(s x +< E.)645.1(lg lg x x s x +< 2. 估计正常成年男性尿汞含量的95%医学参考值范围时,应用(E )。 A.)96.1,96.1(s x s x +- B.)96.1,96.1(x x s x s x +- C.)645.1(lg lg x x s x +> D.)645.1(s x +< E.)645.1(lg lg x x s x +< 3.若某人群某疾病发生的阳性数X 服从二项分布,则从该人群随机抽出n 个人, 阳性数X 不少于k 人的概率为( A )。 A. )()1()(n P k P k P ++++ B. )()2()1(n P k P k P +++++ C. )()1()0(k P P P +++ D. )1()1()0(-+++k P P P E. )()2()1(k P P P +++ 4.Piosson 分布的标准差σ和均数λ的关系是( C )。 A. σλ> B. σλ< C. λ=2σ D. λ=σ E. λ与σ无固定关系 5.用计数器测得某放射性物质5分钟内发出的脉冲数为330个,据此可估计该放射性物质平均每分钟脉冲计数的95%可信区间为( E )。 A. 33096.1330± B. 33058.2330± C. 3396.133± D. 3358.233± E. 5/)33096.1330(± 6.Piosson 分布的方差和均数分别记为2 σ和λ,当满足条件( E )时,Piosson 分布近似正态分布。 A. π接近0或1 B. 2σ较小 C. λ较小 D. π接近0.5 E. 202≥σ 7.二项分布的图形取决于( C )的大小。 A. π B. n C.n 与π D. σ E. μ 8.在参数未知的正态总体中随机抽样,≥-μX ( E )的概率为5%。 A. 1.96σ B. 1.96 C. 2.58 D. S t ν,2/05.0 E. X S t ν,2/05.0 9.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差

第六章-概率分布Word版

第六章概率分布 一、单选题 180,一个随机样本n=16,其均值大于85的概率是()。 A. 2.52% B. 4.78% c. 5.31% D. 6.44% 2.让64位大学生品尝A.、B两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表): () A.2.28% B.4 .01% C.5.21% D. 39.06% 3. 某个单峰分布的众数为15,均值是10,这个分布应该是( ) A.正态分布 B.正偏态分布 C.负偏态分布 D.无法确定 4.一个单项选择有48单侧检验标准,至少应对多少题成绩显著优于单凭猜测()。 A.16题 B.17题 C.18题 D.19题 5. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z值等于() A.4.05 B.2.31 C.1.33 D. 2.02 6. 某班200人的考试成绩呈正态分布,其平均数=l2,S=4分,成绩在8分和16分之间的人数占全部人数的()。 A.34.13% B.68.26% C.90% D. 95% 7. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-M)/S这个公式中X应为() A.12 B.10 C.9.5 D. 10.5 8. 在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值?() A.N<10 B.N>=10 C.N>30 D. N>10 9. t分布是平均数的对称的分布,当样本n趋于∞时,t分布为() A. 二项分布 B. 正态分布 C. F分布 10. 概率和统计学中,把随机事件发生的可能性大小称作随机事件发生的() A.概率 B.频率 C.频数 D. 相对频数 11. 在一次实验中,若事件B的发生不受事件A的影响,则称AB两事件为() A.不影响事件 B.相容事件 C.不相容事件 D. 独立事件 12. 正态分布由()于1733年发现的 A.高斯 B.拉普拉斯 C.莫弗 D. 高赛特

正态分布讲解(含标准表)

2.4正态分布 复习引入: 总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. 总体密度曲线 b 单位 O 频率/组距 a 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积. 观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示: 2 2 () 2 , 1 (),(,) 2 x x e x μ σ μσ ? πσ - - =∈-∞+∞ 式中的实数μ、)0 (> σ σ是参数,分别表示总体的平均数与标准差,, ()x μσ ? 的图象为正态分布密度曲线,简称正态曲线. 讲解新课:

一般地,如果对于任何实数a b <,随机变量X 满足 ,()()b a P a X B x dx μσ?<≤=?, 则称 X 的分布为正态分布(normal distribution ) .正态分布完全由参数μ和σ确定,因此正态分布常记作),(2 σ μN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN . 经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.例如,高尔顿板试验中,小球在下落过程中要与众多小木块发生碰撞,每次碰撞的结果使得小球随机地向左或向右下落,因此小球第1次与高尔顿板底部接触时的坐标 X 是众多随机碰撞的结果,所以它近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.因此,正态分布广泛存在于自然现象、生产和生活实际之中.正态分布在概率和统计中占有重要的地位. 说明:1参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计. 2.早在 1733 年,法国数学家棣莫弗就用n !的近似公式得到了正态分布.之后,德国数学家高斯在研究测量误差时从另一个角度导出了它,并研究了它的性质,因此,人们也称正态分布为高斯分布. 2.正态分布),(2 σ μN )是由均值μ和标准差σ唯一决定的分布 通过固定其中一个值,讨论均值与标准差对于正态曲线的影响

第六章 概率分布

第六章概率分布 第一节概率的基本概念 一、什么是概率 概率指用一个比值来概括某事件出现的可能性大小。因为纯粹利用概率的概念是无法计算出概率的,所以它有几个用于不同情况下的计算办法: (一)古典概率(先验概率) 基本事件:如果某一随机实验可以分成有限的n种可能结果,这n种结果之间是互不交叉的,而且这些结果出现的可能性相等,我们把这n种可能结果称为基本事件。如抛置骰子这一随机试验的基本事件为:{1}{2}{3}{4}{5}{6}。 基本事件必须具备如下的五个条件: ①等可能性:实验中基本事件发生的概率相等(根据对称性来判断)。 ②互斥性:各个基本事件不可能在一次试验中同时发生,或者说一次试验中只能发生基本事件中的一个。 ③完备性:一次试验中所有基本事件必然有一个发生,即所有基本事件概率之和为100%。 ④有限性:全部结果只有有限的n种。 ⑤不可再分性:不可能有比基本事件范围更小的事件。若把抛置骰子的基本事件取为:A={1,2,3},B={4,5,6},则它满足前面的所有4上条件,但它们可以再分。 古典概率的定义:在只含有有限个基本事件的试验中,任意事件A发生的概率定义为: (二)统计概率(后验概率) 统计概率常用于随机现象不满足“基本事件等可能发生”的条件,或者某些试验不可能分为等可能的互不相交的事件。 在相同条件下进行n次试验,事件A出现了m次,如果试验次数n充分地大,且事件A 出现的频率稳定在某一数值p附近,则称p为事件A的概率。由于p也是一抽象的值, 常常用n在充分大时的代替。即: 。 二、概率的基本性质 1、概率的加法定理 两个互不相容事件A、B之和的概率,等于两个事件概率之和,P(A+B)=P(A)+P(B) 2、概率的乘法定理 两个独立事件同时出现的概率等于该两事件概率的乘积,P(AB)=P(A)×P(B) 例6-1:一枚硬币掷三次,或三枚硬币各掷一次,问出现两次或两次以上H的概率是多 少?

常用分布概率计算的Excel应用

上机实习常用分布概率计算的Excel应用利用Excel中的统计函数工具,可以计算二项分布、泊松分布、正态分布等常用概率分布的概率值、累积(分布)概率等。这里我们主要介绍如何用Excel来计算二项分布的概率值与累积概率,其他常用分布的概率计算等处理与此类似。 §3.1 二项分布的概率计算 一、二项分布的(累积)概率值计算 用Excel来计算二项分布的概率值P n(k)、累积概率F n(k),需要用BINOMDIST函数,其格式为: BINOMDIST (number_s,trials, probability_s, cumulative) 其中 number_s:试验成功的次数k; trials:独立试验的总次数n; probability_s:一次试验中成功的概率p; cumulative:为一逻辑值,若取0或FALSE时,计算概率值P n(k);若取1 或TRUE时,则计算累积概率F n(k),。 即对二项分布B(n,p)的概率值P n(k)和累积概率F n(k),有 P n(k)=BINOMDIST(k,n,p,0);F n(k)= BINOMDIST(k,n,p,1) 现结合下列机床维修问题的概率计算来稀疏现象(小概率事件)发生次数说明计算二项分布概率的具体步骤。 例3.1某车间有各自独立运行的机床若干台,设每台机床发生故障的概率为0.01,每台机床的故障需要一名维修工来排除,试求在下列两种情形下机床发生故障而得不到及时维修的概率: (1)一人负责15台机床的维修; (2)3人共同负责80台机床的维修。 原解:(1)依题意,维修人员是否能及时维修机床,取决于同一时刻发生故障的机床数。 设X表示15台机床中同一时刻发生故障的台数,则X服从n=15,p=0.01的二项分布: X~B(15,0.01), 而 P(X= k)= C15k(0.01)k(0.99)15-k,k = 0, 1, …, 15 故所求概率为 P(X≥2)=1-P(X≤1)=1-P(X=0)-P(X=1) =1-(0.99)15-15×0.01×(0.99)14 =1-0.8600-0.1303=0.0097 (2)当3人共同负责80台机床的维修时,设Y表示80台机床中同一时刻发生故障的台数,则Y服从n=80、p=0.01的二项分布,即 Y~B(80,0.01) 此时因为 n=80≥30, p=0.01≤0.2 所以可以利用泊松近似公式:当n很大,p较小时(一般只要n≥30,p≤0.2时),对任一确定的k,有(其中 =np)

正态分布概率表

参考医学 正态分布概率表 1 — f? 0( u )= t P⑴t F(t)t F(0t卩⑴0.00 0.000 00.230. 181 9 0.46 0.354 5 W9 0. 50 9 8 0.01 0.008 00.24 0. 1H9 70.47 0.361 6 0.70 0,516 1 0+02 0,0160 0. 25 0,197 4 0,48 0.368 80+71 0.522 3 0.03 0*023 9(1. 26 0.205 1 0.49 0.375 9 0.72 0. 52 8 5 044 0.031 9(1.27 0,212 8 0.50O.3R2 9 0.73 "4 6 0R5 0039 90.28 0.220 5 0,51 0.389 9 0.74 0.540 7 0.06 0.047 80.29 0.228 20.52 036 9 0.75 0*546 7 0+07 0 €55 g0,30 0,235 8 0,53 0.403 9 276 0.552 7 0+08 0.063 80 31 0.243 4 0.54 0.410 8 0+77 0.558 7 0+09 (1.(171 7(J. 32 0.251 00.55 0.417 70.78 0.564 6 0. 10 0.0797 fl. 33 0.258 6 0.56 0,424 50.79 0.570 5 0.110,(J87 60.34 0.266 1 0.57 0.431 3 0.B0 0.576 3 0.12 0.09$ 50. 35 0.273 7 0.5S 0.43S 10.S1 O.5S2 1 0+13 OJ03 40. 36 0.281 20.59 0.444 8 0+82 0.587 8 0+14 (1.111 3 0. 37 0.288 6 0.60 0.451 5 M3 0.593 5 0.15 0J19 2 0. 38 0.296 1 0.61 0.458 10.84 0.599 1 0+160.127 10.39 0. 303 50.62 0.464 7 0.85 0.604 7 0.17 0.135 0 040 0330 8 0.63 0.471 3 0.S6 0.610 2 0+18 0.142 S0.41 0.318 20,64 0.477 8 0.87 0.6157 0+19 0.150 7 0 42 0, 325 50.650.484 3 0.88 0.621 1 0,20 0J58 5(J. 43 0. 332 8 0.66 0.490 10.89 0 . 62 6 5 0,21 0J66 3(J.44 0,340 1 0.67 0.497 10.90 0.631 9 0 + 220.174 10.45 0347 3 0.68 0.503 50.91 0.637 2

概率统计分布表格(常用)

标准正态表

0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857

概率论第6章练习答案

第6章《二维随机变量》练习题 一、判断题 1.设(ξ,η)为连续型随机向量,如果联合密度等于各自边际密度的乘积,则ξ,η相互独立.( 1 ) 2.等边三角形域上二维均匀分布的边缘分布仍是均匀分布. ( 0) 3.二维均匀分布的边缘分布仍是均匀分布. ( 0 ) 4.设0)(=A P ,则随机事件A 与任何随机事件B 一定相互独立.( 0 ) 1.设ξ服从参数为λ的普阿松分布,P(ξ=1)=P(ξ=3),则λ 2.设(ξ,η)~N(0,1;1,4,0.5),则ξ,η分别服从3.设ξξ12,的概率密度函数分别为f t f t 12 (),(),且ξξ12,相互独立, 则(ξξ12,)的联4.设(,)X Y 的联合概率分布为 已知(11)P X Y === 2 3 ,则a=_0.2___,X 的概率分布为_____________=。 5.已知),(Y X 的联合分布函数为),(y x F ,且d c b a <<,,则 (,)P a X b c Y d <≤<≤= 6.设),(Y X 的联合概率分布为

则X 7.设二维连续型随机变量),(Y X 的联合概率密度函数为 其它 当0 ,00),()43(>>? ? ?=+-y x ke y x f y x ,则系数=k 12, 三、计算题 1.设随机变量(,)X Y 的联合密度函数 ?? ?<<<=他 其 ,20),(x y x A y x f 求 (1) 常数A ; (2) 边际密度函数; (3) 讨论X 与Y 的相关性. (1) .4/1=A (3) ?==2 2 ,3/4)2/()(dx x X E ??==-2 ,0)4/()(x x dy y dx Y E ??==-2 ,0)4/()(x x dy y xdx XY E c o v (,)()()X Y E X Y E X E Y =-= 所以X 与Y 不相关. 2.设(,)X Y 的联合密度函数为???∈=其它 ,0),(,6),(D y x x y x p ,其中D 为由0,0 x y ==及1x y +=所围区域。(1)求();PY X ≤(2)求(,)X Y 的边际密度函数(),(),X Y p x p y

概率与概率分布(一)

第六章 概率与概率分布(一) 第一节 概率论 随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法 第二节 概率的数学性质 概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提 第三节 概率分布、期望值与变异数 概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数 一、填空 1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( 机会均等 )。 2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。所 不同的是,)(x F 累计的是( 概率 )。 3.如果A 和B ( 互斥 ),总合有P(A/B)=P 〔B/A 〕=0。 4.( 大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。 5.抽样推断中,判断一个样本估计量是否优良的标准是( 无偏性 )、( 一致性 )、( 有效性 )。 6.抽样设计的主要标准有( 最小抽样误差原则 )和( 最少经济费用原则 )。 7.在抽样中,遵守( 随机原则 )是计算抽样误差的先决条件。 8.抽样平均误差和总体标志变动的大小成( 正比 ),与样本容量的平方根成( 反比 )。如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应( 增大到16倍 )。 9.若事件A 和事件B 不能同时发生,则称A 和B 是( 互斥 )事件。 10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.古典概率的特点应为(A ) A 、基本事件是有限个,并且是等可能的; B 、基本事件是无限个,并且是等可能的; C 、基本事件是有限个,但可以是具有不同的可能性;

统计学习题 第六章 概率与概率分布

第六章 概率与概率分布 第一节 概率论 随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法 第二节 概率的数学性质 概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提 第三节 概率分布、期望值与变异数 概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数 一、填空 1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( 机会均等 )。 2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。所不同的是,)(x F 累计的是( 概率 )。 3.如果A 和B ( 互斥 ),总合有P(A/B)=P 〔B/A 〕=0。 4.( 大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。 5.抽样推断中,判断一个样本估计量是否优良的标准是( 无偏性 )、( 一致性 )、( 有效性 )。 6.抽样设计的主要标准有( 最小抽样误差原则 )和( 最少经济费用原则 )。 7.在抽样中,遵守( 随机原则 )是计算抽样误差的先决条件。 8.抽样平均误差和总体标志变动的大小成( 正比 ),与样本容量的平方根成( 反比 )。如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应( 增大到16倍 )。 9.若事件A 和事件B 不能同时发生,则称A 和B 是( 互斥 )事件。 10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.古典概率的特点应为(A ) A 、基本事件是有限个,并且是等可能的; B 、基本事件是无限个,并且是等可能的; C 、基本事件是有限个,但可以是具有不同的可能性;

正态分布概率公式(部分)

Generated by Foxit PDF Creator ? Foxit Software https://www.sodocs.net/doc/4210575128.html, For evaluation only.
图 62正态分布概率密度函数的曲线 正态曲线可用方程式表示。 n 当 →∞时,可由二项分布概率函数方程推导出正态 分布曲线的方程:
fx= (61 ) () .6
式中: x—所研究的变数; fx —某一定值 x出现的函数值,一般称为概率 () 密度函数 (由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某 一区间的概率, 不能计算变量取某一值, 即某一点时的概率, 所以用 “概率密度” 一词以与概率相区分),相当于曲线 x值的纵轴高度; p—常数,等于 31 .4 19……; e— 常数,等于 2788……; μ 为总体参数,是所研究总体 5 .12 的平均数, 不同的正态总体具有不同的 μ , 但对某一定总体的 μ 是一个常数; δ 也为总体参数, 表示所研究总体的标准差, 不同的正态总体具有不同的 δ , 但对某一定总体的 δ 是一个常数。 上述公式表示随机变数 x的分布叫作正态分布, 记作 N μ ,δ2 ), “具 ( 读作 2 平均数为 μ,方差为 δ 的正态分布”。正态分布概率密度函数的曲线叫正态 曲线,形状见图 62。 (二)正态分布的特性
1、正态分布曲线是以 x μ 为对称轴,向左右两侧作对称分布。因 =

数值无论正负, 只要其绝对值相等, 代入公式 61 ) ( .6 所得的 fx 是相等的, () 即在平均数 μ 的左方或右方,只要距离相等,其 fx 就相等,因此其分布是 () 对称的。在正态分布下,算术平均数、中位数、众数三者合一位于 μ 点上。

正态分布概率公式(部分)

图 6-2 正态分布概率密度函数的曲线 正态曲线可用方程式表示。当n→∞时,可由二项分布概率函数方程推导出正态分布曲线的方程: f(x)= (6.16 ) 式中: x —所研究的变数; f(x) —某一定值 x 出现的函数值,一般称为概率密度函数(由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某一区间的概率,不能计算变量取某一值,即某一点时的概率,所以用“概率密度”一词以与概率相区分),相当于曲线 x 值的纵轴高度; p —常数,等于 3.14 159 ……; e —常数,等于 2.71828 ……;μ为总体参数,是所研究总体的平均数,不同的正态总体具有不同的μ,但对某一定总体的μ是一个常数;δ也为总体参数,表示所研究总体的标准差,不同的正态总体具有不同的δ,但对某一定总体的δ是一个常数。 上述公式表示随机变数 x 的分布叫作正态分布,记作 N( μ , δ2 ) ,读作“具平均数为μ,方差为δ 2 的正态分布”。正态分布概率密度函数的曲线叫正态曲线,形状见图 6-2 。 (二)正态分布的特性 1 、正态分布曲线是以 x= μ为对称轴,向左右两侧作对称分布。因的数值无论正负,只要其绝对值相等,代入公式( 6.16 )所得的 f(x) 是相等的,即在平均数μ的左方或右方,只要距离相等,其 f(x) 就相等,因此其分布是对称的。在正态分布下,算术平均数、中位数、众数三者合一位于μ点上。

2 、正态分布曲线有一个高峰。随机变数 x 的取值范围为( - ∞,+ ∞ ),在( - ∞ ,μ)正态曲线随 x 的增大而上升,;当 x= μ时, f(x) 最大;在(μ,+ ∞ )曲线随 x 的增大而下降。 3 、正态曲线在︱x-μ︱=1 δ处有拐点。曲线向左右两侧伸展,当x →± ∞ 时,f(x) →0 ,但 f(x) 值恒不等于零,曲线是以 x 轴为渐进线,所以曲线全距从 -∞到+ ∞。 4 、正态曲线是由μ和δ两个参数来确定的,其中μ确定曲线在 x 轴上的位置 [ 图 6-3] ,δ确定它的变异程度 [ 图 6-4] 。μ和δ不同时,就会有不同的曲线位置和变异程度。所以,正态分布曲线不只是一条曲线,而是一系列曲线。任何一条特定的正态曲线只有在其μ和δ确定以后才能确定。 5 、正态分布曲线是二项分布的极限曲线,二项分布的总概率等于 1 ,正态分布与 x 轴之间的总概率(所研究总体的全部变量出现的概率总和)或总面积也应该是等于 1 。而变量 x 出现在任两个定值 x1到x2(x1≠x2)之间的概率,等于这两个定值之间的面积占总面积的成数或百分比。正态曲线的任何两个定值间的概率或面积,完全由曲线的μ和δ确定。常用的理论面积或概率如下: 区间μ ± 1 δ面积或概率 =0.6826 μ ± 2 δ =0.9545 μ ± 3 δ=0.9973 μ± 1.960δ=0.9500 μ ±2.576 δ =0.9900

概率分布以及期望和方差

概率分布以及期望和方差 上课时间: 上课教师: 上课重点:掌握两点分布、超几何分布、二项分布、正态分布的概率分布及其期望和方差 上课规划:解题技巧和方法 一 两点分布 ⑴两点分布 如果随机变量X X 1 0 P p q 其中01p <<,1q p =-X 服从参数为p 的二点分布. 二点分布举例:某次抽查活动中,一件产品合格记为1,不合格记为0,已知产品的合格率为80%,随机变量X 为任意抽取一件产品得到的结果,则X X 1 0 P 0.8 0.2 两点分布又称01-验,所以这种分布又称为伯努利分布. (2)典型分布的期望与方差: 二点分布:在一次二点分布试验中,离散型随机变量X 的期望取值为p ,在n 次二点分布试验中,离散型随机变量X 的期望取值为np . 1、在抛掷一枚图钉的随机试验中,令10X ?=? ? ,针尖向上; ,针尖向下.,如果针尖向上的 概率为p ,试写出随机变量X 的概率分布. 2、从装有6只白球和4只红球的口袋中任取一只球,用X 表示“取到的 知识内容 典例分析

白球个数”,即???=,当取到红球时, ,当取到白球时, 01X ,求随机变量X 的概率分布. 3、若随机变量X 的概率分布如下: 试求出C X 3、抛掷一颗骰子两次,定义随机变量 ?? ?=)(,1)(,0的点数数等于第二次向上一面当第一次向上一面的点 面的点数数不等于第二次向上一当第一次向上一面的点 ξ 试写出随机变量ξ的分布列. 4、篮球运动员比赛投篮,命中得1分,不中得0分,已知运动员甲投篮命中率的概率为P . ⑴ 记投篮1次得分X ,求方差()D X 的最大值; ⑵ 当⑴中()D X 取最大值时,甲投3次篮,求所得总分Y 的分布列及Y 的期望与方差. 二 超几何分布

第六章概率分布

智力的分布呈正态分 布,已知某人的IQ分 已知某人的IQ分 IQ 数为130分,那么分 数为130分 130
心理统计学测验中有 10道正误判断题, 10道正误判断题,如 道正误判断题 何才能了解学生对所 测内容真正掌握了还
数比他低的人有多 是仅仅是猜测。 是仅仅是猜测。 少?
第一节
概率的基本概念 随机事件
第一节
概率的基本概念
每次试验可能出现也 可能不出现的事件
后验概率 先验概率
第二节
正态分布
对随机事件进行 n次观察,其中 次观察, 次观察 某一事件A出现 某一事件 出现 次数 m与n的比值 与 的比值
概率
随机事件出现 可能性大小的 客观指标 在特殊情况下 直接计算的比 是真实的, 值,是真实的, 而不是估计值
第三 节
抽样分布
实验的每种可能结果是有限的 每一基本事件出现的可能性相等
第一节
概率的基本概念
互不相容事件
必然事件的 指在一次观测中不 概率为1 概率为 能同时发生的事件
?
A B 加法
任何一个随机 不可能事件
定理
事件A的概率 事件 的概率
概率的公理性质
都是非负的
的概率为0 的概率为
? 两个互不相容的事件 之和的概率为两个事 件概率之和。 件概率之和。
1

?
三、概率的分布类型
独立事件
指一个事件的出现对 另一个事件的出现不 发生影响
A
B
乘法 定理
? 两个独立事件同时发生的概 率等于这两个事件各自出现 概率的乘积。 概率的乘积。
概率分布 随机变量
一次试验的结果 的数值性描述 指用数学方法( 指用数学方法(函数 )对随机变量取值的 分布情况加以描述
三、概率的分布类型
概率分布的理解 例如,投掷一枚硬币, 例如,投掷一枚硬币,出现正面和反面的频 的增大, 率,随着投掷次数 n 的增大,出现正面和反 面的频率稳定在1/2 1/2左右 面的频率稳定在1/2左右
正面 /试验次数 1.00 0.75 0.50 0.25 0.00 0 25 50 75 试验的次数 100 125
概率的分布类型
离散型随机变量: 离散型随机变量:
离散分布
离散随机变量
随机变量 X 取有限个值或 所有取值都可以逐个列举出来 X1 ,X2,… ,
的概率分布
以确定的概率取这些不同的值
连 续 性
连续型随机变量
连续分布
连续随机变量 的概率分布
取无限个值, 随机变量 X 取无限个值,所有可 能取值不可以逐个列举来, 能取值不可以逐个列举来,而是 取数轴上某一区间内的任意点
概率的分布类型
根据观察或 实验所获得 的数据而编 制的次数分 布或相对频 率分布
经 验 分 布
分布 函数 的 来源
理 论 分 布
1.随机变量概 随机变量概 率分布的函 数—数学模型 数学模型 2.按某种数学 按某种数学 模型计算出的 总体次数分布
理论分布中 描述构成总 体的基本变 量的分布
基本 随机 变量 分布
数据 特征
抽 样 分 布
样本统计量 的理论分布
2

常用的概率分布类型及其特征

常用的概率分布类型及其特征 3.1 二点分布和均匀分布 1、两点分布 许多随机事件只有两个结果。如抽检产品的结果合格或不合格;产品或者可靠的工作,或者失效。描述这类随机事件变量只有两个取值,一般取0和1。它服从的分布称两点分布。 其概率分布为: 其中 Pk=P(X=Xk),表示X取Xk值的概率: 0≤P≤1。 X的期望 E(X)=P X的方差 D(X)=P(1—P) 2、均匀分布 如果连续随机变量X的概率密度函数f(x)在有限的区间[a,b]上等于一个常数,则X服从的分布为均匀分布。 其概率分布为: X的期望 E(X)=(a+b)/2

X的方差 D(X)=(b-a)2/12 3.2 抽样检验中应用的分布 3.2.1 超几何分布 假设有一批产品,总数为N,其中不合格数为d,从这批产品中随机地抽出n 件作为被检样品,样品中的不合格数X服从的分布称超几何分布。 X的分布概率为: X=0,1,…… X的期望 E(X)=nd/N X的方差 D(X)=((nd/N)((N-d)/N)((N-n)/N))(1/2)3.2.2 二项分布 超几何分布的概率公式可以写成阶乘的形式,共有9个阶乘,因而计算起来十分繁琐。二项分布就可以看成是超几何分布的一个简化。 假设有一批产品,不合格品率为P,从这批产品中随机地抽出n件作为被检样品,其中不合格品数X服从的分布为二项分布。 X的概率分布为: 0

X的方差 D(X)=np(1-p) 3.2.3 泊松分布 泊松分布比二项分布更重要。我们从产品受冲击(指瞬时高电压、高环境应力、高负载应力等)而失效的事实引入泊松分布。假设产品只有经过一定的冲击次数后,产品才失效,又设这些冲击满足三个条件: (1)、两个不相重叠的时间间隔内产品所受冲击次数相互独立; (2)、在充分小的时间间隔内发生两次或更多次冲击的机会可忽略不计; (3)、在单位时间内发生冲击的平均次数λ(λ>0)不随时间变化,即在时间间隔Δt内平均发生λΔt次冲击,它和Δt 的起点无关。 则在[0,t]时间内发生冲击的次数X服从泊松分布,其分布概率为: X的期望 E(X)=λt X的方差 D(X)=λt 假设仪表受到n次冲击即发生故障,则仪表在[0,t]时间内的可靠度为: 其中:x =0,1,2,……,λ>0,t>0。

相关主题