搜档网
当前位置:搜档网 › 正态分布练习题

正态分布练习题

正态分布练习题
正态分布练习题

参考数据:若ξ~N (μ,σ2),P (μ-σ<ξ≤μ+σ)=0.6826,P (μ-2σ<ξ≤μ+2σ)=0.9544,

P (μ-3σ<ξ≤μ+3σ)=0.9974.)

1.某省2015年全省高中男生身高统计调查数据显示:全省100000名男生的身高服从正态分布N (170.5,16).现从某校高三年级男生中随机抽取50名测量身高,测量发现被测学生身高全部介于157.5cm 和187.5cm 之间,将测量结果按如下方式分成6组:第一组[157.5,16

2.5),第二组[162.5,167.5),…,第6组[182.5,187.5),图是按上述分组方法得到的频率分布直方图.

(1)试评估我校高三年级男生在全省高中男生中的平均身高状况; (2)求这50名男生身高在177.5cm 以上(177.5cm )的人数;

(3)在这50名男生身高在177.5cm 以上(含177.5cm )的人中任意抽取2人,该2人中身高排名(以高到低)在全省前130名的人数记为ξ,求ξ的数学期望.

2.从某市统考的学生数学考试卷中随机抽查100份数学试卷作为样本,分别统计出这些试卷总分,由总分得到如下的频率分布直方图.

(1)求这100

份数学试卷的样本平均分和样本方差s 2(同一组中的数据用该组区间的中点值作代表)

(2)由直方图可以认为,这批学生的数学总分Z

服从正态分布N (μ,σ2),其中μ

近似为样本平均数,σ2近似为样本方差s 2. ①利用该正态分布,求P (81<z <119);

②记X 表示2400名学生的数学总分位于区间(81,119)的人数,利用①的结果,求EX

(用样本的分布区估计总体的分布).附:

≈19

,≈18,

3.在某学校的一次选

拔性考试中,随机抽取了100名考生的成绩(单位:分),并

把所得数据列成了如下表所示的频数分布表:

()1求抽取的样本平均数x 和样本方差2s (同一组中的数据用该组区间的中点值作代表);

()2已知这次考试共有2000名考生参加,

如果近似地认为这次成绩z 服从正态分布()2,μσN (其中μ近似为样本平均数x ,2

σ近似为样本方差2

s ),且规定82.7分是复试线,那么在这2000名

考生中,能进入复试的有多少人?(附:

16112.7

≈,若

()

2,z

μσN ,则

()

0.6826z

μ

σμσP -<

<+=,()220.9544z μσμσP -<<+=)

()3已知样本中成绩在[]90,100中的6名考生中,有

4名男生,2名女生,现从中选3人进行回访,记选出的男生人数为ξ,求ξ的分布列与期望()ξE .

4.从某企业生产的某种产品中抽取500件,测量这

些产品的一项质量指标值,由测量结果得如下图频率分布直方图:

(I )求这500件产品质量指标值的样本平均值和样本方差(同一组的数据用该组区间的中点值作代表);

(II )由直方图可以认为,这种产品的质量指标服从正态分布

,其中

近似为样

本平均数,

近似为样本方差

.

(i )利用该正态分布,求

(ii )某用户从该企业购买了100件这种产品,记

表示这100件产品中质量指标值位于区间的产品件数.利用(i

)的结果,求

.附:

5.在一次全国高中生五省大联考中,有90万名学生参加,考后对所有学生成绩统计发现,应用

成绩服从正态分布()2

,N

μδ,右表用茎叶图列举了20名学

生的英语成绩,巧合的是这20个数据的平均数和方差恰好比所有90万个数据的平均数和方差都多0.9,且这20个数据的方差为49.9.

(1)求,;μδ (2)给出正态分布的数据:

(ⅰ)若从这90万名学生中随机抽取1名,求该生英语成绩在()82.1,103.1内的概率; (ⅱ)如从这90万名学生中随机抽取1万名,记X 为这1万名学生中英语成绩在()82.1,103.1内的人数,求X 的数学期望.

18.从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率

分布直方图:

(I )求这500件产品质量指标值的样本平均数x 和样本方差2

s (同一组数据用该区间的中点值作代表);

(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布2

(,)N μδ,其中μ近似为样本平均数x ,2

δ近似为样本方差2s . (i )利用该正态分布,求(187.8212.2)P Z <<; (ii )某用户从该企业购买了100件这种产品,学科网记X 表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i )的结果,求EX .附:150≈12.2.

6.在某大学举行的自主招生考试中,随机抽取了100名考生的成绩(单位:分),并把所得数据列成了如下所示的频数分布表: 组别 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100) 频数

5

18

28

26

17

6

(Ⅰ)求抽取样本的平均数(同一组中的数据用该组区间的中点值代表); (Ⅱ)已知这次考试共有2000名考生参加,如果近似地认为这次成绩Z 服从正态分布

N (μ,σ2

)(其中μ近似为样本平均数,σ2

近似为样本方差s 2

=161),且规定82.7分是复试线,那么在这2000名考生中,能进入复试的有多少人?(附:

≈12.7,

(3)已知样本中成绩在[90,100]中的6名考生中,有4名男生,2名女生,现从中选3人进行回访,记选出的男生人数为ξ,求ξ的分布列与期望E (ξ)

7.从某工厂生产的某产品中抽取500件,测量这些产品的一项质量指标,由测量结果得到下列频

数分布表:

(1)作出这些数据的频率分布直方图,并估计该产品质量指标值的平均数x

及方差s 2(同一组中的数据用该组的中点值作代表);

(2)可以认为这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数 x ,σ2.近似为样本方差s 2; 一件产品的质量指标不小于110时该产品为优质品;利用该正态分布,计算这种产品的优质品率p (结果保留小数点后4位).

8.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得到如下频数分布表.

质量指标值分组

[75,85) [85,95) [95,105)

[105,115)

[115,125]

频数

6

26

x

22

8

指标值分组

[75,85)

[85,95) [95,105)

[105,115)

[115,125]

频数

30

120

210

100

40

(1)作出这些数据的频率分布直方图(用阴影表示);

(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计这种产品质量指标值的平均数x 及方差s2;

(3)当质量指标值位于(79.6,120.4)时,认为该产品为合格品.由直方图可以认为,这种产

品的质量指标值Z 服从正态分布N (μ,σ2),

其中μ近似为样本平均数 x .σ2近似为样本方差s2(每组数取中间值).

①利用该正态分布,求从该厂生产的产品中任取一件,该产品为合格品的概率; ②该企业每年生产这种产品10万件,生产一件合格品利润10元,生产一件不合格品亏损20元,则该企业的年利润是多少?

正态分布练习含答案

正态分布 一.选择题: 1.正态分布有两个参数μ与σ,( )相应的正态曲线的形状越扁平。 A .μ越大 B .μ越小 C .σ越大 D .σ越小 答案: C 。解析:由正态密度曲线图象的特征知。 2. 已知随机变量X 服从正态分布N (3,σ2)则P (X <3)等于 ( ) A.15 B.14 C.13 D.12 解析:由正态分布图象知,μ=3为该图象的对称轴,P (X <3)=P (X >3)=12 . 答案:D 3.设两个正态分布N (μ1,σ21)(σ1>0)和N (μ2,σ22)(σ2>0)的密度函数图象如图所示,则有 ( ) A .μ1<μ2,σ1<σ2 B .μ1<μ2,σ1>σ2 C .μ1>μ2,σ1<σ2 D .μ1>μ2,σ1>σ2 解析:由图可知,μ2>μ1,且σ2>σ1. 答案:A 4.设随机变量ξ服从正态分布)1,0(N ,则下列结论不正确的是 。 A .)0)(|(|)|(|)|(|>=+<=-<=<-=>-=

如何检验数据是否服从正态分布

如何检验数据是否服从正态分布呢 法一:在SPSS中,正态分布的检验方法有:计算偏度系数(Skewness)和峰度系数(Kurtosis)、Kolmogorov-Smirnov检验(KS检验或D检验)、Shapiro-Wilk(SW检验或W检验)、直方图、QQ图等。 下面本葱通过具体例子给大家介绍如何用SPSS检验数据是否为正态分布: 首先需要有一组数据,如:74 75 78 77 80 80 90 76 62 79,按下述格式输入SPSS 中。 依此点击分析-描述统计-描述 就会看到下述图片,点击绘制,我们可以选择输出图片(茎叶图、直方图),如果想要输出图片,在输出应该选择两者都。选择确定,就可以看到结果了。 输出结果如何解读?

此表,是对数据的统计描述,我们可以关注下最下方的偏度(Skewness)和峰度(Kurtosis)。 偏度SK越趋近0,数据越服从正态分布,众数=中位数=平均数;SK>0,为正偏态或左偏,众数<中位数<平均数;SK<0,为负偏态或右偏,众数>中位数>平均数。 峰度KG越趋近3,数据越服从正态分布;KG>3,峰度尖锐;KG<3,峰度扁平。(或exceess_KG=KG-3,exceess_KG越趋近0,数据越服从正态分布) 但是仅根据偏度和峰度还不足以判断数据是否服从正态分布,需要做进一步的检验。

上表是生成的KS检验(D检验)和SW检验(W检验)的检验结果,此处我们关注的显著性是Sig.即P值。当P>0.05时,可以认为数据是呈正态分布的。数据分析师培训由上表可以看出,KS检验和SW检验显著性均>0.05。 由于样本数量为10,小样本时关注SW检验的结果,所以此处显著性0.145,可以认为数据是正态分布的。 在输出结果部分还可以生成直方图、茎叶图、QQ图等,可以根据图形做出观测,若要检验是否服从正态分布还是需要用算法进行检测。 法二: 结果可见: One-Sample Kolmogorov-Smirnov Test KW胸水 N79

正态分布图的制作方法

参考資料:QC 数学の話(大村 平著) 日科技連出版 翻訳完成日期:2009年6月6日 品质管理的基石统计初步(翻訳:李琰) 目录 ·从互换性到品质管理 ·QC 是迈向文明社会的技术突破 ·从互换性到品质管理 ·SQC 的成熟与TQC ·数据整理的基本 ·代表值的选出 ·平均值的计算 ·标准偏差的计算 ·正态分布概念引入 ·正态分布的加法与减法 ·正态分布应用举例 第1章 从统计学的互换性到品质管理 20世纪人类历史上发生了3大震撼世界技术的突破。1,原子能的利用;2,高分子化合物的合成;3, 信息技术的飞跃发展。关于原子能的利用,主要在民生和军事方面得到了广泛的发展。在人类历史上原子能的出现翻开了历史新的一页,震撼了世界这是众所周知的。二次世界大战期间在広島,長崎投下的原子弹的爆炸,造成了人类的大量伤亡。在民生应用方面,随着碳素系列能源的枯竭和CO 2排出的控制, 原子能发电已经得到广泛应用。 另外在高分子化合物合成技术方面,给人类生活带来了极大的影响。用塑料做成的各种各样建材类,器 具类遍布了我们的生活周围。如果把我们生活中存在的塑料制品全部拿走的话,我们生活就象没有了文字一样,土蹦瓦解。化肥使粮食增产。人工纤维的合成,给我们提供了丰富多样的衣着。合成橡胶,洗剂,粘结剂,调味品等不胜枚举。 还有,信息技术的飞跃发展。首先让我们只看一下和我们切身利益相关的民生用品,各种各样的业务预 约,存款储蓄,通信网和铁道网的管理,天气预报,犯罪搜查等虽然眼睛直接看不到,却支撑着我们的近代生活。而且各种技术计算,生命科学,人工智能等先端事物已变成了我们生活中的神圣组织。如果说没有高分子化合物我们的生活会瓦解的话,那么没有信息我们的生活会瘫痪。 基于以上,我们可以说,原子能是能源方面的突破,高分子合成是硬件方面的突破,信息技术是软件方 面的突破,3个方面对我们的生活带来了震撼性的影响。 那么为什么以上3个方面可以在20世纪能够获得极大的技术突破呢? 我认为是以下两个方面的原因: 1, 抗身抗生物质的发现。 2, 品质管理的普及。 为什么这么说呢?下面阐述理由。 最初的科学文明,把人类从严酷的劳动和疾病中解放出来。人类为了确保衣食住的安定,做出了很大的 QC 数学的 話题

(项目管理)正态分布原理PMP项目管理分享资料

正态分布 (一)正态分布 正态分布的概率密度 如果连续型随机变量的概率密度为 ,(4.29) 其中,,则称随机变量服从参数为,的正态分布,记作。 正态分布的数学期望和方差 正态分布的图形有如下性质: 1.它是一条以直线为对称轴的钟形曲线; 2.它以横轴为渐近线,并且在处有拐点; 3.它在处取得最大值,最大值为: 由此可见,标准差越大,的图形就越平缓,标准差越小,的图形就越陡峭。 正态分布的分布函数 ,(4.30)(二)标准正态分布

标准正态分布的概率密度 参数,的正态分布,称为标准正态分布,记为。标准正态分布的概率密度通常用表示, ,(4.31)的图形如图4.12所示,它是一条以纵轴为对称轴的钟形曲线。 图4.12 标准正态分布概率密度函数 标准正态分布的分布函数 标准正态分布的分布函数通常用表示, ,(4.32)

图4.13 标准正态分布函数 标准正态分布函数表 对于非负的实数,可由标准正态分布函数表,直接查出的数值。对于负的实数,根据标准正态分布的对称性,可由下式 (4.33) 计算出数值。 标准正态分布分位数 设随机变量服从标准正态分布,对于给定的概率水平,满足等式 (4.34)的正数,称为标准正态分布的水平的双侧分位数;满足等式 (4.35) 的正数,称为标准正态分布的水平的上侧分位数。

图4.14 正态分布双侧分位数例4.21假设,求下列概率: 1.; 2.; 3.; 4.。 解 1. 2. 3. 4. (三)正态分布与标准正态分布的关系 如果,则

于是,在正态分布与标准正态分布的概率密度和、分布函数和之间存在下列关系式: 1. (4.36) 2. (4.37) 3.( 4.38) 这就是说,计算任一正态分布随机变量的概率都能通过标准正态分布来实现。 例4.22设,求下列概率: 1. 2. 解因为,所以。 1. 2.

正态分布及其经典习题和答案

正态分布讲义 【知识网络】 1、取有限值的离散型随机变量均值、方差的概念; 2、能计算简单离散型随机变量的均值、方差,并能解决一些实际问题; 3、通过实际问题,借助直观(如实际问题的直观图),认识正态分布、曲线的特点及曲线所表示的意义。 【典型例题】 例1:(1)已知随机变量X 服从二项分布,且E (X )=2.4,V (X )=1.44,则二项分布的参数n ,p 的值为 ( ) A .n=4,p=0.6 B .n=6,p=0.4 C .n=8,p=0.3 D .n=24,p=0.1 答案:B 。解析:()4.2==np X E ,()44.1)1(=-=p np X V 。 (2)正态曲线下、横轴上,从均数到∞+的面积为( )。 A .95% B .50% C .97.5% D .不能确定(与标准差的大小有关) 答案:B 。解析:由正态曲线的特点知。 (3)某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是 ( ) A 32 B 16 C 8 D 20 答案:B 。解析:数学成绩是X —N(80,102 ), 8080 9080(8090)(01)0.3413,480.3413161010P X P Z P Z --??≤≤=≤≤=≤≤≈?≈ ??? 。 (4)从1,2,3,4,5这五个数中任取两个数,这两个数之积的数学期望为___________ 。 答案:8.5。解析:设两数之积为X , ∴E(X)=8.5. (5)如图,两个正态分布曲线图: 1为)(1 ,1x σμ?,2为)(22x σμ? , 则1μ 2μ,1σ 2σ(填大于,小于) 答案:<,>。解析:由正态密度曲线图象的特征知。 例2:甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才算合格. (Ⅰ)求甲答对试题数ξ的概率分布及数学期望; (Ⅱ)求甲、乙两人至少有一人考试合格的概率. 答案:解:(Ⅰ)依题意,甲答对试题数ξ的概率分布如下: 甲答对试题数ξ的数学期望 E ξ=5 9 61321210313010=?+?+?+? . (Ⅱ)设甲、乙两人考试合格的事件分别为A 、B ,则

如何检验数据是否服从正态分布

如何检验数据是否服从正态分布 一、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误σg1及σg2然后作U检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。 2、非参数检验方法 非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk(W 检验)。 SAS中规定:当样本含量n≤2000时,结果以Shapiro – Wilk(W检验)为准,当样本含量n >2000时,结果以Kolmogorov – Smirnov(D检验)为准。 SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3和5000之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro –Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本Kolmogorov-Smirnov检验可用于检验变量(例如income)是否为正态分布。 对于此两种检验,如果P值大于0.05,表明资料服从正态分布。 三、SPSS操作示例

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

高二数学 正态分布练习题

正态分布 ㈠ 知识点回顾: 1、正态分布概念:若连续型随机变量ξ的概率密度函数为 ),(,21)(2 22)(∞+-∞∈= --x e x f x σμσ π, 其中,σμ为常数,且0σ>,则称ξ服从正态分布,简记为ξ~()2,N μσ。 ()f x 的图象称为正态曲线。 2、正态分布的期望与方差 若ξ~()2,N μσ,则2,E D ξμξσ== 3、正态曲线的性质: ①曲线在x 轴的上方,与x 轴不相交. ②曲线关于直线x=μ对称. ③曲线在x=μ时位于最高点. ④当x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以 x 轴为渐进线,向它无限靠近. ⑤当μ一定时,曲线的形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越分散;σ 越小,曲线越“瘦高”,表示总体的分布越集中. 4、在标准正态分布表中相应于0x 的值()0x Φ是指总体取值小于0x 的概率即 ()()00x P x x Φ=< 00≥x 时,则)(0x Φ的值可在标准正态 分布表中查到 00

x y O (6)、()2,N μσ与()0,1N 的关系: ①若ξ~()2,N μσ,有()()000x P x F x μξσ-??<==Φ ??? ②若ξ~()2,N μσ,则()2112x x P x x x μμσσ--???? <<=Φ-Φ ? ????? (二)习题 一、选择题 1.某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为 )(10 21 )(200 )80(2R x e x f x ∈?= --π,则下列命题不正确的是 ( B ) A .该市这次考试的数学平均成绩为80分; B .分数在120分以上的人数与分数在60分以下的人数相同; C .分数在110分以上的人数与分数在50分以下的人数相同; D .该市这次考试的数学成绩标准差为10. 2.设随机变量ξ服从标准正态分布()0,1N ,若()1P p ξ>=,则()10P ξ-<<=(D ) A. 2 p B. 1p - C. 12p - D. 12p - 3.设随机变量),(~2σμξN ,且 )()(c P c P >=≤ξξ,则c 等于( D ) μμσ...0.D C B A - 4. 已知正态分布曲线关于y 轴对称,则μ值为( ) A .1 B .-1 C .0 D.不确定 5.正态分布N (0,1)在区间(-2,-1)和(1,2)上的取值的概率分别为12,p p ,则12,p p 的大小关系为( ) A .12p p < B .12p p > C .12p p = D.不确定 6.设随机变量),(~2σμξN ,且1,3==ξξD E ,则)11(≤<-ξP =( B ) 1)2(2.)4()2(.)2()4(.1)1(2.-ΦΦ-ΦΦ-Φ-ΦD C B A 7.已知随机变量ξ服从正态分布2(2)N σ,,(4)0.84P ξ=≤,则(0)P ξ=≤( A ) A .0.16 B .0.32 C .0.68 D ,0.84 8.设随机变量ξ服从正态分布(2,9)N ,若(1)(1)P c P c ξξ>+=<-,则c = ( B ) A.1 B.2 C.3 D.4 9.已知随机变量ζ服从正态分布N (3,a 2),则P (3)ζ<=( D ) (A)15 (B)14 (C)13 (D)12 1 x 2 x )(0x Φ) (10x -Φ-

正态分布综合测试题(附答案)

正态分布综合测试题(附答案) 选修2-32.4正态分布 一、选择题 1.下列函数中,可以作为正态分布密度函数的是() A.f(x)=12πe-(x-1)22 B.f(x)=12π?σe(x-2)22σ2 C.f(x)=12πσe-(x-μ)22σ2 D.f(x)=12πe-(x-μ)22π 答案]A 2.已知ξ~N(0,62),且P(-2≤ξ≤0)=0.4,则P(ξ>2)等于() A.0.1B.0.2 C.0.6D.0.8 答案]A 解析]由正态分布曲线的性质知P(0≤ξ≤2)=0.4,∴P(-2≤ξ≤2)=0.8,∴P(ξ>2)=12(1-0.8)=0.1,故选A. 3.若随机变量ξ~N(2,100),若ξ落在区间(-∞,k)和(k,+∞)内的概率是相等的,则k等于() A.2B.10 C.2D.可以是任意实数 答案]A 解析]由于ξ的取值落在(-∞,k)和(k,+∞)内的概率是相等的,所以

正态曲线在直线x=k的左侧和右侧与x轴围成的面积应该相等,于是正态曲线关于直线x=k对称,即μ=k,而μ=2.∴k=2. 4.已知一次考试共有60名同学参加,考生的成绩X~N(110,52),据此估计,大约应有57人的分数在下列哪个区间内() A.(90,110]B.(95,125] C.(100,120]D.(105,115] 答案]C 解析]由于X~N(110,52),∴μ=110,σ=5. 因此考试成绩在区间(105,115],(100,120],(95,125]上的概率分别应是0.6826,0.9544,0.9974. 由于一共有60人参加考试, ∴成绩位于上述三个区间的人数分别是: 60×0.6826≈41人,60×0.9544≈57人, 60×0.9974≈60人. 5.(2010?山东理,5)已知随机变量ξ服从正态分布N(0,σ2),P(ξ>2)=0.023,则P(-2≤ξ≤2)=() A.0.477B.0.628 C.0.954D.0.977 答案]C 解析]∵P(ξ>2)=0.023,∴P(ξ故P(-2≤ξ≤2)=1-P(ξ>2)-P(ξ6.以φ(x)表示标准正态总体在区间(-∞,x)内取值的概率,若随机变量ξ服从正

高斯分布背景模型原理

高斯分布背景模型原理 背景差分法的关键是背景图像的描述模型即背景模型,它是背景差分法分割运动前景的基础。背景模型主要有单模态和多模态两种,前者在每个背景像素点上的颜色分布比较集中,可以用单分布概率模型来描述,后者的分布则比较分散,需要用多分布概率模型来共同描述。在许多应用场景,如水面的波纹、摇摆的树枝,飘扬的红旗、监视器屏幕等,像素点的值都呈现出多模态特性。最常用的描述场景背景点颜色分布的概率密度模型(概率密度分布)是高斯分布(正态分布)。 1 单高斯分布背景模型 单高斯分布背景模型适用于单模态背景情形, 它为每个图象点的颜色建立了用单个高斯分布表示的模型) ,(,t t x N σμ其中下标t 表示时间。设图象点的当前颜色度量为t X ,若(,,)ttt p N X T μσ ≤ (这里p T 为概率阈值) , 则该点被判定为前景点, 否则为背景点(这时又称t X 与) ,(,t t x N σμ相匹配)。 在常见的一维情形中, 以t σ表示均方差, 则常根据/t t d σ的取值 设置前景检测阈值:若/t t d T σ>,则该点被判定为前景点, 否则为背 景点。 单高斯分布背景模型的更新即指各图象点高斯分布参数的更新。引入表示更新快慢的常数——更新率α, 则该点高斯分布参数的更新可表示为 1(1)t t t d μαμα+=-?+? (1)

21(1)t t t d σασα+=-?+? (2) 单高斯背景模型能处理有微小变化与慢慢变化的简单场景,当较复杂场景背景变化很大或发生突变,或者背景像素值为多峰分布(如微小重复运动)时,背景像素值的变化较快,并不是由一个相对稳定的单峰分布渐渐过度到另一个单峰分布,这时单高斯背景模型就无能为力,不能准确地描述背景了。]1[ 2 混合高斯分布背景模型 与单高斯背景模型不同,混合高斯背景模型对每个像素点用多个高斯模型混合表示。设用来描述每个像素的高斯分布共K 个(K 通常取 3—5个),象素uv Z 的概率函数: ,,,1()(,,)K u v j u v u v j u v j u v j P Z N Z ωμ ==∑∑ 其中,j uv ω是第j 个高斯分布的权值, 背景建模和更新过程(仅针对单个像素): 1.初始化:第一个高斯分布用第一帧图像该点的像素值作为均值或前N 帧图像该点的像素值的平均值作为均值,并对该高斯分布的权值取较大值(比其它几个高斯分布大)。其余的高斯分布的均值均为0,权重相等,所有高斯函数的方差取相等的较大值。 2.权值归一化 3.选取背景

正态分布附其经典习题及答案

25.3正态分布 【知识网络】 1、取有限值的离散型随机变量均值、方差的概念; 2、能计算简单离散型随机变量的均值、方差,并能解决一些实际问题; 3、通过实际问题,借助直观(如实际问题的直观图),认识正态分布、曲线的特点及曲线所表示的意义。 【典型例题】 例1:(1)已知随机变量X 服从二项分布,且E (X )=2.4,V (X )=1.44,则二项分布的参数n ,p 的值为 ( ) A .n=4,p=0.6 B .n=6,p=0.4 C .n=8,p=0.3 D .n=24,p=0.1 答案:B 。解析:()4.2==np X E ,()44.1)1(=-=p np X V 。 (2)正态曲线下、横轴上,从均数到∞+的面积为( )。 A .95% B .50% C .97.5% D .不能确定(与标准差的大小有关) 答案:B 。解析:由正态曲线的特点知。 (3)某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是() A 32 B 16 C 8 D 20 答案:B 。解析:数学成绩是X —N(80,102 ), 8080 9080(8090)(01)0.3413,480.3413161010P X P Z P Z --??≤≤=≤≤=≤≤≈?≈ ???。 (4)从1,2,3,4,5这五个数中任取两个数,这两个数之积的数学期望为___________。 ∴ (5)如图,两个正态分布曲线图: 1为)(1 ,1x σμ?,2为)(22x σμ?, 则1μ2μ,1σ2σ(填大于,小于) 答案:<,>。解析:由正态密度曲线图象的特征知。 例2 :甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才算合格. (Ⅰ)求甲答对试题数ξ的概率分布及数学期望; (Ⅱ)求甲、乙两人至少有一人考试合格的概率. 答案:解:(Ⅰ)依题意,甲答对试题数ξ的概率分布如下: 甲答对试题数ξ的数学期望 E ξ=5 9 61321210313010=?+?+?+? . (Ⅱ)设甲、乙两人考试合格的事件分别为A 、B ,则

正态性检验的几种方法

正态性检验的几种方法 一、引言 正态分布是自然界中一种最常见的也是最重要的分布。因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否成立,牵涉到正态性检验。目前,正态性检验主要有三类方法:一是计算综合统计量,如动差法、Shapiro-Wilk 法(W 检验)、D ’Agostino 法(D 检验)、Shapiro-Francia 法(W ’检验)。二是正态分布的拟合优度检验,如2χ检验、对数似然比检验、Kolmogorov-Smirov 检验。三是图示法(正态概率图Normal Probability plot),如分位数图(Quantile Quantile plot ,简称QQ 图)、百分位数(Percent Percent plot ,简称PP 图)和稳定化概率图(Stablized Probability plot ,简称SP 图)等。而本文从不同角度出发介绍正态性检验的几种常见的方法,并且就各种方法作了优劣比较,还进行了应用。 二、正态分布 2.1 正态分布的概念 定义1若随机变量X 的密度函数为 ()()()+∞∞-∈= -- ,,21 2 2 2x e x f x σμπ σ 其中μ和σ为参数,且()0,,>+∞∞-∈σμ 则称X 服从参数为μ和σ的正态分布,记为()2,~σμN X 。 另我们称1,0==σμ的正态分布为标准正态分布,记为()1,0~N X ,标准正态分布随机变量的密度函数和分布函数分别用()x ?和()x Φ表示。 引理1 若()2,~σμN X ,()x F 为X 的分布函数,则()?? ? ??-Φ=σμx x F 由引理可知,任何正态分布都可以通过标准正态分布表示。 2.2 正态分布的数字特征

正态分布定义 (2)

正态分布 科技名词定义 中文名称:正态分布 英文名称:normal distribution 定义1:概率论中最重要的一种分布,也是自然界最常见的一种分布。该分布由两个参数——平均值和方差决定。概率密度函数曲线以均值为对称中线,方差越小,分布越集中在均值附近。 所属学科:生态学(一级学科);数学生态学(二级学科) 定义2:一种最常见的连续性随机变量的概率分布。 所属学科:遗传学(一级学科);群体、数量遗传学(二级学科) 本内容由全国科学技术名词审定委员会审定公布 百科名片

编辑本段 正态分布的由来 normal distribution 正态分布 一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。 正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中

正态分布练习题(含部分答案)

正 态分布练习题1 正态分布1.1正态函数及曲线特点 1.(对称性):已知随机变量ξN (2,32)。若P (ξ>C +1)=P (ξ

SPSS统计分析1:正态分布检验.

正态分布检验 一、正态检验的必要性[1] 当对样本是否服从正态分布存在疑虑时,应先进行正态检验;如果有充分的理论依据或根据以往积累的信息可以确认总体服从正态分布时,不必进行正态检验。 当然,在正态分布存疑的情况下,也就不能采用基于正态分布前提的参数检验方 法,而应采用非参数检验。 二、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 Q-Q图为佳,效率较高。 以上两种方法以 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 三、计算法 1、峰度(Kurtosis)和偏度(Skewness) (1)概念解释 峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比

较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异 程度越大。 峰度的具体计算公式为: 注:SD就是标准差σ。峰度原始定义不减3,在SPSS中为分析方便减3后与0作比较。 偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。 偏度的具体计算公式为: 各种正态分布,尽管μ和σ可以分别取不同的值,但偏度都等于0,峰度都等于3,它们的密度函数曲线的形状都是一样的[1]。(SPSS中峰度减3与0比较 (2)适用条件 样本含量应大于200。 (3)检验方法 计算得到的峰度、偏度根据正态分布的值3、0(SPSS中为0、0)来直观判断是 否接近。 应对二者分别进行U检验来定量描述显著性,方法如下[2]:峰度U检验:|峰度-3| / 峰度标准差 <= U0.05 = 1.96(SPSS中将3替换为0)偏度U检验:|偏度-0| / 偏度标准差 <= U0.05 = 1.96 如果上述都成立,则可认为在0.05显著水平符合正态分布(下例偏度可判断不符合。

SPSS检验正态分布

下面我们来看一组数据,并检验“期初平均分” 数据是否呈正态分布(此数据已在SPSS里输入好) 在SPSS里执行“分析—>描述统计—>频数统计表”(菜单见下图,英文版的可以找到相应位置),然后弹出左边的对话框,变量选择左边的“期初平均分”,再点下面的“图表”按钮,弹出图中右边的对话框,选择“直方图”,并选中“包括正态曲线”

设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看最下面的图,见下图, 上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数据符合正态分布呢,光看曲线还不够,还需要检验:

检验方法一:看偏度系数和峰度系数 我们把SPSS结果最上面的一个表格拿出来看看(见下图): 偏度系数Skewness=-0.333;峰度系数Kurtosis=0.886;两个系数都小于1,可认为近似于正态分布。 检验方法二:单个样本K-S检验 在SPSS里执行“分析—>非参数检验—>单个样本K-S检验,弹出对话框,检验变量选择“期初平均分”,检验分布选择“正态分布”,然后点“确定”。 检验结果为:

从结果可以看出,K-S检验中,Z值为0.493,P值(sig 2-tailed)=0.968>0.05,因此数据呈近似正态分布 检验方法三:Q-Q图检验 在SPSS里执行“图表—>Q-Q图”,弹出对话框,见下图: 变量选择“期初平均分”,检验分布选择“正态”,其他选择默认,然后点“确定”,最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见下图。

正态分布检验

Shapiro-Wilk 检验含义:Shapiro —Wilk 检验法是S.S.Shapiro 与 M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平a ,以及根据样本量为n时所对应的系数a i,根据特定公式计算出检验统计量W.最后查特定的正态性W检 验临界值表,比较它们的大小,满足条件则接受假设认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布? W检验全称Shapiro-Wilk检验,是一种基于相关性的算法。计算可得到一个相关系数,它越接近1就越表明数据和正态分布拟合得越好。 w检验是检验样本容量8< n < 50,样本是否符合正态分布的一种方法。 计算式为: E-Lj k -訓 其检验步骤如下: ①将数据按数值大小重新排列,使x1W,接受正态性假设。

正态分布是许多检验的肚础,比如F检验,t检验,卡方检验等在总体不是正太分布是没有任何盘义。因此,対一个样本是否来口正态总、体的检验是至关巫要的。当然,我们无法证明某个数据的确来口正态总体,但如果使用效率高的检验还?无法否认总体是正太的检验,我『]就没有理山否认那些和正太分布有关的检验有意义,下而我就对正态性检验方法进行简单的归纳和比较。 一.图示法 1.P-P 图 以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,以样本值表现为直角坐标系的散点。如果数据服从 F态分布,则样本点应鬧绕第一象限的对角线分布。 2.Q-Q 图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一彖限的对角线分布。 以上两种方法以Q-Q图为佳,效率较高。 3.直方图 判断方法:是否以钟型分布,同时可以选择输出正态性曲线。 4.箱线图 判断方法;观察矩形位置利中位数,若矩形位于中间位置且中位数位于矩形的中间位迓,则分布较为对称,否则是偏态分布。 5.茎叶图

正态分布练习习题.docx

1.标准正态曲线下,中间95% 的面积所对应的横轴范 围是。 A .-∞到 +1.96 B .- 1.96 到 +1.96 C .-∞到 +2.58 D.- 2.58 到 +2.58E.- 1.64 到 +1.64 2.正态分布的两个参数μ与σ,对应的正态曲线愈趋扁平。 A .μ愈大B.μ愈小 C .σ愈大D.σ愈小E.μ愈小且σ愈小 3.正态分布的两个参数μ与σ,对应的正态曲线平行右移。 A .增大μB.减小μC.增大σ D .减小σE.增大μ同时增大σ 4.观察某地100 名 12 岁男孩身高,均数为138.00cm ,标准差为 4.12cm, Z= ( 128.00- 138.00) /4.12。φ( Z)是标准正态分布的分布函数,1-φ( Z ) =1 -φ(- 2.43)=0.9925,结论是。 A .理论上身高低于138.00cm 的 12 岁男孩占99.25% 。 B.理论上身高高于138.00cm 的 12 岁男孩占99.25% 。 C.理论上身高在128.00cm 至 138.00cm 的 12 岁男孩占99.25% 。

D.理论上身高低于128.00cm 的 12 岁男孩占99.25% 。 E.理论上身高高于128.00cm 的 12 岁男孩占99.25% 。5.正态曲线下、横轴上,从μ到μ+2.58σ的面积占曲线下总面积的。 A .99%B.95%C.47.5% D .49.5% E. 90% 6.健康男子收缩压的正常值范围一般指。 A.所有健康成年男子收缩压的波动范围 B.绝大多数正常成年男子收缩压的波动范围 C.所有正常成年男子收缩压的波动范围 D.少部分正常成年男子收缩压的波动范围 E.所有正常人收缩压的波动范围 7.标准正态分布曲线下中间90% 的面积所对应的横轴 尺度 Z 的范围是。 A .- 1.645~1.645B.-∞~ 1.645C.-∞~ 1.282 D.- 1.282~1.282E.- 1.96~ 1.96 8.在正态曲线,下列关于μ- 1.645 σ的说法正确的是。 A .μ- 1.645σ到曲线对称轴的面积为90% B.μ-1.645σ到曲线对称轴的面积为10%

如何检验数据是否服从正态分布

一、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g 1表示偏度,g 2 表示峰度,通过计算g1和g2及其标准误σ g1 及σ g2 然后作U 检验。两种检验同时得出U<=,即p>的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。 2、非参数检验方法

非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W检验)。 SAS中规定:当样本含量n≤2000时,结果以Shapiro – Wilk(W检验)为准,当样本含量n >2000时,结果以Kolmogorov – Smirnov(D检验)为准。 SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro – Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本Kolmogorov-Smirnov检验可用于检验变量(例如income)是否为正态分布。 对于此两种检验,如果P值大于,表明资料服从正态分布。 三、SPSS操作示例 SPSS中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的操作: 1、工具栏--分析—描述性统计—探索性 2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项(Both)。 3、Output结果 (1)Descriptives:描述中有峰度系数和偏度系数,根据上述判断标准,数据不符合正态分布。 S k =0,K u =0时,分布呈正态,Sk>0时,分布呈正偏态,Sk<0时,分布呈负偏 态,时,Ku>0曲线比较陡峭,Ku<0时曲线比较平坦。由此可判断本数据分布为正偏态(朝左偏),较陡峭。 (2)Tests of Normality:D检验和W检验均显示数据不服从正态分布,当然在此,数据样本量为1000,应以W检验为准。

相关主题