搜档网
当前位置:搜档网 › 正态分布练习题

正态分布练习题

正态分布练习题
正态分布练习题

正态分布

1.设随机变量ξ服从标准正态分布()0,1N ,若()1P p ξ>=,则()10P ξ-<<=() A. 2p

B. 1p -

C. 12p -

D. 1

2p -

2.设随机变量),(~2σμξN ,且 )()(c P c P >=≤ξξ,则c 等于( )

μμσ...0.D C B A -

3.设ξ的概率密度函数为2

)1(2

21)(--=x e x f π,则下列结论错误的是( )

(A) )1()1(>=<ξξp p (B))11()11(<<-=≤≤-ξξp p

(C))(x f 的渐近线是0=x (D) 1-=ξη~)1,0(N

4.设随机变量ξ服从正态分布()0,1N ,记()()<x P x ξΦ=,则下列结论不正确的是(

) ^

A .()1

02Φ= B .()()1x x Φ=-Φ-

C .()()()<21>0P a a a ξ=Φ-

D .()()()>1>0P a a a ξ=-Φ

5.设随机变量),(~2σμξN ,且1,3==ξξD E ,则)11(≤<-ξP =( )

1)2(2.)4()2(.)2()4(.1)1(2.-ΦΦ-ΦΦ-Φ-ΦD C B A

6.如果随机变量)1,0(~N ξ,),(~2σμηN ,那么 =η( )

)(....μξσμσξμσξσμ

ξ++--D C B A

7.已知随机变量ξ服从正态分布2(2)N σ,,(4)0.84P ξ=≤,则(0)P ξ=≤( )

A .0.16

B .0.32

C .0.68

D ,0.84

8.设随机变量ξ服从正态分布(2,9)N ,若(1)(1)P c P c ξξ>+=<-,则c = ( )

B.2

9.已知随机变量ζ服从正态分布N (3,a 2),则P (3)ζ<=( )

(A)15 (B)14 (C)13 (D)12

10.若φ(3)=,则标准正态总体在区间(-3,3)内取值的概率为 ()

A .

B .0.9974

C .

D .

11.下图是正态分布N ∽(0,1)的正态分布曲线图,下面4个式子中,能表示图中阴影部分面积的有( )个

①1()2a φ-- ② ()a φ- ③1()2a φ- 1[()()]2a a φφ-- (A)1 (B)2 (C)3 (D)4 12.设两个正态分布2111()(0)N μσσ>,和2222()(N μσσ,的密度函数图像如图所示。

则有( )

A .1212,μμσσ<<

B .1212,μμσσ<>

C .1212,μμσσ><

D .1212,μμσσ>>

[

13.设随机变量ξ服从正态分布N (μ,δ2)(δ>0),若P (ξ<0)+P (ξ<1)=1,则μ的

值为 ( )

A .-1

B .1

C .1

2- D .1

2

14以()x Φ表示标准正态总体在区间(),x -∞内取值的概率,若随机变量ξ服从正态分布()2,N μσ,则概率()P ξμσ-<等于( )

A.()()μσμσΦ+-Φ-

B. ()()11Φ-Φ-

C. 1μσ-??Φ ???

D. ()2μσΦ+ 15.设随机变量ξ服从标准正态分布()0,1N 。已知()1.960.025Φ-=,则()1.96P ξ<=( )

A. 0.025

B. 0.050

C.

D.

16.分别求正态总体),(2σμN 在

),(σμσμ+-,)2,2(σμσμ+-,)3,3(σμσμ+-,内取值的概率

y { -a x

17.已知正态总体 )4,1(N ,(1)求取值小于3的概率;(2)求取值的绝对值不大于3的概率.

18、若~N(0,1),且令φ(x)=P(≤x),判断下列等式是否成立:

(1)φ(-x)=1-φ(x);(2)P(||≤x)=1-2φ(x);

(3)P(||≤x)=2φ(x)-1;(4)P(||>x)=2[1-φ(x)]。

19.设2

~(1,2)N ξ,试求:(1)(13)P ξ-<≤;(2)(35)P ξ<≤;(3)(5).P ξ≥

20.在某项测量中,测量结果X 服从正态分布N (1,σ2)(σ>0),若X 在(0,1)内取值的概率为,则X 在(0,2)内取值的概率为________.

?

、B 两个投资项目的利润率分别为随机变量X 1和X 2。根据市场分析,X 1和X 2的分布列分别为 X 1 5% 10% X 2 ;

2% 8% 12%

P P

(1)在A 、B 两个项目上各投资100万元,Y 1和Y 2分别表示投资项目A 和B 所获得的利润,求方差DY 1、DY 2;(2)将x (0≤x ≤100)万元投资A 项目,100-x 万元投资B 项目,f(x)表示投资A 项目所得利润的方差与投资B 项目所得利润的方差的和。求f(x)的最小值,并指出x 为何值时,f(x)取到最小值。 (注:D(aX + b) = a 2

DX )

正态分布练习含答案

正态分布 一.选择题: 1.正态分布有两个参数μ与σ,( )相应的正态曲线的形状越扁平。 A .μ越大 B .μ越小 C .σ越大 D .σ越小 答案: C 。解析:由正态密度曲线图象的特征知。 2. 已知随机变量X 服从正态分布N (3,σ2)则P (X <3)等于 ( ) A.15 B.14 C.13 D.12 解析:由正态分布图象知,μ=3为该图象的对称轴,P (X <3)=P (X >3)=12 . 答案:D 3.设两个正态分布N (μ1,σ21)(σ1>0)和N (μ2,σ22)(σ2>0)的密度函数图象如图所示,则有 ( ) A .μ1<μ2,σ1<σ2 B .μ1<μ2,σ1>σ2 C .μ1>μ2,σ1<σ2 D .μ1>μ2,σ1>σ2 解析:由图可知,μ2>μ1,且σ2>σ1. 答案:A 4.设随机变量ξ服从正态分布)1,0(N ,则下列结论不正确的是 。 A .)0)(|(|)|(|)|(|>=+<=-<=<-=>-=

如何检验数据是否服从正态分布

如何检验数据是否服从正态分布呢 法一:在SPSS中,正态分布的检验方法有:计算偏度系数(Skewness)和峰度系数(Kurtosis)、Kolmogorov-Smirnov检验(KS检验或D检验)、Shapiro-Wilk(SW检验或W检验)、直方图、QQ图等。 下面本葱通过具体例子给大家介绍如何用SPSS检验数据是否为正态分布: 首先需要有一组数据,如:74 75 78 77 80 80 90 76 62 79,按下述格式输入SPSS 中。 依此点击分析-描述统计-描述 就会看到下述图片,点击绘制,我们可以选择输出图片(茎叶图、直方图),如果想要输出图片,在输出应该选择两者都。选择确定,就可以看到结果了。 输出结果如何解读?

此表,是对数据的统计描述,我们可以关注下最下方的偏度(Skewness)和峰度(Kurtosis)。 偏度SK越趋近0,数据越服从正态分布,众数=中位数=平均数;SK>0,为正偏态或左偏,众数<中位数<平均数;SK<0,为负偏态或右偏,众数>中位数>平均数。 峰度KG越趋近3,数据越服从正态分布;KG>3,峰度尖锐;KG<3,峰度扁平。(或exceess_KG=KG-3,exceess_KG越趋近0,数据越服从正态分布) 但是仅根据偏度和峰度还不足以判断数据是否服从正态分布,需要做进一步的检验。

上表是生成的KS检验(D检验)和SW检验(W检验)的检验结果,此处我们关注的显著性是Sig.即P值。当P>0.05时,可以认为数据是呈正态分布的。数据分析师培训由上表可以看出,KS检验和SW检验显著性均>0.05。 由于样本数量为10,小样本时关注SW检验的结果,所以此处显著性0.145,可以认为数据是正态分布的。 在输出结果部分还可以生成直方图、茎叶图、QQ图等,可以根据图形做出观测,若要检验是否服从正态分布还是需要用算法进行检测。 法二: 结果可见: One-Sample Kolmogorov-Smirnov Test KW胸水 N79

正态分布及其经典习题和答案

正态分布讲义 【知识网络】 1、取有限值的离散型随机变量均值、方差的概念; 2、能计算简单离散型随机变量的均值、方差,并能解决一些实际问题; 3、通过实际问题,借助直观(如实际问题的直观图),认识正态分布、曲线的特点及曲线所表示的意义。 【典型例题】 例1:(1)已知随机变量X 服从二项分布,且E (X )=2.4,V (X )=1.44,则二项分布的参数n ,p 的值为 ( ) A .n=4,p=0.6 B .n=6,p=0.4 C .n=8,p=0.3 D .n=24,p=0.1 答案:B 。解析:()4.2==np X E ,()44.1)1(=-=p np X V 。 (2)正态曲线下、横轴上,从均数到∞+的面积为( )。 A .95% B .50% C .97.5% D .不能确定(与标准差的大小有关) 答案:B 。解析:由正态曲线的特点知。 (3)某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是 ( ) A 32 B 16 C 8 D 20 答案:B 。解析:数学成绩是X —N(80,102 ), 8080 9080(8090)(01)0.3413,480.3413161010P X P Z P Z --??≤≤=≤≤=≤≤≈?≈ ??? 。 (4)从1,2,3,4,5这五个数中任取两个数,这两个数之积的数学期望为___________ 。 答案:8.5。解析:设两数之积为X , ∴E(X)=8.5. (5)如图,两个正态分布曲线图: 1为)(1 ,1x σμ?,2为)(22x σμ? , 则1μ 2μ,1σ 2σ(填大于,小于) 答案:<,>。解析:由正态密度曲线图象的特征知。 例2:甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才算合格. (Ⅰ)求甲答对试题数ξ的概率分布及数学期望; (Ⅱ)求甲、乙两人至少有一人考试合格的概率. 答案:解:(Ⅰ)依题意,甲答对试题数ξ的概率分布如下: 甲答对试题数ξ的数学期望 E ξ=5 9 61321210313010=?+?+?+? . (Ⅱ)设甲、乙两人考试合格的事件分别为A 、B ,则

总结正态性检验的几种方法

总结正态性检验的几种方法 1.1 正态性检验方法 1)偏度系数 样本的偏度系数(记为1g )的计算公式为 ()233133 1(1)(2)(1)(2)n i i n n g x x n n s n n s μ==-=----∑, 其中s 为标准差,3μ为样本的3阶中心距,即()331 1n i i x x n μ==-∑。 偏度系数是刻画数据的对称性指标,关于均值对称的数据其偏度系数为0,右侧更分散的数据偏度系数为正,左侧更分散的数据偏度系数为负。 (2)峰度系数 样本的峰度系数(记为2g ),计算公式为 ()2424 122 44(1)(1)3(1)(2)(3)(2)(3)(1)(1)3(1)(2)(3)(2)(3)n i i n n n g x x n n n s n n n n n n n n s n n μ=+-=-------+-=------∑, 其中s 为标准差,4μ为样本的3阶中心距,即()441 1n i i x x n μ==-∑。 当数据的总体分布为正态分布时,峰度系数近似为0,;当分布为正态分布的尾部更分散时,峰度系数为正;否则为负。当峰度系数为正时,两侧极端数据较多,当峰度系数为负时,两侧极端数据较少。 (3)QQ 图 QQ 图可以帮助我们鉴别样本的分布是否近似于某种类型的分布。现假设总体为正态分布()2 ,N μσ,对于样本12,,,n x x x L ,其顺序统计量是(1)(2)(),,,n x x x L 。设()x Φ为标准正 态分布()0,1N 的分布函数,1 ()x -Φ是反函数,对应正态分布的QQ 图是由以下的点 1()0.375,,1,2,,0.25i i x i n n -??-??Φ= ? ?+???? L , 构成的散点图,若样本数据近似为正态分布,在QQ 图上这些点近似地在直线上 y x σμ=+, 附近,此直线的斜率是标准差σ,截距式均值,μ,所以利用正态QQ 图可以做直观的正态性检验。若正态QQ 图上的点近似地在一条直线上,可以认为样本的数据来自正态分布总

如何检验数据是否服从正态分布

如何检验数据是否服从正态分布 一、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误σg1及σg2然后作U检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。 2、非参数检验方法 非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk(W 检验)。 SAS中规定:当样本含量n≤2000时,结果以Shapiro – Wilk(W检验)为准,当样本含量n >2000时,结果以Kolmogorov – Smirnov(D检验)为准。 SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3和5000之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro –Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本Kolmogorov-Smirnov检验可用于检验变量(例如income)是否为正态分布。 对于此两种检验,如果P值大于0.05,表明资料服从正态分布。 三、SPSS操作示例

高二数学 正态分布练习题

正态分布 ㈠ 知识点回顾: 1、正态分布概念:若连续型随机变量ξ的概率密度函数为 ),(,21)(2 22)(∞+-∞∈= --x e x f x σμσ π, 其中,σμ为常数,且0σ>,则称ξ服从正态分布,简记为ξ~()2,N μσ。 ()f x 的图象称为正态曲线。 2、正态分布的期望与方差 若ξ~()2,N μσ,则2,E D ξμξσ== 3、正态曲线的性质: ①曲线在x 轴的上方,与x 轴不相交. ②曲线关于直线x=μ对称. ③曲线在x=μ时位于最高点. ④当x<μ时,曲线上升;当x>μ时,曲线下降.并且当曲线向左、右两边无限延伸时,以 x 轴为渐进线,向它无限靠近. ⑤当μ一定时,曲线的形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越分散;σ 越小,曲线越“瘦高”,表示总体的分布越集中. 4、在标准正态分布表中相应于0x 的值()0x Φ是指总体取值小于0x 的概率即 ()()00x P x x Φ=< 00≥x 时,则)(0x Φ的值可在标准正态 分布表中查到 00

x y O (6)、()2,N μσ与()0,1N 的关系: ①若ξ~()2,N μσ,有()()000x P x F x μξσ-??<==Φ ??? ②若ξ~()2,N μσ,则()2112x x P x x x μμσσ--???? <<=Φ-Φ ? ????? (二)习题 一、选择题 1.某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为 )(10 21 )(200 )80(2R x e x f x ∈?= --π,则下列命题不正确的是 ( B ) A .该市这次考试的数学平均成绩为80分; B .分数在120分以上的人数与分数在60分以下的人数相同; C .分数在110分以上的人数与分数在50分以下的人数相同; D .该市这次考试的数学成绩标准差为10. 2.设随机变量ξ服从标准正态分布()0,1N ,若()1P p ξ>=,则()10P ξ-<<=(D ) A. 2 p B. 1p - C. 12p - D. 12p - 3.设随机变量),(~2σμξN ,且 )()(c P c P >=≤ξξ,则c 等于( D ) μμσ...0.D C B A - 4. 已知正态分布曲线关于y 轴对称,则μ值为( ) A .1 B .-1 C .0 D.不确定 5.正态分布N (0,1)在区间(-2,-1)和(1,2)上的取值的概率分别为12,p p ,则12,p p 的大小关系为( ) A .12p p < B .12p p > C .12p p = D.不确定 6.设随机变量),(~2σμξN ,且1,3==ξξD E ,则)11(≤<-ξP =( B ) 1)2(2.)4()2(.)2()4(.1)1(2.-ΦΦ-ΦΦ-Φ-ΦD C B A 7.已知随机变量ξ服从正态分布2(2)N σ,,(4)0.84P ξ=≤,则(0)P ξ=≤( A ) A .0.16 B .0.32 C .0.68 D ,0.84 8.设随机变量ξ服从正态分布(2,9)N ,若(1)(1)P c P c ξξ>+=<-,则c = ( B ) A.1 B.2 C.3 D.4 9.已知随机变量ζ服从正态分布N (3,a 2),则P (3)ζ<=( D ) (A)15 (B)14 (C)13 (D)12 1 x 2 x )(0x Φ) (10x -Φ-

正态性检验的几种方法

正态性检验的几种方法 一、引言 正态分布是自然界中一种最常见的也是最重要的分布。因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否成立,牵涉到正态性检验。目前,正态性检验主要有三类方法:一是计算综合统计量,如动差法、Shapiro-Wilk 法(W 检验)、D ’Agostino 法(D 检验)、Shapiro-Francia 法(W ’检验)。二是正态分布的拟合优度检验,如2χ检验、对数似然比检验、Kolmogorov-Smirov 检验。三是图示法(正态概率图Normal Probability plot),如分位数图(Quantile Quantile plot ,简称QQ 图)、百分位数(Percent Percent plot ,简称PP 图)和稳定化概率图(Stablized Probability plot ,简称SP 图)等。而本文从不同角度出发介绍正态性检验的几种常见的方法,并且就各种方法作了优劣比较,还进行了应用。 二、正态分布 2.1 正态分布的概念 定义1若随机变量X 的密度函数为 ()()()+∞∞-∈= -- ,,21 2 2 2x e x f x σμπ σ 其中μ和σ为参数,且()0,,>+∞∞-∈σμ 则称X 服从参数为μ和σ的正态分布,记为()2,~σμN X 。 另我们称1,0==σμ的正态分布为标准正态分布,记为()1,0~N X ,标准正态分布随机变量的密度函数和分布函数分别用()x ?和()x Φ表示。 引理1 若()2,~σμN X ,()x F 为X 的分布函数,则()?? ? ??-Φ=σμx x F 由引理可知,任何正态分布都可以通过标准正态分布表示。 2.2 正态分布的数字特征

正态分布综合测试题(附答案)

正态分布综合测试题(附答案) 选修2-32.4正态分布 一、选择题 1.下列函数中,可以作为正态分布密度函数的是() A.f(x)=12πe-(x-1)22 B.f(x)=12π?σe(x-2)22σ2 C.f(x)=12πσe-(x-μ)22σ2 D.f(x)=12πe-(x-μ)22π 答案]A 2.已知ξ~N(0,62),且P(-2≤ξ≤0)=0.4,则P(ξ>2)等于() A.0.1B.0.2 C.0.6D.0.8 答案]A 解析]由正态分布曲线的性质知P(0≤ξ≤2)=0.4,∴P(-2≤ξ≤2)=0.8,∴P(ξ>2)=12(1-0.8)=0.1,故选A. 3.若随机变量ξ~N(2,100),若ξ落在区间(-∞,k)和(k,+∞)内的概率是相等的,则k等于() A.2B.10 C.2D.可以是任意实数 答案]A 解析]由于ξ的取值落在(-∞,k)和(k,+∞)内的概率是相等的,所以

正态曲线在直线x=k的左侧和右侧与x轴围成的面积应该相等,于是正态曲线关于直线x=k对称,即μ=k,而μ=2.∴k=2. 4.已知一次考试共有60名同学参加,考生的成绩X~N(110,52),据此估计,大约应有57人的分数在下列哪个区间内() A.(90,110]B.(95,125] C.(100,120]D.(105,115] 答案]C 解析]由于X~N(110,52),∴μ=110,σ=5. 因此考试成绩在区间(105,115],(100,120],(95,125]上的概率分别应是0.6826,0.9544,0.9974. 由于一共有60人参加考试, ∴成绩位于上述三个区间的人数分别是: 60×0.6826≈41人,60×0.9544≈57人, 60×0.9974≈60人. 5.(2010?山东理,5)已知随机变量ξ服从正态分布N(0,σ2),P(ξ>2)=0.023,则P(-2≤ξ≤2)=() A.0.477B.0.628 C.0.954D.0.977 答案]C 解析]∵P(ξ>2)=0.023,∴P(ξ故P(-2≤ξ≤2)=1-P(ξ>2)-P(ξ6.以φ(x)表示标准正态总体在区间(-∞,x)内取值的概率,若随机变量ξ服从正

正态分布附其经典习题及答案

25.3正态分布 【知识网络】 1、取有限值的离散型随机变量均值、方差的概念; 2、能计算简单离散型随机变量的均值、方差,并能解决一些实际问题; 3、通过实际问题,借助直观(如实际问题的直观图),认识正态分布、曲线的特点及曲线所表示的意义。 【典型例题】 例1:(1)已知随机变量X 服从二项分布,且E (X )=2.4,V (X )=1.44,则二项分布的参数n ,p 的值为 ( ) A .n=4,p=0.6 B .n=6,p=0.4 C .n=8,p=0.3 D .n=24,p=0.1 答案:B 。解析:()4.2==np X E ,()44.1)1(=-=p np X V 。 (2)正态曲线下、横轴上,从均数到∞+的面积为( )。 A .95% B .50% C .97.5% D .不能确定(与标准差的大小有关) 答案:B 。解析:由正态曲线的特点知。 (3)某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是() A 32 B 16 C 8 D 20 答案:B 。解析:数学成绩是X —N(80,102 ), 8080 9080(8090)(01)0.3413,480.3413161010P X P Z P Z --??≤≤=≤≤=≤≤≈?≈ ???。 (4)从1,2,3,4,5这五个数中任取两个数,这两个数之积的数学期望为___________。 ∴ (5)如图,两个正态分布曲线图: 1为)(1 ,1x σμ?,2为)(22x σμ?, 则1μ2μ,1σ2σ(填大于,小于) 答案:<,>。解析:由正态密度曲线图象的特征知。 例2 :甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才算合格. (Ⅰ)求甲答对试题数ξ的概率分布及数学期望; (Ⅱ)求甲、乙两人至少有一人考试合格的概率. 答案:解:(Ⅰ)依题意,甲答对试题数ξ的概率分布如下: 甲答对试题数ξ的数学期望 E ξ=5 9 61321210313010=?+?+?+? . (Ⅱ)设甲、乙两人考试合格的事件分别为A 、B ,则

SPSS统计分析1:正态分布检验.

正态分布检验 一、正态检验的必要性[1] 当对样本是否服从正态分布存在疑虑时,应先进行正态检验;如果有充分的理论依据或根据以往积累的信息可以确认总体服从正态分布时,不必进行正态检验。 当然,在正态分布存疑的情况下,也就不能采用基于正态分布前提的参数检验方 法,而应采用非参数检验。 二、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 Q-Q图为佳,效率较高。 以上两种方法以 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 三、计算法 1、峰度(Kurtosis)和偏度(Skewness) (1)概念解释 峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比

较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异 程度越大。 峰度的具体计算公式为: 注:SD就是标准差σ。峰度原始定义不减3,在SPSS中为分析方便减3后与0作比较。 偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。 偏度的具体计算公式为: 各种正态分布,尽管μ和σ可以分别取不同的值,但偏度都等于0,峰度都等于3,它们的密度函数曲线的形状都是一样的[1]。(SPSS中峰度减3与0比较 (2)适用条件 样本含量应大于200。 (3)检验方法 计算得到的峰度、偏度根据正态分布的值3、0(SPSS中为0、0)来直观判断是 否接近。 应对二者分别进行U检验来定量描述显著性,方法如下[2]:峰度U检验:|峰度-3| / 峰度标准差 <= U0.05 = 1.96(SPSS中将3替换为0)偏度U检验:|偏度-0| / 偏度标准差 <= U0.05 = 1.96 如果上述都成立,则可认为在0.05显著水平符合正态分布(下例偏度可判断不符合。

正态分布检验

Shapiro-Wilk 检验含义:Shapiro —Wilk 检验法是S.S.Shapiro 与 M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平a ,以及根据样本量为n时所对应的系数a i,根据特定公式计算出检验统计量W.最后查特定的正态性W检 验临界值表,比较它们的大小,满足条件则接受假设认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布? W检验全称Shapiro-Wilk检验,是一种基于相关性的算法。计算可得到一个相关系数,它越接近1就越表明数据和正态分布拟合得越好。 w检验是检验样本容量8< n < 50,样本是否符合正态分布的一种方法。 计算式为: E-Lj k -訓 其检验步骤如下: ①将数据按数值大小重新排列,使x1W,接受正态性假设。

正态分布是许多检验的肚础,比如F检验,t检验,卡方检验等在总体不是正太分布是没有任何盘义。因此,対一个样本是否来口正态总、体的检验是至关巫要的。当然,我们无法证明某个数据的确来口正态总体,但如果使用效率高的检验还?无法否认总体是正太的检验,我『]就没有理山否认那些和正太分布有关的检验有意义,下而我就对正态性检验方法进行简单的归纳和比较。 一.图示法 1.P-P 图 以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,以样本值表现为直角坐标系的散点。如果数据服从 F态分布,则样本点应鬧绕第一象限的对角线分布。 2.Q-Q 图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一彖限的对角线分布。 以上两种方法以Q-Q图为佳,效率较高。 3.直方图 判断方法:是否以钟型分布,同时可以选择输出正态性曲线。 4.箱线图 判断方法;观察矩形位置利中位数,若矩形位于中间位置且中位数位于矩形的中间位迓,则分布较为对称,否则是偏态分布。 5.茎叶图

正态分布练习题(含部分答案)

正 态分布练习题1 正态分布1.1正态函数及曲线特点 1.(对称性):已知随机变量ξN (2,32)。若P (ξ>C +1)=P (ξ

spss_大数据正态分布检验方法及意义要点

spss 数据正态分布检验方法及意义判读 要观察某一属性的一组数据是否符合正态分布,可以有两种方法(目前我知道这两种,并且这两种方法只是直观观察,不是定量的正态分布检验): 1:在spss里的基本统计分析功能里的频数统计功能里有对某个变量各个观测值的频数直方图中可以选择绘制正态曲线。具体如下:Analyze-----Descriptive S tatistics-----Frequencies,打开频数统计对话框,在Statistics里可以选择获得各种描述性的统计量,如:均值、方差、分位数、峰度、标准差等各种描述性统计量。在Charts里可以选择显示的图形类型,其中Histograms选项为柱状图也就是我们说的直方图,同时可以选择是否绘制该组数据的正态曲线(With nor ma curve),这样我们可以直观观察该组数据是否大致符合正态分布。如下图: 从上图中可以看出,该组数据基本符合正态分布。 2:正态分布的Q-Q图:在spss里的基本统计分析功能里的探索性分析里面可以通过观察数据的q-q图来判断数据是否服从正态分布。 具体步骤如下:Analyze-----Descriptive Statistics-----Explore打开对话框,选择Plots选项,选择Normality plots with tests选项,可以绘制该组数据的q-q 图。图的横坐标为改变量的观测值,纵坐标为分位数。若该组数据服从正态分布,则图中的点应该靠近图中直线。 纵坐标为分位数,是根据分布函数公式F(x)=i/n+1得出的.i为把一组数从小到大排序后第i个数据的位置,n为样本容量。若该数组服从正态分布则其q-q图应该与理论的q-q图(也就是图中的直线)基本符合。对于理论的标准正态分布,其q-q图为y=x直线。非标准正态分布的斜率为样本标准差,截距为样本均值。 如下图:

SPSS检验正态分布

下面我们来看一组数据,并检验“期初平均分” 数据是否呈正态分布(此数据已在SPSS里输入好) 在SPSS里执行“分析—>描述统计—>频数统计表”(菜单见下图,英文版的可以找到相应位置),然后弹出左边的对话框,变量选择左边的“期初平均分”,再点下面的“图表”按钮,弹出图中右边的对话框,选择“直方图”,并选中“包括正态曲线”

设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看最下面的图,见下图, 上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数据符合正态分布呢,光看曲线还不够,还需要检验:

检验方法一:看偏度系数和峰度系数 我们把SPSS结果最上面的一个表格拿出来看看(见下图): 偏度系数Skewness=-0.333;峰度系数Kurtosis=0.886;两个系数都小于1,可认为近似于正态分布。 检验方法二:单个样本K-S检验 在SPSS里执行“分析—>非参数检验—>单个样本K-S检验,弹出对话框,检验变量选择“期初平均分”,检验分布选择“正态分布”,然后点“确定”。 检验结果为:

从结果可以看出,K-S检验中,Z值为0.493,P值(sig 2-tailed)=0.968>0.05,因此数据呈近似正态分布 检验方法三:Q-Q图检验 在SPSS里执行“图表—>Q-Q图”,弹出对话框,见下图: 变量选择“期初平均分”,检验分布选择“正态”,其他选择默认,然后点“确定”,最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见下图。

正态性检验的一般方法汇总

正态性检验的一般方法 姓名:蓝何忠 学号:1101200203 班号:1012201 正态性检验的一般方法 【摘要】:正态分布是自然界中一种最常见的也是最重要的一种分布.因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否成立,牵涉到正态性检验.在一般性的概率统计教科书中,只是把这个

问题放在一般性的分布拟合下作简短处理,而这种万精油式的检验方法,对正态性检验不具有特效.鉴于此,该文从不同角度出发介绍正态性检验的几种常见的方法,并且就各种方法作了优劣比较, 【引言】一般实际获得的数据,其分布往往未知。在数据分析中,经常要判断一组数据的分布是否来自某一特定的分布,比如对于连续性分布,常判断数据是否来自正态分布,而对于离散分布来说,常判断是否来自二项分布.泊松分布,或判断实际观测与期望数是否一致,然后才运用相应的统计方法进行分析。 几种正态性检验方法的比较。 2?一、拟合优度检验: (1)当总体分布未知,由样本检验总体分布是否与某一理论分布一致。 H0: 总体X的分布列为p{X=}=,i=1,2,…… H1:总体 X. 的分布不为 构造统计量 为真时H0发生的理为为样本中发生的实际频数,其中论频数。2)检验原理(2?意味着对于,=,观测频数与期望频数完全一致,若=0,则即完全拟合。 2?观察频数与期望频数越接近,则值越小。 2?当原假设为真时,有大数定理,与不应有较大差异,即值应较小。

2?若值过大,则怀疑原假设。 2?拒绝域为R={d} ,判断统计量是否落入拒绝域,得出结论。 二、Kolmogorov-Smirnov正态性检验: Kolmogorov-Smirnov检验法是检验单一样本是否来自某一特定它的 检验方法是以样本数比如检验一组数据是否为正态分布。分布。. 据的累积频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。即对于假设检验问题: H0:样本所来自的总体分布服从某特定分布 H1:样本所来自的总体分布不服从某特定分布 统计原理:Fo(x)表示分布的分布函数,Fn(x)表示一组随机样本的累计概率函数。 #}n1,2,,x{x?,i?i?)F(x n n : x)差距的最大值,定义如下式Fn为Fo(x)与(D设 D=max|Fn(x)-Fo(x)| P{Dn>d}=a. a,对于给定的位健康男性在未进食前的血糖浓度如表所示,试测验这组35例如: =6的正态分布,标准差数据是否来自均值μ=80σ87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 90 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35 检验过程如下:健康成人男性血糖浓度服从正态分布 H0:假设健康成人男性血糖浓度不服从正态分布 H1: 计算过程如表:

SPSS 正态性检验方法

正态性检验方法的比较 理论部分 正态分布是许多检验的基础,比如F检验,t检验,卡方检验等在总体不是正太分布是没有任何意义。因此,对一个样本是否来自正态总体的检验是至关重要的。当然,我们无法证明某个数据的确来自正态总体,但如果使用效率高的检验还无法否认总体是正太的检验,我们就没有理由否认那些和正太分布有关的检验有意义,下面我就对正态性检验方法进行简单的归纳和比较。 一、图示法 1. P-P图 以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,以样本值表现为直角坐标系的散点。如果数据服从正态分布,则样本点应围绕第一象限的对角线分布。 2. Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一象限的对角线分布。 以上两种方法以Q-Q图为佳,效率较高。 3. 直方图(频率直方图) 判断方法:是否以钟型分布,同时可以选择输出正态性曲线。 4. 箱线图 判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布。 5. 茎叶图 判断方法:观察图形的分布状态,是否是对称分布。

二、偏度、峰度检验法(冒牌K-S 检验法): 1. S ,K 的极限分布 样本偏度系数() 3 32 2B S B =;该系数用于检验对称性,S>0时,分布呈正偏态,S<0时, 分布呈负偏态。 样本峰度系数() 4 2 23B K B = -;该系数用于检验峰态,K>0时为尖峰分布,S<0时为 扁平分布;当S=0,K=0时分布呈正态分布。 0H :F(x)服从正态分布 1H :F(x)不服从正态分布 当原假设为真时,检验统计量 ~N(0,1) ~N (0,1) 对于给定的α, R ||={| >λ?| >λ} 其中14 u α - λ= 2. Jarque-Bera 检验(偏度和峰度的联合分布检验法) 检验统计量为 JB 22164n k S K -??= + ??? ()2 2χ~,JB 过大或过小时,拒绝原假设。 三、非参数检验方法 1. Kolmogorov-Smirnov 正态性检验(基于经验分布函数(ECDF )的检验) ()()0max ||n D F x F x =- ()n F x 表示一组随机样本的累计概率函数,()0F x 表示分布的分布函数。 当原假设为真时,D 的值应较小,若过大,则怀疑原假设,从而,拒绝域为 {}R D d =>。对于给定的α,{}p P D d α=>=,又?{}n n p P D D =≥ 2. Lilliefor 正态性检验 该检验是对Kolmogorov-Smirnov 检验的修正,参数未知 时,由22??,X S μσ==可计算得检验统计量?n D 的值。 3. Shapiro-Wilk(W 检验) 检验统计量:

正态分布练习习题.docx

1.标准正态曲线下,中间95% 的面积所对应的横轴范 围是。 A .-∞到 +1.96 B .- 1.96 到 +1.96 C .-∞到 +2.58 D.- 2.58 到 +2.58E.- 1.64 到 +1.64 2.正态分布的两个参数μ与σ,对应的正态曲线愈趋扁平。 A .μ愈大B.μ愈小 C .σ愈大D.σ愈小E.μ愈小且σ愈小 3.正态分布的两个参数μ与σ,对应的正态曲线平行右移。 A .增大μB.减小μC.增大σ D .减小σE.增大μ同时增大σ 4.观察某地100 名 12 岁男孩身高,均数为138.00cm ,标准差为 4.12cm, Z= ( 128.00- 138.00) /4.12。φ( Z)是标准正态分布的分布函数,1-φ( Z ) =1 -φ(- 2.43)=0.9925,结论是。 A .理论上身高低于138.00cm 的 12 岁男孩占99.25% 。 B.理论上身高高于138.00cm 的 12 岁男孩占99.25% 。 C.理论上身高在128.00cm 至 138.00cm 的 12 岁男孩占99.25% 。

D.理论上身高低于128.00cm 的 12 岁男孩占99.25% 。 E.理论上身高高于128.00cm 的 12 岁男孩占99.25% 。5.正态曲线下、横轴上,从μ到μ+2.58σ的面积占曲线下总面积的。 A .99%B.95%C.47.5% D .49.5% E. 90% 6.健康男子收缩压的正常值范围一般指。 A.所有健康成年男子收缩压的波动范围 B.绝大多数正常成年男子收缩压的波动范围 C.所有正常成年男子收缩压的波动范围 D.少部分正常成年男子收缩压的波动范围 E.所有正常人收缩压的波动范围 7.标准正态分布曲线下中间90% 的面积所对应的横轴 尺度 Z 的范围是。 A .- 1.645~1.645B.-∞~ 1.645C.-∞~ 1.282 D.- 1.282~1.282E.- 1.96~ 1.96 8.在正态曲线,下列关于μ- 1.645 σ的说法正确的是。 A .μ- 1.645σ到曲线对称轴的面积为90% B.μ-1.645σ到曲线对称轴的面积为10%

如何检验数据是否服从正态分布

一、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g 1表示偏度,g 2 表示峰度,通过计算g1和g2及其标准误σ g1 及σ g2 然后作U 检验。两种检验同时得出U<=,即p>的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。 2、非参数检验方法

非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W检验)。 SAS中规定:当样本含量n≤2000时,结果以Shapiro – Wilk(W检验)为准,当样本含量n >2000时,结果以Kolmogorov – Smirnov(D检验)为准。 SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro – Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本Kolmogorov-Smirnov检验可用于检验变量(例如income)是否为正态分布。 对于此两种检验,如果P值大于,表明资料服从正态分布。 三、SPSS操作示例 SPSS中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的操作: 1、工具栏--分析—描述性统计—探索性 2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项(Both)。 3、Output结果 (1)Descriptives:描述中有峰度系数和偏度系数,根据上述判断标准,数据不符合正态分布。 S k =0,K u =0时,分布呈正态,Sk>0时,分布呈正偏态,Sk<0时,分布呈负偏 态,时,Ku>0曲线比较陡峭,Ku<0时曲线比较平坦。由此可判断本数据分布为正偏态(朝左偏),较陡峭。 (2)Tests of Normality:D检验和W检验均显示数据不服从正态分布,当然在此,数据样本量为1000,应以W检验为准。

正态分布练习题

参考数据:若ξ~N (μ,σ2),P (μ-σ<ξ≤μ+σ)=0.6826,P (μ-2σ<ξ≤μ+2σ)=0.9544, P (μ-3σ<ξ≤μ+3σ)=0.9974.) 1.某省2015年全省高中男生身高统计调查数据显示:全省100000名男生的身高服从正态分布N (170.5,16).现从某校高三年级男生中随机抽取50名测量身高,测量发现被测学生身高全部介于157.5cm 和187.5cm 之间,将测量结果按如下方式分成6组:第一组[157.5,16 2.5),第二组[162.5,167.5),…,第6组[182.5,187.5),图是按上述分组方法得到的频率分布直方图. (1)试评估我校高三年级男生在全省高中男生中的平均身高状况; (2)求这50名男生身高在177.5cm 以上(177.5cm )的人数; (3)在这50名男生身高在177.5cm 以上(含177.5cm )的人中任意抽取2人,该2人中身高排名(以高到低)在全省前130名的人数记为ξ,求ξ的数学期望. 2.从某市统考的学生数学考试卷中随机抽查100份数学试卷作为样本,分别统计出这些试卷总分,由总分得到如下的频率分布直方图. (1)求这100 份数学试卷的样本平均分和样本方差s 2(同一组中的数据用该组区间的中点值作代表) (2)由直方图可以认为,这批学生的数学总分Z 服从正态分布N (μ,σ2),其中μ 近似为样本平均数,σ2近似为样本方差s 2. ①利用该正态分布,求P (81<z <119); ②记X 表示2400名学生的数学总分位于区间(81,119)的人数,利用①的结果,求EX (用样本的分布区估计总体的分布).附: ≈19 ,≈18, 3.在某学校的一次选 拔性考试中,随机抽取了100名考生的成绩(单位:分),并 把所得数据列成了如下表所示的频数分布表: ()1求抽取的样本平均数x 和样本方差2s (同一组中的数据用该组区间的中点值作代表); ()2已知这次考试共有2000名考生参加, 如果近似地认为这次成绩z 服从正态分布()2,μσN (其中μ近似为样本平均数x ,2 σ近似为样本方差2 s ),且规定82.7分是复试线,那么在这2000名 考生中,能进入复试的有多少人?(附: 16112.7 ≈,若 () 2,z μσN ,则 () 0.6826z μ σμσP -< <+=,()220.9544z μσμσP -<<+=) ()3已知样本中成绩在[]90,100中的6名考生中,有 4名男生,2名女生,现从中选3人进行回访,记选出的男生人数为ξ,求ξ的分布列与期望()ξE . 4.从某企业生产的某种产品中抽取500件,测量这 些产品的一项质量指标值,由测量结果得如下图频率分布直方图: (I )求这500件产品质量指标值的样本平均值和样本方差(同一组的数据用该组区间的中点值作代表); (II )由直方图可以认为,这种产品的质量指标服从正态分布 ,其中 近似为样 本平均数, 近似为样本方差 . (i )利用该正态分布,求 ; (ii )某用户从该企业购买了100件这种产品,记 表示这100件产品中质量指标值位于区间的产品件数.利用(i )的结果,求 .附: 5.在一次全国高中生五省大联考中,有90万名学生参加,考后对所有学生成绩统计发现,应用 成绩服从正态分布()2 ,N μδ,右表用茎叶图列举了20名学 生的英语成绩,巧合的是这20个数据的平均数和方差恰好比所有90万个数据的平均数和方差都多0.9,且这20个数据的方差为49.9. (1)求,;μδ (2)给出正态分布的数据: (ⅰ)若从这90万名学生中随机抽取1名,求该生英语成绩在()82.1,103.1内的概率; (ⅱ)如从这90万名学生中随机抽取1万名,记X 为这1万名学生中英语成绩在()82.1,103.1内的人数,求X 的数学期望. 18.从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率

相关主题