搜档网
当前位置:搜档网 › 第四章正态分布体育统计学

第四章正态分布体育统计学

第四章正态分布体育统计学
第四章正态分布体育统计学

第四章 正 态 分 布

如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —

2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。

1

2

3

4

5

6

7

8

9

10

x

图4 — 1 频数多边形图

第一节 正态分布曲线的形式

如果随机变量X 的概率密度函数为

y =π

σ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)

则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。

Y

X

图4 — 2 正态分布曲线

正态分布曲线中有两个参数:均值 μ 及方差 2σ。为了应用方

便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u

来代替原式中的 σ

μ-x , 寻这时的随机变量u 的概率密度函数成为: y = π

21e 22

u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。(图4 — 3)

Y

00.4

0.3

0.2

0.1

-1-2-3123μ

图4 — 3 标准正态分布曲线

第二节正态分布曲线的特征

正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面:

一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。

二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。

三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σ

μ1

±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。

四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。

五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的μ= 0,σ= 1,即标准正态曲线是关于纵轴对称;它在μ= 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。

Y

X 0

μσ=0.5

σ=1

σ=2

图4 — 4 三种不同形式的正态分布曲线

第三节 正态分布表

从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到 X = 168. 40厘米,S = 6. 13厘米。假定该市17岁男生身高服从正态分布,试估计身高在16. 40 — 172. 40厘米之间的人数。

求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a, b )上的概率。这个概率在标准正态曲线下就是曲线、X 轴、直线X = a 和X — b 所围成的面积。(图4 — 5)当概率P 求得后,要求的人数约等于总人数乘以P 值。 Y

00.1

-1-2-3123μ0.2

0.4

0.3

a b

图4 — 5 随机变量X在区间(a,b)内取值的概率示意图

表的左边第 1 列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即

u =

σμ

-

x

(4 — 3)

表上边的第1 行为u值的第2位小数。表的主体部分是各u值与均数(u = 0)之间所对应的单侧面积(或概率)。

一、知U值求对应的面积

例 4 —1求u 值为-1 至+2 之间对应的面积。

解:由于标准正态曲线是关于x = u对称的均数处的u值为零,所以u值在-1至0这间对应的面积与它在0 至+1 之间的对应面积相等。查书后附表1得u值在-1至0的对应面积是34. 13%;u 值在0至+2 之间的面积是47. 72%。前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。(图4 — 6)即:

34. 13% + 47. 72% = 81. 85%

-12=+

81.85%34.13%47.72%

00

-12

图4—6

例 4 —2 本节开始提出的问题,即试估计身高在160. 40 —172. 40厘米之间的人数。

解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按式(4 — 3)有(当u 和σ未知时,可用X和S近似代替):

u 1 = 13

.640.16840.160- = -1. 31 u 2 = 13

.640.16840.172- = 0. 65 查书后附表1 求 u 1、u 2 所对应的面积。u 1 = -1. 31 所对应的面积是40. 49%,u 2 = 0. 65所对应的面积是24. 22%。u 值-1. 31至0. 65所对应的面积为40. 49% + 24. 22% = 64. 71%,见(图4 — 7)所示,

于是身高在 160. 40 — 172. 40厘米之间的人数约为 205×64. 71% ≈133(人)。

0-1-21

24.22%

40.49%

160.40米0.65-1.31

图4-7 估计身高在160. 40-172. 40厘米间的人数百分数

二、已知面积求对应的U 值

例 4 — 3 试求从 +1σ 向右到什么位置对应的面积为

14. 15%

解:设从 +1σ 向右到 +k σ 对应的面积为14. 15%。查标准正

态分布表知+1σ对应的面积是34. 13%。 24. 13%+14. 15% = 48. 28%,就是u 值从0 到 +k 之间对应的面积。查书后附表1和K = 2. 11,即从 +1σ 向右到 +2. 11σ 之间对应的面积为14. 15%。(图4 — 8)

从标准正态分布表中,可以找出标准正态曲线下面的分布规律。

在下表中列出的五个分布位置与其对应的概率是统计中电子学用到的,应该熟记。

μ+2.11б

图4 — 8 从+1σ— +2. 11σ对应的面积

表4 — 1 正态曲线下的概率分布

μuσ该范围具有的概率

±

μ1σ68. 26%

±

μ 1. 96σ95. 00%

±

μ2σ95. 44%

±

μ 2. 58σ99. 00%

±

μ3σ99. 73%

±

第四节统计资料的正态性检验

正态分布的理论适用于正态或近似正态分布的资料。对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。这种方法使用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分

布的规律刻划的。使用时,先根据样本数据求出累计频率,然后根据累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。

例 4 — 4 广州市某中学初中生800米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布

组 限 频 数 累计频数 累计频率(%) -'''732 1 1 0. 8 -'''442 6 7 5. 6 -'''152 15 22 17. 6 -'''852 20 42 33. 6 -'''503 27 69 55. 2 -'''213 25 94 75. 2 -'''913 21 115 92. 0 -'''623 6 121 96. 8 -'''333 2 123 98. 4 -'''043 2 125 100. 0

由样本计算得:

X = 2303''' , S = 421''

然后根据每组的下限值和相应的累计频率,将它们分别标在图上。根据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组频数大,所以占比重也大。由(图4 — 9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。

2′51″2′2′2′3′3′3′3′3′37″44″58″05″12″19″26″33″

图 4—9

当样本资料符合正态分布时,籍助正态概率纸做图,还可以对 μ 和 σ 作出近似地估计。从正态分布理论知道累积频率为50% 的位置应在中点,即接近均数位置。从纵轴50% 的位置画横线与钭线交于a 点,由不得a 点向横轴做垂线交于 μ 点,其值为 8203''' ,即为估计均数,它与计算值 2203''' 仅相差 50''。又知均数减一个标准差位置的面积为34. 13%,故在纵轴上的应是50%-34. 13% = 15. 87%(b 点),以此划横线交于钭线上c 点,向横灿做垂线交于 9052''' 处,此点距均数的长度应为σ,故估计标准差的值为: 91190528203''='''-''' 。计算值为 421'',仅相差 50''。只要图做得准确,这些估计值也还是比较精确的。

第五节可疑数据的舍取

在实际工作中,往往能够发现样本资料中具有个别突出的数值(特大或特小的数值)。按样本数据系列大小顺序来看,发现这些突出的数值和其他数值之间有明显脱节现象。这种现象使人们怀疑这些特别数值是否属于研究的总体,于是把这些数据称为可疑数据。人们把来自非同一总体的极端值,称为异常数据。样本中的异常数据应当及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确性。如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs)检验法。

设x1,x2……,x n来自正态分布的总体,将它们按大小重新排列,记为x(1)≤x(2)≤…… ≤x(n)。

首先计算出可疑数据的g n值,其公式为:

g n =

s |x

x|-'

(4 — 4)

式中x'表示可疑数据值,若计算得g n值大于(表4 — 2)中的临界值a n,则认为x'是异常数据,应舍弃。若小于临界值,则x'为正常数据,应保留。

表4 — 2 戈罗伯斯检验临界值(a n)表α= 0. 05 n a n n a n n a n n a n n a n

3 1. 15 12 2. 29 21 2. 58 30 2. 96 40 2. 87

4 1. 46 13 2. 33 22 2. 60 31 3. 03 50 2. 96

5 1. 67 14 2. 37 23 2. 62 32 3. 09 60 3. 03

6 1. 82 15 2. 41 24 2. 64 33 3. 14 70 3. 09

7 1. 94 16 2. 44 25 2. 64 34 3. 18 80 3. 14

8 2. 03 17 2. 47 26 2. 75 35 3. 21 90 3. 18

9 2. 11 18 2. 50 27 2. 82 36 3. 23 100 3. 21

10 2. 18 19 2. 53 28 2. 87 37 3. 24 110 3. 23

11 2. 23 20 2. 56 29 2. 92 38 3. 25 120 3. 24

例 4 — 5 为了解一般高中学生跳高水平,由随机样本计算得到统计量如下:

n = 100人x= 1. 31米s = 0. 09米

假定这些学生跳高成绩的分布呈正态分布。其中有一名学生的成绩是1. 65米,这个成绩超出平均水平三个标准差以上,是个可疑数据。试检验它是否为异常数据。

按公式(4 — 4)计算

g n =

s |x

x|-'

=

09

.0

| 31

.1

65

.1|-

≈ 3. 78

查(表4 — 2)n = 100对应的a n值是3. 21,现计算值是3. 78,大于临界值,故1. 65 米是异常数据应舍弃。据了解,该学生是少体校学生,受过专项训练,不属于一般高中学生跳高水平研究的总体。

第六节正态分布理论在体育中的两个应用

一、制定测验标准

制定测验标准是体育教学和训练中的一项重要工作,一般是根据学生原有的基础和不同阶段教学目的与要求,事先规定达到各标准的人数比例,并将这个比例数看作正态分布曲线下的面积,然后利用标准下正态分布表去推算相应标准的具体成绩。

例4 —6 某学校某年级在进行跳高教学之前,从该年级随机抽出一部分学生测验其跳高成绩。现由样本计算得到统计量为:

x = 1. 40 米, S = 0. 10米

学校方面根据学生在跳高上的基础水平和教学的要求,规定就目前状况达到优秀的人数比例为10%,良好的人数比例为20%,有15%的人不能及格,试用统计方法求出以上三个标准的具体成绩。

μσ

σ123-1-2-3σσσσ15%20%

10%

c b a -1.04

0.52 1.281.30米 1.45米 1.53米σσσ

图 4—10 跳高测验标准的确定

计算过程如下:

人数比例 查标准正态分布表的面积 u 值 标准)s u x (?+

10 % (优) 50%-10%=40% 1. 28 1. 40+1. 28×0. 10=1. 53(米)

20 % (良) 50%-10%-20%=20% 0. 52 1. 40+0. 52×0. 10=1. 45(米)

15%(不及格) 50%-15%=35% -1. 40 1. 40-1. 04×0. 10=1. 30(米)

综上所述,优秀标准的成绩是1. 53米;良好标准的成绩是1. 45米;及格标准的成绩是1. 30米。

二、估计达标人数

以上阐述的是已知达标人数比例,求出这一标准的具体成绩,下面是叙述先定出具体的成绩标准,而后要求估计出达到标准的人数百分比。这实际上是已知u 值求对应正态分布曲线下面积的问题。

例 4 — 7 某学校对某年级男生的跳远教学测验成绩作出如下规定:成绩为5. 60米以上者得5分;5. 40米以上者得4分;4. 60米以上者得3分。教师从该年级男生中随机抽出部分学生进行测验,得到 x = 5. 00米,S = 0. 40米,试估计该年级男生得各分值的人数比例。

μσσ123-1-2-3σσσσ

σ4.60米 5.40米

5.60米(1.5 )得3分的人数百分数

得4分的人数百分数

得5分的人数百分数

图 4—11 跳远达标人数的估计

计算结果如下:

5分 米以上 (5 60- / = % 50%-% = %

4分 米以上 - / = % 50%-%-% = %

3分 米以上 - / = - % %+% = %

综上所述,该年级男生跳远得5分的人数比例是6. 7%;得4分的人数比例是9. 2%;得3分的人数比例是68. 26%。如果用该年级男生的总人数乘以各人数比例,便可估计达到各标准的人数。

习 题 四

1.什么是正态分布、标准正态分布正态分布的特点是什么如何使用正态分布表

2.在正态分布表中,下列范围包括的面积占总面积的百分之几

(1)σ±μ1.1;

(2)σ±μ58.2;

(3)σ-μ2.1 — σ+μ4.1间。

3.在正态分布中,已知 σ±μk 间包括的面积是 34 % ,求K 值为若干

4.某年级有216名学生,随机抽出部分学生测验跳远成绩得到样本统计量为 x = 4. 40米,S = 0. 42米。如规定2. 80米是及格标准,试估计该年级可能有多少人不及格

5.用正态概率纸检验第二章第七节所列出的31名大学生简单视反应数据资料是否服从正态分布。

6.某地区有一万名初中男生,抽样得到百米赛跑运动成绩的统计量为:x = 541'',S = 50''。

(1)若提出一胩锻炼标准,按现在的情况只能有30%的人达标,

那么这个标准的运动成绩定为多少秒合适

(2)如果开运动会,按目状况估计能有多少人达到或者突破 31''

的成绩

(3)希望定出一个水平为“中等”的能够包括6000人的成绩范围。

计算时如果要求以样本平均数为中点,那么这个范围的上下限

的运动成绩各是多少秒

7.某体重记录资料的样本含量为n = 15,统计量为x= 82. 5公斤,S = 0. 5千克。若其中某一数据为89. 4千克,试检验此数据是否为异常数据

第四章 正 态 分 布 体育统计学要点

第四章 正 态 分 布 如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 — 2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。 图4 — 1 频数多边形图 第一节 正态分布曲线的形式 如果随机变量X 的概率密度函数为 y =π σ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)

则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。 Y X 0μ 图4 — 2 正态分布曲线 正态分布曲线中有两个参数:均值 μ 及方差 2σ。为了应用方 便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令 u 来代替原式中的 σ μ-x , 寻这时的随机变量u 的概率密度函数成为: y = π 21e 22 u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。(图4 — 3) Y 00.4 0.3 0.2 0.1 -1-2-3123μ

图4 — 3 标准正态分布曲线 第二节正态分布曲线的特征 正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面: 一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。 二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。 三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σ μ1 ±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。 四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。 五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的μ= 0,σ= 1,即标准正态曲线是关于纵轴对称;它在μ= 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。

第四章正态分布体育统计学

第四章 正 态 分 布 如果将第二章中的(表 2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 — 2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。 1 2 3 4 5 6 7 8 9 10 x 图4 — 1 频数多边形图 第一节 正态分布曲线的形式 如果随机变量X 的概率密度函数为 y =π σ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)

则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。 Y X 0μ 图4 — 2 正态分布曲线 正态分布曲线中有两个参数:均值 μ 及方差 2σ。为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令 u 来代替原式中的 σ μ-x , 寻这时的随机变量u 的概率密度函数成为: y = π 21e 22u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。(图4 — 3) Y 00.4 0.3 0.2 0.1 -1-2-3123μ

图4 — 3 标准正态分布曲线 第二节正态分布曲线的特征 正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面: 一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。 二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。 三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σ μ1 ±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。 四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。 五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的μ = 0,σ = 1,即标准正态曲线是关于纵轴对称;它在μ = 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。

第四章正态分布体育统计学.docx

第四章正态分布 如果将第二章中的(表 2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图 4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图 4 — 2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机 变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是 正态分布。下面就来介绍正态分布及其在体育中的几个应用。 f 10 9 8 7 6 5 4 3 2 1 x 图4 — 1 频数多边形图 第一节正态分布曲线的形式 如果随机变量X 的概率密度函数为 y =12e( x22)2(x)(4 — 1)

则称随机变量 X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图 4 — 2)X 的变动范围在至+间。 Y μX 图 4 — 2正态分布曲线 正态分布曲线中有两个参数:均值及方差 2 。为了应用方便,对式( 4 — 1)中的随机变量经过一个称为标准化的变换,即令 u 来代替原式中的x ,寻这时的随机变量u 的概率密度函数成 为: 2 y =12 e u2(4 — 2) 按照( 4 — 2)式绘出的图形,称作标准正态曲线。(图 4 — 3) Y 0.4 0.3 0.2 0.1 μ

图 4 — 3 标准正态分布曲线 第二节正态分布曲线的特征 正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面: 一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。 二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以 后又再次减慢,最后接近横轴,但终究不能与横轴相交。 三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值 左右各一个标准差时又改向外弯,是以1的点为曲线从内弯转 向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。 四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为 1. 00。 五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形 态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的= 0,= 1,即标准正态曲线是关于纵轴对称;它在= 0 时,有最大值, 它近似等于 0. 4,如(图 4 — 3)所示。

第四章正态分布体育运动统计学

第四章正态分布 如果将第二章中的(表2 —1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 —1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。 10 9 8 7 6 5 4 3 2 1 x 图4 —1 频数多边形图 第一节正态分布曲线的形式 如果随机变量X的概率密度函数为

y =π σ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1) 则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。 Y X 0μ 图4 — 2 正态分布曲线 正态分布曲线中有两个参数:均值 μ 及方差 2σ。为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u 来代替原式中的 σμ-x , 寻这时的随机变量u 的概率密度函数成为: y = π 21e 22 u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。(图4 — 3)

Y 00.4 0.3 0.2 0.1 -1-2-3123μ 图4 — 3 标准正态分布曲线 第二节 正态分布曲线的特征 正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面: 一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。 二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。 三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以 σμ1± 的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。 四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。 五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的 μ = 0,σ = 1,即标准正态曲线是关于纵轴对称;它在 μ = 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。

相关主题