搜档网
当前位置:搜档网 › 统计学常用分布及分位数

统计学常用分布及分位数

统计学常用分布及分位数
统计学常用分布及分位数

§1、4 常用得分布及其分位数

1、卡平方分布

卡平方分布、t分布及F分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。

当X1、X2、…、Xn相互独立且都服从N(0,1)时,Z=得分布称为自由度等于n得分布,记作Z~(n),它得分布密度p(z)=

式中得=,称为Gamma函数,且=1,=。分布就是非对称分布,具有可加性,即当Y与Z相互独立,且Y~(n),Z~(m),则Y+Z~(n+m)。

证明:先令X1、X2、…、X n、X n+1、X n+2、…、Xn+m 相互独立且都服从N(0,1),再根据分布得定义以及上述随机变量得相互独立性,令

Y=X+X+…+X,Z=X+X+…+X,

Y+Z= X+X+…+X+X+X+…+X,

即可得到Y+Z~(n+m)。

2、t分布若X与Y相互独立,且

X~N(0,1),Y~(n),则Z =得分布称为自由度等于n得t分布,记作Z ~ t (n),它得分布密度

P(z)= 。

请注意:t分布得分布密度也就是偶函数,且当n>30时,t分布与标准正态分布N(0,1)得密度曲线几乎重叠为一。

这时, t分布得分布函数值查N(0,1)得分布函数值表便可以得到。

3、F分布若X与Y相互独立,且X~(n),Y~(m),则Z=得分布称为第一自由度等于n、第二自由度等于m 得F分布,记作Z~F (n, m),它得分布密度

p(z)=

请注意:F分布也就是非对称分布,它得分布密度与自由度得次序有关,当Z~F (n,m)时,~F (m ,n)。

4、t分布与F分布得关系

若X~t(n),则Y=X~F(1,n).

证:X~t(n),X得分布密度p(x)= 。

Y=X得分布函数F(y) =P{Y

当y0时,F(y)=0,p(y)=0;

当y>0时,F(y)=P{—

==2,

Y=X得分布密度p(y)=,

与第一自由度等于1、第二自由度等于n得F分布得分布密度相同,因此Y=X~F(1,n)。

为应用方便起见,以上三个分布得分布函数值都可以从各自得函数值表中查出.但就是,解应用问题时,通常就是查分位数表。有关分位数得概念如下:

4、常用分布得分位数

1)分位数得定义

分位数或临界值与随机变量得分布函数有关,根据应用得需要,有三种不同得称呼,即α分位数、上侧α分位数与双侧α分位数,它们得定义如下:

当随机变量X得分布函数为F(x),实数α满足0 <α〈1 时,α分位数就是使P{X〈xα}=F(xα)=α得数x α,

上侧α分位数就是使P{X >λ}=1-F(λ)=α得数λ,

双侧α分位数就是使P{X<λ1}=F(λ1)=0、5α得数λ1、使

P{X>λ2}=1-F(λ2)=0、5α得数λ2。

因为1-F(λ)=α,F(λ)=1—α,所以上侧α分位数λ就就是1-α分位数x 1-α;

F(λ1)=0、5α,1-F(λ2)=0、5α,所以双侧α分位数λ1就就是0、5α分位数x 0、5α,双侧α分位数λ2就就是1—0、5α分位数x1-0、5α。

2)标准正态分布得α分位数记作uα,0、5α分位数记作u 0、5α,1-0、5α分位数记作u1—0、5α。

当X~N(0,1)时,P{X〈uα}=F 0,1(uα)=α,

P{X

P{X

根据标准正态分布密度曲线得对称性,

当α=0、5时,uα=0;

当α〈0、5时,uα〈0。

uα=—u1-α.

如果在标准正态分布得分布函数值表中没有负得分位数,则先查出 u1-α,然后得到uα=—u1—α。

论述如下:当X~N(0,1)时,P{X< uα}= F 0,1 (uα)=α,

P{X〈u1-α}=F0,1 (u1-α)=1—α,

P{X> u1-α}=1— F 0,1(u1-α)=α,

故根据标准正态分布密度曲线得对称性,uα=—u1-α. 例如,u 0、10=-u0、90=—1、282,

u 0、05=-u0、95=-1、645,

u 0、01=-u 0、99=—2、326,

u 0、025=—u 0、975=-1、960,

u 0、005=-u 0、995=—2、576.

又因为P{|X|〈u1—0、5α}=1-α,所以标准正态分布得双侧α分位数分别就是u1—0、5α与-u1—0、5α。

标准正态分布常用得上侧α分位数有:

α=0、10,u0、90=1、282;

α=0、05,u 0、95=1、645;

α=0、01,u 0、99=2、326;

α=0、025,u0、975=1、960;

α=0、005,u 0、995=2、576。

3)卡平方分布得α分位数记作α(n)。

α(n)>0,当X~(n)时,P{X〈α(n)}=α。

例如,0、005(4)=0、21,0、025(4)=0、48,

0、05(4)=0、71,0、95(4)=9、49,

0、975(4)=11、1,0、995(4)=14、9。

4)t分布得α分位数记作tα(n).

当X~t(n)时,P{X<tα(n)}=α,且与标准正态分布相类似,根据t分布密度曲线得对称性,也有

tα(n)=—t1—α(n),论述同uα=-u1-α。

例如,t0、95(4)=2、132,t0、975(4)=2、776,

t 0、995(4)=4、604,t 0、005(4)=-4、604,

t 0、025(4)=-2、776,t 0、05(4)=-2、13

2.

另外,当n〉30时,在比较简略得表中查不到tα(n),可用uα作为tα(n)得近似值。

5)F分布得α分位数记作Fα(n , m)。

Fα(n, m)>0,当X~F(n,m)时,P{X<Fα(n,m)}=α。

另外,当α较小时,在表中查不出Fα(n, m),须先查F1-α(m, n),再求Fα(n,m)=。论述如下:

当X~F(m,n)时,P{X〈F 1—α(m, n)}=1-α,

P{>}=1—α,P{<}=α,

又根据F分布得定义,~F(n, m),P{

例如,F0、95(3,4)=6、59,F 0、975(3,4)=9、98,

F 0、99(3,4)=16、7,F0、95(4,3)=9、12,

F 0、975(4,3)=15、1,F 0、99(4,3)=28、7,

F 0、01(3,4)=,F0、025(3,4)=,F 0、05(3,4)=。【课内练习】

1、求分位数①0、05(8),②0、95(12)。

2、求分位数①t 0、05(8),②t 0、95(12)。

3、求分位数①F0、05(7,5),②F0、95(10,12)。

4、由u 0、975=1、960写出有关得上侧分位数与双侧分位数。

5、由t 0、95(4)=2、132写出有关得上侧分位数与双侧分位数。

6、若X~(4),P{X<0、711}=0、05,P{X<9、49}=0、95,试写出有关得分位数。

7、若X~F(5,3),P{X<9、01}=0、95,Y~F(3,5),{Y<5、41}=

0、95,试写出有关得分位数.

8、设X、X、…、X相互独立且都服从N(0,0、09)分布, 试求P{>1、44}.

习题答案:1、①2、73,②21、0。2、①-1、860,②1、782。

3、①,②3、37.4、1、960为上侧0、025分位数,-1、960与1、960为双侧0、05分位数.5、2、132为上侧0、05分位数,-2、132与2、132为双侧0、1分位数.6、0、711为上侧0、95分位数,9、49为上侧0、

05分位数,0、711与19、49为双侧0、1分位数.7。9。01为上侧0、05分位数,5、41为上侧0、05分位数,与5、41为双侧0、1分位数,与9、01为双侧0、1分位数。8、0、1。

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

统计学原理常用公式汇总

2.加权算术平均数 X =- X h X 3调和平均数: 式中: m = Xf , f X 统计学原理常用公式汇总 第2章统计整理 a ) 组距=上限—下限 b ) 组中值=(上限+下限)—2 c ) 缺下限开口组组中值=上限-1/2邻组组距 d ) 缺上限开口组组中值=下限+1/2邻组组距 e ) 组数k=1+3.322Lg n n 为数据个数 第3章综合指标 i. 相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2?比例相对指标=总体中某一部分数值/总体中另一部分数值 3?比较相对指标=甲单位某指标值/乙单位同类指标值 4. 强度相对指标=某种现象总量指标/另一个有联系而性质不 同的现象总量指标 5. 计划完成程度相对指标=实际数/计划数 =实际完成程度(%) /计划规定的完成程度(%) ii. 平均指标 1.简单算术平均数:; 丄 iii. 标志变动度 1.全距=最大标志值-最小标志值 加权 或 ? f ? Xf ? Xf

3.标准差系数:”= iiii抽样推 断 1.抽样平均误差: 重复抽样: p(1 P) n 不重复抽样: 2 ( 1 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目 n 成数抽样时必要的样本数目不重复抽样条件下: t2 2 2- x t2P(1 p) 平均数抽样时必要的样本数目第4 章动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数 ①由时期数列计算 a a n Nt2 2 N 2x t2 2 ②由时点数列计算 在间断时点数列的条件下计算: 若间断的间隔相等,则米用“首末折半法”计算。公式为: 1 1 a i a2 a n a. 1 a 2—— n 1 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

统计学常用公式汇总 (2)

统计学常用公式汇总 项目三 统计数据的整理与显示 组距=上限-下限 a) 组中值=(上限+下限)÷2 b) 缺下限开口组组中值=上限-邻组组距/2 c) 缺上限开口组组中值=下限+1/2邻组组距 例 按完成净产值分组(万元) 10以下 缺下限: 组中值=10—10/2=5 10—20 组中值=(10+20)/2=15 20—30 组中值=(20+30)/2=25 30—40 组中值=(30+40)/2=35 40—70 组中值=(40+70)/2=55 70以上 缺上限:组中值=70+30/2=85 项目四 统计描述 i. 相对指标 1. 结构相对指标=各组(或部分)总量/总体总量 2. 比例相对指标=总体中某一部分数值/总体中另一部分数值 3、 比较相对指标=甲单位某指标值/乙单位同类指标值 4、 动态相对指标=报告期数值/基期数值 5、 强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 6、 计划完成程度相对指标K =计划数实际数 =% %计划规定的完成程度实际完成程度 7、 计划完成程度(提高率):K=%10011?++计划提高百分数 实际提高百分数 计划完成程度(降低率):K=%10011?--计划提高百分数 实际提高百分数 ii. 平均指标 1、简单算术平均数: 2、加权算术平均数 或

iii. 变异指标 1. 全距=最大标志值-最小标志值 2、标准差: 简单σ= ; 加权 σ= 成数的标准差(1) p p p σ=- 3、标准差系数: 项目五 时间序列的构成分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在连续时点数列的条件下计算(判断标志按日登记):∑∑=f af a 在间断时点数列的条件下计算(判断标志按月/季度/年等登记): 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 1121-++++=-n a a a a a n n 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为: ∑ --++++++=f f a a f a a f a a a n n n 11232121222 (2) (选用)由相对指标或平均指标动态数列计算序时平均数 基本公式为: b a c = 式中:c 代表相对指标或平均指标动态数列的序时平均数; a 代表分子数列的序时平均数; b 代表分母数列的序时平均数;

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

统计学原理常用公式汇总

统计学原理常用公式汇总 第2章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 e)组数k=1+3.322Lg n n为数据个数 第3章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不 同的现象总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标 1.简单算术平均数: 2.加权算术平均数或 3调和平均数: ? ? = f X f X h 1 1 式中:, h Xf Xf m X X m f Xf X X m m Xf f X ==== == ??? ??? iii.标志变动度 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ=

3.标准差系数: iiii 抽样推断 1. 抽样平均误差: 重复抽样: n x σ μ= n p p p ) 1(-= μ 不重复抽样: )1(2 N n n x - = σμ 2.抽样极限误差 x x t μ=? 3.重复抽样条件下: 平均数抽样时必要的样本数目 2 22x t n ?= σ 成数抽样时必要的样本数目2 2)1(p p p t n ?-= 不重复抽样条件下: 平均数抽样时必要的样本数目 2222 2σσt N Nt n x +?= 第4章 动态数列分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在间断时点数列的条件下计算: 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 11 21-++++=-n a a a a a n n Λ 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

三大抽样分布

三大抽样分布 众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。 三大抽样分布的研究意义 c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。为此,要想研究三大抽样分布,就应该对其发展过程进行研究。统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。 X2分布 x2的早期发展 由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。1891年,X2分布首次被作为统计量的分布导出。Pizzetti在求线性 模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。 X2模型

统计学计算习题

第四章 六、计算题 月工资(元) 甲单位人数(人) 乙单位人数比重(%) 400以下 400~600 600~800 800~1000 1000以上 4 25 84 126 28 2 8 30 42 18 合 计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额 总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲 甲甲 () 2 x x f f σ-∑∑乙乙 乙乙 V x σσ= 甲 甲 甲 V x σσ= 乙乙乙 根据V σ甲 、V σ乙 大小判断,数值越大,代表性越小。 甲品种 乙品种 田块面积(亩) 产量(公斤) 田块面积(亩) 产量(公斤) 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同,试研究这两个品种的收获率,确定那一个品种具有稳定性和推广价值。 2、(1) 收获率(平均亩产) 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值(求变异指标) 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙 求V σ甲 、V σ乙 ,据此判断。 8.某地20个商店,1994年第四季度的统计资料如下表4-6。 表4-6 按商品销售计划完成情 况分组(%) 商店 数目 实际商品销售额 (万元) 流通费用率 (%) 80-90 90-100 100-110 110-120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算 (1)该地20个商店平均完成销售计划指标 (2)该地20个商店总的流通费用率 (提示:流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额 实际销售额 计划完成 (2) 据提示计算:2012.7%x = 品 种 价格 (元/公斤) 销售额(万元) 甲市场 乙市场 甲 乙 丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示:= 销售额 平均价格销售量 企业序号 计划产量(件) 计划完成程度(%) 实际一级品率 (%) 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

统计学原理公式及应用

《统计学原理》常用公式汇总及计算题目分析 第一部分常用公式 第三章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 第四章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现象 总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标

1.简单算术平均数: 2.加权算术平均数或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差: 重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目

成数抽样时必要的样本数目 4.不重复抽样条件下: 平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx 3.估计标准误: 第八章指数分数 一、综合指数的计算与分析 (1)数量指标指数

此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 (-) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 (-) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析:

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

统计学常用公式汇总

《统计学原理》常用公式汇总 组距=上限-下限组中值=(上限+下限)÷2 缺下限开口组组中值=上限-1/2邻组组距缺上限开口组组中值=下限+1/2邻组组距 111平均指标 1.简单算术平均数: 2.加权算术平均数 或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差:重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下:平均 数抽样时必要的样本数目 成数抽样时必要的样本数目 4.不重复抽样条件下:平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx

3.估计标准误: 第八章指数分数一、综合指数的计算与分析 (1)数量指标指数 此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 ( - ) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 ( - ) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析: - = ( - )×( - ) 第九章动态数列分析 一、平均发展水平的计算方法:

(1)由总量指标动态数列计算序时平均数 ①由时期数列计算 ②由时点数列计算 在间断时点数列的条件下计算: a.若间断的间隔相等,则采用“首末折半法”计算。公式为: b.若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为: (2)由相对指标或平均指标动态数列计算序时平均数 基本公式为: 式中:代表相对指标或平均指标动态数列的序时平均数; 代表分子数列的序时平均数; 代表分母数列的序时平均数; 逐期增长量之和累积增长量 二. 平均增长量=─────────=───────── 逐期增长量的个数逐期增长量的个数 (1)计算平均发展速度的公式为: (2)平均增长速度的计算 平均增长速度=平均发展速度-1(100%)

相关主题