搜档网
当前位置:搜档网 › 生物统计学总结

生物统计学总结

生物统计学总结
生物统计学总结

生物统计学总结

绪论

统计工作的四大步骤:设计、搜集、整理、分析

统计资料的三大类型:

e计量资料:对每个观察值单位用定量方法测得每项指标量的大小所得的资料e计数资料:将观察单位按照某种属性类别分组,所得的观察单位数

e等级资料:将观察单位按某种属性的不同程度分组所得的资料

同质与变异

同质:除研究因素外,其他因素相同或相近为同质

变异:观测值的不齐性

总体与样本:

总体:根据研究目的所确定的同质观察单位的全体=所有研究对象

性质相同的全体观察单位某项变量值的集合

总体含量:总体中所包含的观察单位数

有限总体:总体观察单位数可数

无限总体:总体观察单位数不可数

样本:从总体中随机抽取的部分观察单位

样本含量:样本中所包含的观察单位数

抽样:从总体中获得样本的过程

放回式抽样

不放回式抽样

抽样误差:因个体变异的存在,由抽样而导致的样本指标与总体指标之差

统计量:有样本所得指标或数

参数:由总体所得指标,关于特征的表征

频数:完全相同的观察只出现的次数

频率:某一观察值出现的次数与样本含量的比值

概率:描述某事物发生可能性大小的一个度量

样本空间:一次实验所有可能的结果的集合

基本事物:样本空间每一个可能的结果

小概率事件:P<=或P<=的事件

小概率原理:小概率事件在一次抽样中不可能发生

计量资料的统计描述

集中趋势的指标:

平均数

定义:描述一组同质计量资料的集中趋势,反映某一组观察值的平均水平或某一分布的平均位置的指标作用:作为一组资料的代表值,可用于组间的分析比较

均数的两个重要特征?代表性

1.离均差和等于0

2.离均差平方最小小于

常用平均数指标:

1.算术均数

(1)定义:全部观察值相加之和除以观察值个数所得的商

总体均数样本均数

(2)算法:

1)直接法:

2)加权法:

3)缩减法

(3)注意事项:

1)只有在合理分组的基础上对同质数据取均数才有意义

2)均数用于近似正态分布的对称分布,尤其是正态分布

2.几何均数G(不能用算术均数时)

(1)定义:几个观察值相乘之积,开几次方所得根

(2)计算

1)直接法

2)

(3)应用注意:

1)几何均数适用于观察值相差很大,甚至呈倍数关系(等比或几何级数资料)或用于对数正态分布资料

2)观察值不能有零,不能同时有正负,

若都为负,去符号最后加符号,

观察值比较小或有零,可加1,最后减去

3)同一资料求得的几何均数小于均数

中位数M

(1)定义:把一组观察值按大小顺序排列,位次居中的

(2)计算:

1)直接法

2)频数表法:

(3)注意事项

1)适用场合:偏态,开口(一端或两端无界限),分布不清的

2)特性:只代表了居中观察值的特性,敏感性低,不受特小特大值的影响

3)对于正态分布资料,理论上,中位数=均数(数值上)

百分位数

(1)定义:将n个观察值由小到大排列,编上秩次,将n个秩次100等分,与X%秩次相对应的数值,即X的百分位数,是一个位置指标,以Px表示(x代表百分秩次)

Px将整个数列分为两半,X%比Px小,1-X%比Px大

(2)计算:

(3)应用注意

1)百分位数常用于描述一组资料(样本或总体)在某百分位数上的水平和分布特征,多个百分位数结合使用,可全面描述观察值分布特征,包括位置的大小和变异度

2)一般分布中部的百分位数相当稳定,代表性好,

靠近两端的百分位数,只在样本含量足够大(>120个)才足够稳定,

所以当样本含量不够大时,不宜取两端百分位数

3)用百分位数确定正常值范围,习惯上95%

离散趋势的描述

1. 极差R:

样本资料中最大值和最小值之差

在一定程度上能说明样本波动幅度的大小,但它只受样本中两个极端个体数值大小的影响,不能反映样本中各个观测值的变异程度,稳定性差

2. 四分位数间距:

是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.

稳定性好,灵敏度不够

3. 标准差:

1)定义:描述一组同质计量资料离散程度大小的指标

反映了均数对一组观察值的代表性

说明了观察值围绕均数分布的离散程度,个体变异

2)计算:

3)应用:

1.表示变量分布的离散程度

2.结合均数描述正态分布特征

3.结合均数计算变异系数

4.结合样本含量计算标准误

4)注意:

(1)不同单位,相同标准差,不能比较

(2)大个体差异大,变异度大,小个体则变异度小

4.变异系数CV

1)定义:标准差与均数之比,用百分数表示

2)计算:

3)应用:单位不同的几组资料变异度及均数相差悬殊的几组资料的变异度的比较,不单独使用

自由度ν

泛指可以自由取值的变量的个数

正常值:正常动植物解剖生理生化等各种数据的波动范围

1)必要性

1.区分正常和异常

2.看不同种群在不同时间地域上某一指标的差异

2)选取

1.极差中的一部分

2.单侧或双侧正常值之分,由指标实际情况及实验要求确定

3.方式之一为正常值范围的百分位数,习惯上95%

双侧:确定或

单侧:P5或P95,看实验需要

计量资料的统计推断

统计推断

用样本信息推断总体特征

参数估计:由样本结果对总体参数在一定概率水平下所做出的估计

假设检验

正态分布

1)概念:一种连续型随机变量的概率分布

密度函数:

分布函数:

2)特征:

1.在横轴上均数处最高

2.以均数为中心,左右对称

3.有两个参数

4.曲线下的面积分布有一定的规律F(x)

3)应用:

1.以曲线下的面积反映频率及概率分布

2.估计正常值范围或正常值范围的正态分布法?双侧正常值范围

3.质量控制

4.正态分布是很多种统计方法的理论基础

标准正态分布,u分布

Uα与面积的关系

对数正态分布

原观察值x呈偏态(正偏),取对数后,lgX呈正态分布?x服从对数正态分布

均数的抽样误差

1.定义:平均数与总体均数之差

2.均数抽样误差大小的度量

标准误

1)定义:样本均数的标准差

2)意义:反映抽样误差的大小

是样本均数围绕总体均数分布的离散程度,衡量了样本均数的可靠程度3)计算:

一般一次抽样估计

总体没有标准误,只针对样本

4)用途:

(1)计算可信区间(参数估计)

(2)用于统计推断(假设检验)

t分布

1.t变换与t变量

2.t分布的特征

1)单峰,一0为中心,左右对称

2)曲线中间比正态分布低,两端翘得比正态分布高

3)有无数根,中间越低,两端越翘

t分布与自由度有关,自由度越小,中间越低,两端越翘

当自由度趋向无穷时,t分布趋向标准正态分布,t?u

3.概率密度函数与分布函数

4.t介值与t介值表

tα,ν:给定自由度为ν,两侧双尾面积之和为α时,相应t值。

5.t分布原理:P(-tα,ν<= t <= tα,ν)=1-α

方差分析

方差分析又叫变量分析,俗称F检验

用途:

1.两个或多个均数的比较

2.分离各有关因素,并分别估计其对变异的作用

3.分析两个或多个因素的交互作用

4.方差齐性检验

适用条件(用于多个均数比较时)

1.个样本是相互独立的随机样本

2.小样本要求正态方差齐

基本思想:把全部观察值之间的变异,总变异,按设计需要,分为两个或多个组成部分再作分析

计算

总体均数的估计

1.总估计

2.区间估计:

1)定义:按一定的概率估计总体均数在什么范围内

可信区间:按一定的概率估计总体均数的可能范围

2)方式:

1.t分布法:

按t分布的原理估计总体均数在什么范围内适用于总体标准差未知且n<50的情形

总体均数在可信区间的概率1-α

可信度:1-α

置信水平:α

通常,我们取95%或99%作可信区间

2.正态分布法

适用于总体标准差已知或n>50

总体标准差已知:

n>50:

为什么做假设检验

检验差别是否由抽样误差造成的

基本思想

假定差别是由抽样误差引起的

然后计算由抽样误差引起这么大,甚至比这更大的差别的概率P

根据小概率原理,作出拒绝或者接受假设的判断

步骤

1.建立假设,确定检验水准

先确定是单侧还是双侧的

若考虑u,u0有误差别?双侧

若不仅考虑差别,还关注u,u0大小?单侧

一般认为双侧

无效假设H0:从反证法的基础上提出的,无论何时,假设差别是由抽样误差造成的,但具体

问题具体分析

备择假设H1:与H0相对立的假设,是依H0而产生的,一旦H0不成立,只能接受H1,现在H0

不成立?非H0

?体现单双侧之分

检验水准α:界定小概率事件的一个标准(有单双侧之分)

通常α=

2.选定检验方法,计算统计量

3.确定P值,做出统计推断

P值:指由H0所规定的总体中做随机抽样,获得等于大于或小于现有统计量的概率。若P<=

α,拒绝H0;若P>α,接受H0

第一类错误和第二类错误

第一类:拒绝实际上成立的H0

客观实际拒绝H0不拒绝H0

H0成立第一类错误(α)推断正确(1-α)

H0不成立推断正确(1-β)第二类错误(β)

e可信度 1-α

e把握度β:未知,只能估计,不能单独存在,只有与H1结合才有意义

e检验效能1-β:计量总体却有差别,按α水准,能够发现他们有差别的能力

注意

1.样本的代表性?组间的均衡性?资料的可比性

2.选用的假设检验方法一定要符合其适用条件

3.正确理解差别有无显着性的含义(显着、极显着不意味着差别的大小)

4.结论不能绝对化

5.报告要规范化

一、完全随机设计

(一)样本均数与已知总体均数比较的假设检验

1.小样本,总体标准差σ未知?t检验(要求取自正态总体)

2.大样本,总体标准差σ未知:

1)t检验(严格)?法2 无需来自正态总体

2)u检验(ν?∞,t?u)?法1

3.大样本,总体标准差σ已知?u检验

(二)两个样本均数比较的假设检验

1.小样本(有一个就算),总体标准差σ未知,正态方差齐?t检验

A.先求合并方差

B.再求两样本均数差的标准误

C.计算t值

2.小样本(有一个就算),总体标准差σ未知,方差不齐(非正态)

1)采用适当的变量变换使达到方差齐性的要求

2)采用不要求方差齐的方法比较?非参数统计

3)采用近似的t‘检验

3.大样本?u检验(不考虑正态方差齐的情况下,仍可用t检验)

(三)两个样本几何均数比较的假设检验

对x取反对数,用t检验或者u检验

(四)多个样本均数的比较(单因素方差分析)

条件:

1.个样本是相互独立的随机样本

2.小样本要求正态方差齐

*多个样本均数间的两两比较?q检验

二、配对设计

(一)配对设计的计量资料的比较

小样本,t检验?

三、配伍组设计

(一)多个样本均数的比较(两因素方差分析)

多个性质相同的配伍,同一配伍组中的N个受试对象分别接受k种处理作用:

1.可改善处理组间的均衡性

2.可分析配伍因素的的影响

3.提高设计效率,分析两个因素

*多个样本均数间的两两比较?q检验

正态性检验

一、为什么做正态性检验

特定统计方法要求的

描述统计平均数、标准差

正常值范围的正态统计法

统计推断 t检验

F检验

二、定义

判定资料是否服从正态分布或样本是否来自正态总体的一类检验方法

三、何时用?

1.为了说明资料是否服从正态分布?一定要做

2.为了满足特定统计方法的需要?可以不做

四、怎么做?

正态分布分布的特征:

1.对称性?偏度(正偏、对称、负偏)

三阶偏度系数 g1

态峰?翘度(正态峰、尖峭峰、平阔峰)

四阶峰度系数 g2

方差齐性检验

一、为什么?

1.t检验 F检验使用条件的要求

2.方差的抽样波动

二、定义

说明变量值的变异度有无差别,或者通过样本信息来推断总体方差是否相等的一类检验方法

三、何时做?

1.说明变量值的变异度有无差别时?一定做

2.为满足t、F检验方差齐性要求的?可不做

四、如何做?

多个方差的齐性检验——X2检验

变量变换

意义:通过改变观察值的原初形式,使资料正太化,达到方差齐性的要求,以满足t检验及方差分析的应用条件

依据:只改变观察值的分布形式,而不是其相对大小

常用方法:

1)对数变换:以观察值x的对数值作为新的分析数据

常用方式

适用场合:

1.使服从对数正态分布的资料正态化

2.使方差达到方差齐性要求,特别是标准差与均数的比值接近时

3.使指数曲线直线化,常用于曲线拟合

2)平方根变换:以原观察值x的平方根作为新的分析数据

常用方式

适用场合:

1.使服从Poisson分布的计数资料或轻度偏态资料正态化

2.使各样本的方差与均数的正比例关系消除或削弱,达到方差齐性要求

3)百分数、平方根、正反弦变换

以原观察值用百分数表示,平方根反正弦值作为新的分析数据

适用场合:总体百分数小于30%或大于70%的情形

计数资料的统计描述和推断

相对数

(一)为什么引入

绝对数不能做进一步分析

(二)什么是相对数

同一基础上,两个有联系指标之比

*常用指标

1.率/频率指标:用以说明某现象发生的频率与强度 计算()比例基数可能发生某现象的总数某现象的发生数?=

比例基数—依习惯而用

—使算的的率至少保留1-2位整数

2.构成比/构成指标:用以说明某一事物内部各组成部分所占的比重或分布→总和为100% 计算%100?=位总数

同一事物各组分观察单某一组分的观察单位数 *若总和不为100%:超减于大,低加在小

3.相对比:两个有关同类指标之比,用以说明两者的对比水平 计算()%100?=乙指标

甲指标 *指标可为平均数、绝对数、相对数

4.动态数列:一系列按时间顺序排列起来的统计指标,用以说明事物延时间发展的变化与趋势 *指标可为平均数、绝对数、相对数

*动态分析:(1)绝对增量=统计期指标-基期指标

说明事物在一定时期增加的绝对数量

可分为

逐年的、逐期的:后比前,内部波动

累计的:基期固定,总体结果

(2)发展速度、增长速度:

反映事物在一定时期的速度变化,可分为定基与环基

发展速度=统计期指标/基期指标

增长速度=发展速度-1

(三)应用相对数应注意的问题

1.计算相对数的分母一般不宜过小,对于动物实验,可减小

2.分析时不能以比代率

3.计算观察单位不等的几个率的平均值时,不能直接相加求平均321321P n n n x x x ++++=

4.资料的对比应注意可比性

5.率和构成比也可有抽样误差→假设检验

二项分布及其应用

(一)概念及其应用条件

对于某个性状,常常可以把其资料分成两个类型。即“非此即彼”两种情况,彼此构成对立事件,我们把这种“非此即彼”事件所构成的总体,称为二项总体,其概率分布称为二项分布。

1. 二项分布的概率密度函数:

重复做①n 次相互独立的实验,每次实验②有相互独立的结果,

③P(A)=Π P()=1-Π,则n 次实验中A 恰好发生x 次的概率

2. 实验有①②③,则可用二项分布处理

3. 分布函数

4. 特征:

Π= 对称,正态

≤Π≤ 近似对称,近似正态

Π> 或 Π< 偏态严重,离越远,偏的越厉害

二项分布近似正态分布的条件:

1) Π,1-Π 均大于 ? Π不接近0或1

2) n Π,n(1-Π) 均大于5? n 足够大

5. 二项分布的均数和标准差、

(二)二项分布的应用

1.总体率的可信区间

(1)点估计

(2)区间估计

1)查表法

2)正态近似法(条件)

2.样本率与已知总体率比较的假设检验

(1)直接计算概率法

利用二项分布的概率密度和分布函数,求出p值,与所用的检验水准α进行比较,做出统计推断

适用条件:Π偏离较远,x较小

(2)正态近似法(条件)

(3)两个样本率比较的u检验(条件)

Poisson分布及其应用

(一)概念及应用条件

是二项分布的一个特例,当Π或1-Π很小(<)而n很大时,二项分布近似于Poisson分布常用于研究单位时间或单位面积或容积内,某罕见事件发生次数的分布

1.概率密度函数:

2.应用条件:同二项分布

3.分布函数

4.特点:

离散型分布,适用于计数资料

二项分布的特例,应用条件同二项分布

方差等于均数,σ=

λ≥20时,Poission分布近似正态分布

Poisson分布具有可加性

(二)应用

1.总体均数λ的估计(区间)

1)查表法 x≤50

2)正态近似法

2.样本均数与总体均数的比较

1)直接计算概率法

2)正态近似法

3.两个样本均数的比较? u检验

1)两个样本观察单位数相等

2)两样本单位不同时

X2检验及其应用——同性质、适合性、独立性检验

一、X2分布

1.X2变量ν个标准正态变量平方和

2.概率密度函数

3.分布函数

4.X2介值表

5.X2分布与正态分布的关系

随着自由度的增加卡方分布近似于正态分布

当ν=1时,

二、X2检验的基本思想

在实际操作中,k个实际频数ki 与其相应的理论频数T 的差值①

表示实际频数与理论频数的吻合程度

*当n>40,Ti>5时,上式①近似X2

*可以利用X2值检验实际频数与按假设检验计算的理论频数是否相等的问题

*如果假设成立,那X2 ≈ 0;不应出现大X2的概率P<α,如果出现,则可以怀疑假设是否成立,进而拒绝他,反之不拒绝

X2的基本公式

n>40,T>5

四格表资料

处理阳性数阴性数合计阳性率

1a b a+b

2c d c+d

合计a+c b+d n

X2基本公式的专用公式

n>40,T>5

X2校正公式

n>40,1

X2校正公式的专用公式

n>40,1

四格表的确切概率法

n<40 或 T<1配对计数资料的X2检验

甲处理

乙处理

合计+-

+a b a+b

-c d c+d

合计a+c b+d n

1)两种处理有误差别

b+c>40时可不校正2)两种处理有无相关(双向有序列联表)

列联表X2检验

基本数据中多于四格表

用途:

1.多个样本率的比较

2.样本构成比的比较(三个以上)

3.计数资料的相关分析

基本思想、基本公式、自由度的计算同前

应用条件:

>40

3.不能有T<1的格子

T过小的处理:

1.增大样本含量n

2.合并相应的行或列

3.删除相应的行或列

*多个样本率/构成比的比较,结论为拒绝H0时,认为有差别,但不知其具体,应两两比较

*如果分组标志是双因素的,若其中一组分组标志有序?单向有序列联表。若分析构成比?X2检验,否则用秩和检验

(一)多个样本率的比较(表)

(二)两个样本构成比的比较(可推多个)(2表)

(三)计数资料的相关分析(双向有序列联表)

频数分布拟合优度的X2检验——判定样本频数分布是否符合某一理论

非参数统计

*不依赖于总体的分布形式,应用时忽略分布类型是否已知

*检验时比较分布而非参数

*适用范围广,不受分布形式限制

*可用于不能活未能精确测量的资料,尤其适用等级资料或适合于算中位数

*前提为变量变换后仍不能达到正态

缺点:检验效能低=参数统计×30%

适用场合:

①等级资料②偏态分布(经变换后不能正态,近似L型)③开口资料④分布不清的

⑤方差不齐(经变换后仍不能达到齐性)

常用方法:

①符号检验②秩和检验③超越检验④游程检验⑤等级相关分析

秩和检验

(一)配对比较的符号秩和检验

(二)两个样本比较的秩和检验

(三)多个样本比较的秩和检验

(四)多个样本两两比较的秩和检验?t检验

相关与回归分析

直线相关

一、概念

1.两变量间的关系

2.直线相关分析:找出一个适当的指标来描述两个变量间的直线相关关系、相关密切程度及方向是怎

样的

3.适用条件:双变量正态分布或正态双变量

二、相关系数(指标)

1.定义:描述两个变量间有无直线变量关系及密切程度

样本?r 总体?

2.意义:通过取值描述不同的相关情形

3.相关系数的计算

4.r=0 推出=0 ? r的假设检验? t检验

等级相关

用等级数据做直线相关分析

适用场合:

1.不服从双变量正态分布的

2.总体分布型未知的

3.原始数据使用等级表示的

等级相关系数:表明两变量间的相关密切程度

样本r s总体

r s的检验:1.查表法

检验

直线回归

一、概念

研究两变量在数量上的依存关系

直线回归方程 y=a+bx+ε

*用容易测量的变量推算不易测得的变量

*对资料的要求:

1.正态双变量:x ? y & y ? x 的两个方程(不同)

2.至少有一个是正态变量,必须是y?要求x是精确测定的

二、直线回归方程

1.一般表达式

*数学模型:Y=a+bx+ε

*一般表达式:

2.系数a、b的求法

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

初级生物统计学学习心得

高级生物统计学课程学习总结 摘要:经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。本文主 要讲述了本学期学习生物统计之后,我对生物统计学的收获和体会。 关键词:生物统计学 收获 体会 学习了黄老师讲授的《高级生物统计学》这门课程,我觉得自己又收获了不少。经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。虽说我的专业是课程与 教学论,对生物统计学知识的运用较少,但我深信,于我自身,它将起到不可估量的作用。 下面主要谈谈我对这门课程的理解与感悟。 1.对生物统计学的认识 1.1生物统计学的概念 生物统计学是一门以概率理论为基础的,实际应用性非常强的综合性的学科。它运用概率论与数理统计的原理和方法处理生物学中的各种数量资料,从而透过现象揭示生物学 本质的一门科学,是科学研究与实践应用的基础工具。它是研究如何搜集、整理、分析反 映整体信息的数字资料,并以此为依据,推断总体特征,然后用生物学的语言加以描述的 工具。 从生物统计学的概念我们不难看出,生物统计是要我们根据部分所反映出来的性质,推断总体的性质,在推断的过程中,不可避免的会有一定的出错概率,我们只是选择不同 的分析方法将这一概率降到最低。它不仅为我们提供了设计试验,获取资料的方法,还提 供了整理资料,最后得出科学结论的方法。因此,学好生物统计对我们以后设计试验,分 析试验数据,得出科学而精简的结论有很大帮助。 1.2生物统计学的重要性 统计学在生物学中的应用已有长远的历史,许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。 随着基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生 物科技领域上扮演着不可或缺的角色。,生物统计学在这些领域被广泛应用,并显得日益重 要。生物统计学是生物领域学生应具备的基本知识和素质,与生命活动有关的各种现象中 普遍存在着随机现象,大到整个生态系统,小到核苷酸序列,均受到许多随机因素的影响, 表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必 然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生物科 管线不仅可以解决吊顶层配卷问题,而且可保障各类路敷设过程中,要加强看料试卷连接管口处理高中资料试卷保护层防腐跨接地线弯曲半径标高中语文电气课件中管壁薄、接利用管线敷设技术。线缆敷设原则不同电压回路交叉时,应采用金属同一线槽内强电回路须同时切根据生产工艺高中资料试卷要求,与带负荷下高中资料试卷调控试使其在正常工况下与过度工作下都于继电保护进行整核对定值,审核杂设备与装置高中资料试卷调试动过程中高中资料试卷电气设备进过关运行高中资料试卷技术指导中资料试卷技术问题,作为调试人图纸资料、设备制造厂家出具高案。 保护高中资料试卷配置技术是指高中资料试卷总体配置时,需要在机组高中资料试卷安全,并且尽可料试卷破坏范围,或者对某些异进行自动处理,尤其要避免错误高然停机。因此,电力高中资料试,要求电力保护装置做到准确灵活置高中资料试卷调试技术是指发电内部故障时,需要进行外部电源

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

《生物统计学》教学大纲

《生物统计学》教学大纲 课程名称:生物统计学 课程类型:范围选修课-基础课 学时:56学时,3.5学分 适用对象:农学、植物保护、生物技术、生物科学、草业科学等本科专业先修课程:高等数学、线性代数、概率论与数理统计、植物学、植物生理学、遗传学等课程 一、课程性质、目的与任务以及对先开课程要求 统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的一般统计学。统计方法是现代生物学研究不可缺少的工具。正确的统计分析能够帮助我们正确认识事物客观存在的规律性。 概率论与数理统计等先开课程的重点是讲述没有量纲或单位抽象的数量规律,为生物学科应用这些规律打基础。 二、教学重点及难点 本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。本课程的难点是概念较多、理论抽象、系统严密、实践性强、公式复杂、符号繁多、计算量大,因此,教学安排上除精讲48学时外,有针对性的安排上机操作8学时。 三、与其他课程关系 生物统计学与数学有密切关系,现代统计学用到了较多的数学知识,研究理论生物统计学的人需要有较深的数学功底,应用统计方法的人也应具备良好的数学基础。统计学又是一门应用性很强的学科,几乎生物学科所有的门类都要研究和分析数据,掌握生物学类学科专业基础课和专业课程知识有利于对统计分析的结果做出合理的解释和分析。 四、教学内容、学时分配及基本要求 绪论(1学时) 基本要求:理解什么是统计?什么是统计学;统计数据与统计学的关系,描述统计与推断统计内涵;统计方法能解决生物学科中哪些问题,了解生物 统计学的产生与发展。

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学课堂作业及答案

1. 资料可以分为哪几类?它们有何区别? 答:(1)资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中 数量性状资料又包括计量资料和计数资料。 (2)区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系 三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 2. 为什么要对资料进行整理?对于计量资料,整理的基本步骤是什么? 答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。②确定组数,一般根据样本含量及资料的变动范围大小确定组数。③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。④确定组限和组中值,各组的最大值为组上限,最小值为组下限 每一组的中点值称为组中值。⑤归组划线计数,作次数分布表。 3. 在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。 4. 统计表与统计图有何用途?常用统计表、统计图有哪些?列统计表、绘统计图时,应注意什么? 答:(1)统计表用表格形式来表示数量关系 统计图用几何图形来表示数量关 系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形 象地表达出来,便于比较分析。 (2)常用的统计图有长条图、圆图、线图、直方图和折线图等。 (3)常用的统计表有简单表和复合表两大类。 (4)列统计表的注意事项: ①标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。 ②标目分横标目和纵标目两项,横标目列在表的左侧用以表示被说明事物的主要标志,纵标目列在表的上端说明横标目各统计指标内容,并注明计算单位。 ③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。 ④表的上下两条边线略粗、纵、横标目间及合计用细线分开 表的左右边线可以省去表的左上角一般不用斜线。 (5)绘统计图的注意事项: ①标题简明扼要并列于图的下方。 ②纵、横两轴应有刻度,注明单位。 ③横轴由左至右,纵轴由上而下,数值由小到大,图形长宽比例约为5:4或6:5。 ④图中需用不同颜色或线条表示不同事物时应有图例说明。 5. 生物统计中常用的平均数有几种?各在什么情况下应用? 答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学学习心得

生物统计学学习心得 一、《生物统计学》这一门课。你学到什么?谈谈你学习这一门课的心得体会。 (一)、《生物统计学》这门课,首先,我不仅学到了很多生物统计方面的基础知识、基本概念和相关的应用,还学习了如何设计试验。 在第一章,我学了统计数据的收集与整理。首先学习的是总体与样本的概念,统计学研究的核心问题是如何通过样本推断总体,因此,总体与样本是生物统计学中的两个最基本概念。总体是我们研究的全部对象。构成总体的一个研究单位称为个体。样本是总体的一部分,样本内包含的个体数目称为样本含量。接着学习了数据类型及频数分布。生物统计学中经常遇到的数据有两种类型,一种是连续型数据,指与某种标准做比较所得到的数据,采用变量的方法进行分析。另一种是离散型数据,指由记录不同类别的个体的数目所得到的数据,采用属性的方法进行分析。最后学习了样本的几个特征数,平均数、标准差、方差。 在第二章,我学了概率和概率分布。概率是事件所固有的,且不随人的主观意识而改变。总体分布是建立在概率这一概念基础之上的,因此在研究总体分布之前首先应对概率的基本知识有所了解。试验的每一最基本的结果称为基本事件,指不能再分的事件。复合事件指由若干个基本事件组合而成的事件。概率的基本运算法则包括概率加法法则、条件概率、概率乘法法则、独立事件。概率分布包括离散型概率分布和连续型概率分布。 在第三章,我学了几种常见的概率分布律。首先学了二项分布,二项分布的基本情况是:设有一随机试验,每次试验都有两种不同的结果,如成功的(事件A)和失败的(事件A’);生男孩(事件A)和生女孩(事件A’)。显然这两种可能的结果是互不相容的,独立地将此试验重复做n次,求在n次试验中,一种结果出现y次的概率。接着学了泊松分布、超几何分布、负二项分布、正态分布、指数分布等。 在第四章,我学了抽样分布。首先学了从一个正态总体中抽取的样本统计量的分布,学了一些基本概念,如标准误差、样本标准误差、自由度、查表。然后学了从两个正态总体中抽取的样本统计量的分布,包括标准差已知时两个平均数的和与差的分布、标准未知但相等时两个平均数的和与差的分布、两个样本方差比的分布----F分布。 在第五章,我学了统计推断。对总体做统计推断可以通过两条途径进行,一是首先对所估计的总体提出一个假设,称为统计假设检验,二是通过样本统计量估计总体参数,称为总体参数估计。首先学习单个样本的统计假设检验,检验的基本步骤:1.提出假设。2.构造并计算检验统计量:利用原假设所提供的信息,而且抽样分布已知。3.确定否定域(临界值):根据小概率事件原理,比较检验统计量和临界值的关系,确定其落在否定域还是接受域。主要学了t检验,u检验、x2检验。接着学了两个样本的差异显著性检验,包括两个方差的检验----F检验,标准差已知时两个平均数间差异显著性的检验,标准差未知但相等时,两平均数之间差异显著性的检验,标准差未知且可能不等时两平均数之间差异显著性的检验,配对数据的显著性检验-----配对数据的t检验,二项分布数据的显著性检验。 在第六章,我学了参数估计,即由样本统计量估计总体参数。估计量是估计总体参数的统计量,一个好的估计量应该满足三个条件:无偏性、有效性、相容性。对总体参数的估计,可分为点估计和区间估计。区间估计是指在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫置信区间,本章我学习了μ的置信区间、σ的置信区间、平均数差的置信区间、配对数据的置信区间、标准差比的置信区间二项分布总体的置信区间。 在第七章,我学了拟合优度检验,拟合优度检验是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。做拟合优度检验一般需一下各步:1.对数据进行分组。2.计算理论数Ti。3分别合并两个尾区的理论数。4.零假设。5.计算出x2与x2临界值(查附表6)做比较。

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

相关主题