搜档网
当前位置:搜档网 › 史上最全生物统计学考试总结

史上最全生物统计学考试总结

史上最全生物统计学考试总结
史上最全生物统计学考试总结

第一章

生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。

内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法

统计分析:数据资料的搜集、整理和特征数的计算、

统计推断、方差分析、回归和相关分析、协方差分析等

生物统计学的作用:

1. 提供整理、描述数据资料的科学方法并确定其特征

2. 判断试验结果的可靠性

3. 提供由样本推断总体的方法

4. 试验设计的原则

相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合

2.个体:组成总体的基本单元

3.样本:由总体中抽出的若干个体所构成的集合

n >30 大样本; n <30 小样本

4.参数:描述总体特征的数量

5.统计数:描述样本特征的数量

由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数

6..效应:由因素而引起试验差异的作用

7. 互作:两个或两个以上处理因素间的相互作用产生的效应

生物统计学的研究包括了两个过程: 1. 从总体抽取样本的过程——抽样过程

2. 从样本的统计数到总体参数的过程——统计推断过程

第二章

1.算术平均数:是所有观察值的和除以观察的个数 平均数(AVERAGE )

特性

(1)样本中各观测值与平均数之差-离均差-的总和等于零

(2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小 2.中位数:将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为中位数,以Md 表示

3.众数:在一个样本的所有观察值中,发生频率最大的一个值称为样本的众数,以M o 表示

4.几何平均数:资料中有n 个观测值,其乘积开n 次方所得的数值,以G 表示。 5.极差(全距):样本数据资料中最大观测值与最小观测值的差值

R =max{x 1,x 2,…,x n} — mix{x 1,x 2,…,x n}

7.样本标准差:

(1)标准差的大小,受多个观测值的影响,如果观测值与观测值间差异大,标准差就大

(2)在计算标准差的时候,如果对各个观测值加上或者减去一个常数a ,其标准差不变;如果乘以或除以一个常数a ,则标准差扩大或者缩小a 倍

STDEV: 基于给定样本的标准偏差

STDEVP 8变异系数(CV )比

(1)变异系数是样本变量的相对变量,是不带单位的纯数 (2)用变异系数可以比较不同样本相对变异程度的大小

第三章

概率的计算法则:

(1)乘法定理:如果A 和B 为独立事件,则事件A 和B 同时

发生的概率等于各自事件的概率的乘积 (2)加法定理:互斥事件A 和B 的和的概率等于事件A 和事件B 的概率之和 加法定理推理1:

如果A1、A2、…An 为n 个互斥事件,则其和事件的概率为:

P (A 1+A 2…A n )=P (A 1)+P (A 2)+…+P (A n ) 加法定理:如果A 和B 是任何两件事件,则 概率分布:

离散随机变量的方差

(2)连续型随机变量的概率分布 连续型随机变量的概率分布

1. 连续型随机变量可以取某一区间或整个实数轴上的

任意一个值

2. 它取任何一个特定的值的概率都等于0

3. 不能列出每一个值及其相应的概率

4. 通常研究它取某一区间值的概率

5. 用数学函数的形式和分布函数的形式来描述 概率密度函数:(1)设X 为一连续型随机变量,x 为任意实数,X 的概率密度函数记为f(x),它满足条件

(2) ,f (x )不是概率

几种常见的概率分布:(适用范围,尾函数,自由度)

1. 二项分布的概率函数 记作B (n ,p )或者B (n ,π) (1)每次试验只有两个对立结果,分布记为A 与 它们出现的概率分布为p 与q (q =1-p ) (2)试验具有重复性和独立性

二项式分布的概率累积函数:

若随机变量x 服从二项式分布,则有二项分布的总体平均数为

二项分布的总体标准差为:

二项成数(百分数)分布的平均数:

二项成数(百分数)分布的标准差:

例:假设年龄60~64岁的100名男性在1986年注射了一种新的流感疫苗而在第二年内死亡5人,这正常嘛?(注:1986年,60~64岁的男性老人第二年的死亡率约为0.02)

解:要知道100个男性的样本死亡5人是不是“异常”事件,这种估计的一个准则是寻找至少5人死亡的概率。

)()()(B P A P B A P ?=?)()()(B P A P B A P +=+

注:通常是把概率值为0.05或

者更小的概率事件识别为异常

(稀有事件)。

由于至少5人死亡的概率是

0.05,可见100人中至少死亡

5人是稍微有点异常,但不是

很异常。

如果至少死亡10人,那么概率

是3.44*10-5,这就很不正常,

因而,在没有其他证据显示此疫苗有效前,

应考虑停止使用。

2. 泊松分布

二项式分布中,如果p值很小而n值很大(p<0.1 和

np<5 ),则泊松分布

式中:为参数,

泊松分布的平均数、方差、标准差

例:假如我们研究乳腺癌的遗传敏感性。我们发现,母亲

曾患有乳腺癌的1000名40~49岁的妇女,在研究开始后的1

年中,有4人患有乳腺癌,而我们从大总体中知道在这相同

的时间内,1000人中有1个人发生乳腺癌。试问乳腺癌有没

有敏感性?

BINOMDIS

T

number_

s

Trial

s

probability

_s

cumulativ

e

3 1000 0.001 Ture 0.98

1

0.01

9

1

则:这个事件是异常事件,则认为有乳腺癌的妇女,她们的

子代具有遗传敏感性

6.正态分布求和为0

4. t分布:是小样本分布,小样本分布一般是指n<30。t分

布适用于

当总体标准差未知时用样本标准差代替

总体标准差,

由样本平均数推断总体平均数.

以及2个小样本之间差异的显著性检验等

P45

6.F分布

1、概率抽样:根据已知的概率选取样本

简单随机抽样:完全随机地抽选样本

分层抽样:总体分成不同的“层”,然后在每一层内进行抽样

整群抽样:将一组被调查者(群)作为一个抽样单位

等距抽样:在样本框中每隔一定距离抽选一个被调查者

2、非概率抽样:不是完全按随机原则选取样本

非随机抽样:由调查人员自由选取被调查者

判断抽样:通过某些条件过滤来选择被调查者

3、配额抽样:选择一群特定数目、满足特定条件的被调查者

抽样分布:从一个给定的总体中抽取(不论是否有放回)容

量(或大小)为n的所有可能的样本,对于每一个样本,计

算出某个统计量(如样本均值或标准差)的值,不同的样本

得到的该统计量的值是不一样的,由此得到这个统计量的分

布,称之为抽样分布

1.所有样本指标(如均值、比例、方差等)所形成的分

布称为抽样分布

2.是一种理论概率分布

3.随机变量是样本统计量——样本均值, 样本比例等

4 结果来自容量相同的所有可能样本

(符号)

样本平均数的基本性质:

(1)样本均值的均值(数学期望)等于总体均值μ

μ=

x

定义:一个参数θ的估计量是θ?,如果θ

θ=

)?(E,则称θ

是θ的无偏估计

(2)样本均值的方差等于总体方差的1/n

n

x

2

2

σ

σ=

(3)样本平均数的标准误差的定义

(4)当总体服从正态分布N~(μ, σ 2 )时,来自总体的所有

容量为n的样本的均值也服从正态分布,的数学期望为

μ,方差为σ2/n。即~N(μ, σ2/n)

中心极限定理:设从均值为μ,方差为σ2的一个任意总体中

抽取容量为n的样本,当n充分大时,样本均值的抽样分布

近似服从均值为μ、方差为σ2/n的正态分布

两个独立样本平均数差数的分布P44

第四章

假设检验:又称显著性检验:根据总体的理论分布和小概率

原理,对未知或不完全知道的总体提出两种彼此对立的假设,

然后由样本的实际结果,经过一定的计算,做出在一定概率

意义上应该接受的那种假设的推断。

如果抽样结果使小概率事件发生,则拒绝假设。

如果抽样结果没有使小概率事件发生,则接受假设

特点:(1)采用逻辑上的反证法(2)依据统计学上的小概率

原理

生物统计学上,一般认为:等于或小于0.05或0.01的概率

为小概率

在一次试验中,一个几乎不可能发生的事件发生的概率。

假设检验的步骤: 1、提出假设 2、确定适当的检验统

计量

3、确定显著性水平a

4、计算概率

5、推断是否

接受假设

!

)

(

x

e

x

P

x

λλ-

=

λ,...

2,1,0

,=

=x

np

λ

μ

)

,

(2

σ

μ

N

X

两类:1)弃真错误;2)取伪错误

一.大样本平均数的假设检验——u 检验

应用范围:1)总体方差 2

σ 已知

2)总体方差 2

σ 未知,但样本为大样本

( 30≥n ), 用s 2

来代替 2

σ

两个样本平均数比较的u 检验

二、小样本平均数的假设检验——t 检验

应用范围:

总体方差 未知,且样本为小样本( ), 采

用t 检验 当总体方差 为未知时,当样本容量小于30,检验一个样本平均数 是否属于平均数为 的指定总体,其 遵循自由度为df =n -1的t 分布

第五章

统计假设:H 0:观测值与理论值的差异是由随机误差引起 H A :观测值与理论值之间有真实差异

所以卡方值是度量实际观测值与理论值偏南程度的一个统计量

卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大

卡方值为0,表明H 0严格成立,且它不会有下侧否定区,只能进行右尾检验

连续性:由于离散型资料的卡方检验只是近似地服从连续型变量的卡方分布,所以在对离散型资料进行卡方检验计算的时,结果常常偏低,特别是当自由度df =1时,有较大偏差,为此需要进行矫正,当自由度df >1时,与连续型随机变量卡方分相近似,这时可以不做连续性矫正

注意:要求各个组内的理论次数不小于5,如某组理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止

适合性检验(吻合性检验或拟合优度检验)步骤:

1. 提出无效假设,即认为观测值和理论值之间没有差异

2. 规定显著性水平

3. 计算样本卡方值

4. 根据规定的显著水平和自由度计算出卡方值,再和实际计算的卡方值进行比较 独立性检验步骤:

1. 提出无效假设,即认为所观测的各属性之间没有关联

2. 规定显著性水平

3. 根据无效假设计算出理论数

4. 根据规定的显著水平和自由度计算出卡方值,再和计算的卡方值进行比较。

如果接受假设,则说明因子之间无相关联,是相互独立的

如果拒绝假设,则说明因子之间的关联是显著的,不独立

第六章

方差分析又称 F 检验 (F -test );方差分析是关于k (k ≥3)

个样本平均数的假设测验方法,是将总变异按照来源分为处理效应和试验误差,并做出其数量估计。

发现各变异原因在总变异中相对重要程度的一种统计分

析方法。

总变异分解为组间变异和组内变异。 组内变异是个体差异所致,是抽样误差。

组间变异可能由两种原因所致,一是抽样误差;二是处理不同。 在抽样研究中抽样误差是不可避免的,故导致组间变异的第

一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断

方差分析基本思想:

1、把k 个总体当作一个整体看待

2、把观察值的总变异的平方和及自由度分解为不同来源的平方和及自由度

3、计算不同方差估计值的比值

4、检验各样本所属的平均数是否相等

? 实际上是观察值变异原因的数量分析 方差分析应用条件:

1、各样本须是相互独立的随机样本

2、各样本来自正态分布总体

3、各总体方差相等,即方差齐 方差分析基本用途:

1、多个样本平均数的比较

2、多个因素间的交互作用

3、回归方程的假设检验

4、方差的同质性检验

2σ30

σ0μx s x μ-x

x

总平方和=处理间平方和+处理内平方和总自由度=处理间自由度+处理内自由度

统计假设的显著性检验——F检验:F检验的目的:推断处理间的差异是否存在

方差分析中的F检验总是单尾检验,而且为右尾检验?F越大,越说明组间方差是主要方差来源,因子影响越显著;

?F越小,越说明随机方差是主要的方差来源,因子的影响越不显著

F检验如果否定了H0,接受了H A,表明试验的总变异主要来源于处理间的变异

多重比较:多个平均数的相互比较

常用的:1、最小显著差数法(LSD法)

2、最小显著极差法(LSR法)—新复极差检验(SSR 法)—q检验

总结:差异不显著标同一字母,差异显著标不同字母

最小显著极差法(LSR法)

?把平均数的差异看成是平均数的极差(range)

?根据极差范围内所包括的处理数(称为秩次距)k的不同,而采用不同的检验尺度叫做最小显著极差LSR ?秩次距是指当平均数由大到小排序后,相比较的两个平均数之间(含这两个平均数)包含的平均数个数?I类错误下降、工作量加大

新复极差法

q检验法

两因素方差分析:

互作:某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称互作。互作效应实际是由于两个或多个试验因素的相互作用而产生的效应

采用EXCEL计算重复观测值的二因素方差分析:

1、数据输入区域必须有标题

2、直接分析结果仅适用用固定模型

第七章

相关系数的显著性检验

上述根据实际观测值计算得来的相关系数r是样本相关系数,它是双变量正态总体中的总体相关系数ρ的估计值。样本相关系数r是否来自ρ≠0的总体,还须对样本相关系数r进行显著性检验。此时无效假设、备择假设为H O:ρ=0,H A:ρ≠0。与直线回归关系显著性检验一样,可采用t检验法与F检验法对相关系数r的显著性进行检验。

第八章

对于同一组实测数据,根据散点图的形状,可用若干相近的曲线拟合,同时建立若干曲线回归方程,然后根据R2的大小和生物学等相关专业知识,选择即符合生物学规律,拟合度又较高的曲线回归方程来描述两个变量间的曲线回归关系

第九章

样本容量的确定

第十章

实验设计的基本原则和作用

常用的试验设计的方法:1、对比设计2、随机区组设计3、裂区组设计4、正交设计

分析步骤:

3、试验结论分析:对邻近CK的百分数越高(大于100%),就越可能优于对照,但绝不能认为超过100%的所有处理都显著地优于对照,因为将处理与相邻CK相比只是减少了误差,实际误差仍然存在,要判断某个处理确实优于对照,一般至少要超过对照10%;凡仅超过对照5%的,均宜继续试验再做结论。

该判断方法由于不同试验的误差大小不同,仅是一种参考

随机区组设计及其统计分析:

设计方法:

1、将试验单位按性质不同分成与重复数一样多的区组;

2、每个区组内非试验相对一致,并随机排列一套试验处理;

3、不同区组间非试验因素允许有所不同,将不同重复也随机排列于各个区组

4、最终使区组内非试验因素差异最小,而区组间非试验因素差异最大,每个区组均包括全部处理

5、统计分析采用方差分析,将区组间误差分解出来,从而降低试验误差,提高试验精度

单因素随机区组:把区组看作一个因素,和试验因素一起当作二因素试验,按照二因素无重复观察值的方差分析进行,主要做区组间、处理间和试验误差3个方面的方差分析

二因素随机区组:

裂区设计及其统计分析:

统计分析采用方差分析:

区组间、A因素、B因素、AB互作、主区误差和副区误差的方差分析

正交设计及其统计分析:

正交表:正交设计法中合理安排实验,并对数据进行统计分析的一种特殊表格。

正交设计的基本步骤:

(1)明确试验目的,确定试验指标

(2)挑选因素,选取水平,列出因素水平表

(3)选用正交表,进行表头设计

根据试验因素、水平数和是否需要估计因素间的相互作用来选择合适正交表。原则:能安排下全部试验因素,又要使部分试验的水平组合尽可能小。

各因素的水平数减1之和加1,即为所需的最少试验次数或处理组合数,若因素间有交互作用,需要再加上交互的作用的自由度。

?表头设计就是将试验因素安排到所选正交表相应的列中。

表头设计原则:1、不要让主效应间,主效应与交互作用间有

混杂现象;2、存在交互作用,查交互作用表(4)明确试验方案,进行试验,得到以试验指标形式表示的试验结果。

(5)对试验结果进行统计分析

通常采用两种方法:直观分析法、方差分析法。通过试验结果分析,可以得到因素主次顺序、最佳水平组等有用信息。

(6)进行验证试验,做进一步分析。

生物统计学期末考试上机考试部分 复习试卷B

云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0

ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

初级生物统计学学习心得

高级生物统计学课程学习总结 摘要:经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。本文主 要讲述了本学期学习生物统计之后,我对生物统计学的收获和体会。 关键词:生物统计学 收获 体会 学习了黄老师讲授的《高级生物统计学》这门课程,我觉得自己又收获了不少。经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。虽说我的专业是课程与 教学论,对生物统计学知识的运用较少,但我深信,于我自身,它将起到不可估量的作用。 下面主要谈谈我对这门课程的理解与感悟。 1.对生物统计学的认识 1.1生物统计学的概念 生物统计学是一门以概率理论为基础的,实际应用性非常强的综合性的学科。它运用概率论与数理统计的原理和方法处理生物学中的各种数量资料,从而透过现象揭示生物学 本质的一门科学,是科学研究与实践应用的基础工具。它是研究如何搜集、整理、分析反 映整体信息的数字资料,并以此为依据,推断总体特征,然后用生物学的语言加以描述的 工具。 从生物统计学的概念我们不难看出,生物统计是要我们根据部分所反映出来的性质,推断总体的性质,在推断的过程中,不可避免的会有一定的出错概率,我们只是选择不同 的分析方法将这一概率降到最低。它不仅为我们提供了设计试验,获取资料的方法,还提 供了整理资料,最后得出科学结论的方法。因此,学好生物统计对我们以后设计试验,分 析试验数据,得出科学而精简的结论有很大帮助。 1.2生物统计学的重要性 统计学在生物学中的应用已有长远的历史,许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。 随着基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生 物科技领域上扮演着不可或缺的角色。,生物统计学在这些领域被广泛应用,并显得日益重 要。生物统计学是生物领域学生应具备的基本知识和素质,与生命活动有关的各种现象中 普遍存在着随机现象,大到整个生态系统,小到核苷酸序列,均受到许多随机因素的影响, 表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必 然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生物科 管线不仅可以解决吊顶层配卷问题,而且可保障各类路敷设过程中,要加强看料试卷连接管口处理高中资料试卷保护层防腐跨接地线弯曲半径标高中语文电气课件中管壁薄、接利用管线敷设技术。线缆敷设原则不同电压回路交叉时,应采用金属同一线槽内强电回路须同时切根据生产工艺高中资料试卷要求,与带负荷下高中资料试卷调控试使其在正常工况下与过度工作下都于继电保护进行整核对定值,审核杂设备与装置高中资料试卷调试动过程中高中资料试卷电气设备进过关运行高中资料试卷技术指导中资料试卷技术问题,作为调试人图纸资料、设备制造厂家出具高案。 保护高中资料试卷配置技术是指高中资料试卷总体配置时,需要在机组高中资料试卷安全,并且尽可料试卷破坏范围,或者对某些异进行自动处理,尤其要避免错误高然停机。因此,电力高中资料试,要求电力保护装置做到准确灵活置高中资料试卷调试技术是指发电内部故障时,需要进行外部电源

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

《生物统计学》教学大纲

《生物统计学》教学大纲 课程名称:生物统计学 课程类型:范围选修课-基础课 学时:56学时,3.5学分 适用对象:农学、植物保护、生物技术、生物科学、草业科学等本科专业先修课程:高等数学、线性代数、概率论与数理统计、植物学、植物生理学、遗传学等课程 一、课程性质、目的与任务以及对先开课程要求 统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的一般统计学。统计方法是现代生物学研究不可缺少的工具。正确的统计分析能够帮助我们正确认识事物客观存在的规律性。 概率论与数理统计等先开课程的重点是讲述没有量纲或单位抽象的数量规律,为生物学科应用这些规律打基础。 二、教学重点及难点 本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。本课程的难点是概念较多、理论抽象、系统严密、实践性强、公式复杂、符号繁多、计算量大,因此,教学安排上除精讲48学时外,有针对性的安排上机操作8学时。 三、与其他课程关系 生物统计学与数学有密切关系,现代统计学用到了较多的数学知识,研究理论生物统计学的人需要有较深的数学功底,应用统计方法的人也应具备良好的数学基础。统计学又是一门应用性很强的学科,几乎生物学科所有的门类都要研究和分析数据,掌握生物学类学科专业基础课和专业课程知识有利于对统计分析的结果做出合理的解释和分析。 四、教学内容、学时分配及基本要求 绪论(1学时) 基本要求:理解什么是统计?什么是统计学;统计数据与统计学的关系,描述统计与推断统计内涵;统计方法能解决生物学科中哪些问题,了解生物 统计学的产生与发展。

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学课堂作业及答案

1. 资料可以分为哪几类?它们有何区别? 答:(1)资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中 数量性状资料又包括计量资料和计数资料。 (2)区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系 三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 2. 为什么要对资料进行整理?对于计量资料,整理的基本步骤是什么? 答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。②确定组数,一般根据样本含量及资料的变动范围大小确定组数。③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。④确定组限和组中值,各组的最大值为组上限,最小值为组下限 每一组的中点值称为组中值。⑤归组划线计数,作次数分布表。 3. 在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。 4. 统计表与统计图有何用途?常用统计表、统计图有哪些?列统计表、绘统计图时,应注意什么? 答:(1)统计表用表格形式来表示数量关系 统计图用几何图形来表示数量关 系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形 象地表达出来,便于比较分析。 (2)常用的统计图有长条图、圆图、线图、直方图和折线图等。 (3)常用的统计表有简单表和复合表两大类。 (4)列统计表的注意事项: ①标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。 ②标目分横标目和纵标目两项,横标目列在表的左侧用以表示被说明事物的主要标志,纵标目列在表的上端说明横标目各统计指标内容,并注明计算单位。 ③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。 ④表的上下两条边线略粗、纵、横标目间及合计用细线分开 表的左右边线可以省去表的左上角一般不用斜线。 (5)绘统计图的注意事项: ①标题简明扼要并列于图的下方。 ②纵、横两轴应有刻度,注明单位。 ③横轴由左至右,纵轴由上而下,数值由小到大,图形长宽比例约为5:4或6:5。 ④图中需用不同颜色或线条表示不同事物时应有图例说明。 5. 生物统计中常用的平均数有几种?各在什么情况下应用? 答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学学习心得

生物统计学学习心得 一、《生物统计学》这一门课。你学到什么?谈谈你学习这一门课的心得体会。 (一)、《生物统计学》这门课,首先,我不仅学到了很多生物统计方面的基础知识、基本概念和相关的应用,还学习了如何设计试验。 在第一章,我学了统计数据的收集与整理。首先学习的是总体与样本的概念,统计学研究的核心问题是如何通过样本推断总体,因此,总体与样本是生物统计学中的两个最基本概念。总体是我们研究的全部对象。构成总体的一个研究单位称为个体。样本是总体的一部分,样本内包含的个体数目称为样本含量。接着学习了数据类型及频数分布。生物统计学中经常遇到的数据有两种类型,一种是连续型数据,指与某种标准做比较所得到的数据,采用变量的方法进行分析。另一种是离散型数据,指由记录不同类别的个体的数目所得到的数据,采用属性的方法进行分析。最后学习了样本的几个特征数,平均数、标准差、方差。 在第二章,我学了概率和概率分布。概率是事件所固有的,且不随人的主观意识而改变。总体分布是建立在概率这一概念基础之上的,因此在研究总体分布之前首先应对概率的基本知识有所了解。试验的每一最基本的结果称为基本事件,指不能再分的事件。复合事件指由若干个基本事件组合而成的事件。概率的基本运算法则包括概率加法法则、条件概率、概率乘法法则、独立事件。概率分布包括离散型概率分布和连续型概率分布。 在第三章,我学了几种常见的概率分布律。首先学了二项分布,二项分布的基本情况是:设有一随机试验,每次试验都有两种不同的结果,如成功的(事件A)和失败的(事件A’);生男孩(事件A)和生女孩(事件A’)。显然这两种可能的结果是互不相容的,独立地将此试验重复做n次,求在n次试验中,一种结果出现y次的概率。接着学了泊松分布、超几何分布、负二项分布、正态分布、指数分布等。 在第四章,我学了抽样分布。首先学了从一个正态总体中抽取的样本统计量的分布,学了一些基本概念,如标准误差、样本标准误差、自由度、查表。然后学了从两个正态总体中抽取的样本统计量的分布,包括标准差已知时两个平均数的和与差的分布、标准未知但相等时两个平均数的和与差的分布、两个样本方差比的分布----F分布。 在第五章,我学了统计推断。对总体做统计推断可以通过两条途径进行,一是首先对所估计的总体提出一个假设,称为统计假设检验,二是通过样本统计量估计总体参数,称为总体参数估计。首先学习单个样本的统计假设检验,检验的基本步骤:1.提出假设。2.构造并计算检验统计量:利用原假设所提供的信息,而且抽样分布已知。3.确定否定域(临界值):根据小概率事件原理,比较检验统计量和临界值的关系,确定其落在否定域还是接受域。主要学了t检验,u检验、x2检验。接着学了两个样本的差异显著性检验,包括两个方差的检验----F检验,标准差已知时两个平均数间差异显著性的检验,标准差未知但相等时,两平均数之间差异显著性的检验,标准差未知且可能不等时两平均数之间差异显著性的检验,配对数据的显著性检验-----配对数据的t检验,二项分布数据的显著性检验。 在第六章,我学了参数估计,即由样本统计量估计总体参数。估计量是估计总体参数的统计量,一个好的估计量应该满足三个条件:无偏性、有效性、相容性。对总体参数的估计,可分为点估计和区间估计。区间估计是指在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫置信区间,本章我学习了μ的置信区间、σ的置信区间、平均数差的置信区间、配对数据的置信区间、标准差比的置信区间二项分布总体的置信区间。 在第七章,我学了拟合优度检验,拟合优度检验是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。做拟合优度检验一般需一下各步:1.对数据进行分组。2.计算理论数Ti。3分别合并两个尾区的理论数。4.零假设。5.计算出x2与x2临界值(查附表6)做比较。

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

相关主题