搜档网
当前位置:搜档网 › 生物统计学与试验设计(电子教材)

生物统计学与试验设计(电子教材)

生物统计学与试验设计(电子教材)
生物统计学与试验设计(电子教材)

《生物统计学与试验设计》教案

第一章绪论:

一、教学学时:4

二、教学要点:

1. 生物统计学与试验设计在生物科学研究中的意义、地位和作用,生物学试验设计、调查设计的原则,试验误差及其控制;

2.生物统计学与试验设计的一些常用基本概念;

3.试验资料的分类,各类资料的次数分布表和次数分布图的制作方法;平均数、极差、方差、标准差、变异系数的具体计算方法。

三、教学难点:

各类资料的次数分布表和次数分布图的制作,平均数、极差、方差、标准差、变异系数的计算。

第一节生物统计学概念

生物统计学与试验设计,英文名称是Biostatistics and Experimental Design,是研究生物的遗传与变异、试验处理间及试验处理与环境间数量关系的一门科学,是数理统计原理在生物科学中的应用,是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,在生物科学的发展中起着很重要的作用,已成为生命科学中非常重要的组成部分。

一、提供试验或调查设计的方法

试验设计这一概念有广义与狭义之分,广义的试验设计是指试验研究课题设计,也就是指整个试验计划的拟定,包含课题名称、试验目的,研究依据、内容及预期达到的效果,试验方案,供试单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试验结果的分析方法,经济效益或社会效益的估计,已具备的条件,需要购置的仪器设备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等内容。狭义的试验设计主要是指试验单位(如动、植物)的选取、重复数目的确定及试验单位的分组。生物统计中的试验设计主要指狭义的试验设计。合理的试验设计能控制和降低试验误差,提高试验的精确性,为统计分析获得试验处理效应和试验误差的无偏估计提供必要的数据。

调查设计这一概念也有广义与狭义之分,广义的调查设计是指整个调查计划的制定,包括调查研究的目的、对象与范围,调查项目及调查表,抽样方法的选取,抽样单位、抽样数量的确定,数据处理方法,调查组织工作,调查报告撰写与要求,经费预算等内容。狭义的调查设计主要包含抽样方法的选取,抽样单位、抽样数目的确定等内容。生物统计中的调查设计主要指狭义的调查设计。合理的调查设计能控制与降低抽样误差,提高调查的精确性,为获得总体参数的可靠估计提供必要的数据。

简而言之,试验或调查设计主要解决合理地收集必要而有代表性资料的问题。

二、提供整理、分析资料的方法

整理资料的基本方法是根据资料的特性将其整理成统计表、绘制成统计图。通过统计表、图可以大致看到所得资料集中、离散的情况。并利用所收集得来的数据计算出几个统计量,以表示该资料的数量特征、估计相应的总体参数。

统计分析最重要的内容是差异显著性检验。通过抽样调查或控制试验,获得的是具有变异的资料。产生变异的原因是什么?是由于进行比较的处理间,例如不同品种、不同饲料配方间有实质性的差异或是由于无法控制的偶然因素所引起?显著性检验的目的就在于承认并尽量排除这些无法控制的偶然因素的干扰,将处理间是否存在本质差异揭示出来。显著性检验的方法很多,常用的有t检验——主要用于检验两个处理平均数差异是否显著;方差分

检验——主要用于由质量性状得析——主要用于检验多个处理平均数间差异是否显著;2

来的次数资料的显著性检验等。

第二节生物统计的常用术语

一、总体与样本

根据研究目的确定的研究对象的全体称为总体(population),其中的一个研究单位称为个体(individual);总体的一部分称为样本(sample)。含有有限个个体的总体称为有限总体。包含有无限多个个体的总体叫无限总体。例如在生物统计理论研究上的服从正态分布的总体、服从t分布的总体,包含一切实数,属于无限总体。在实际研究中还有一类假想总体。例如进行几种饲料的饲养试验,实际上并不存在用这几种饲料进行饲养的总体,只是假设有这样的总体存在,把所进行的试验看成是假想总体的一个样本。样本中所包含的个体数目叫样本容量或大小(sample size)。样本容量常记为n。通常把n≤30的样本叫小样本,n>30的样本叫大样本。

生物统计一般是通过样本来了解总体。这是因为或者总体是无限的、假想的;即便是有限的但包含的个体数目相当多,要获得全部观测值须花费大量人力、物力和时间;或者观测值的获得带有破坏性。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。为了能可靠地从样本来推总体,要求样本具有一定的含量和代表性。只有从总体随机抽取的样本才具有代表性。所谓随机抽取(random sampling)是指总体中的每一个个体都有同等的机会被抽取组成样本。

二、参数与统计量

为了表示总体和样本的数量特征,需要计算出几个特征数。由总体计算的特征数叫参数(parameter);由样本计算的特征数叫统计量(statistic)。常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;常用拉丁字母表示统计量,例如用x表示样本平均数,用S表示样本标准差。总体参数由相应的统计量来估计,例如用x估计μ,用S估计σ等。

三、准确性与精确性

准确性(accuracy)也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为μ,观测值为x,若x与μ相差的绝对值|x -μ|小,则观测值x的准确性高;反之则低。精确性(precision)也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意二个观测值x i 、x j相差的绝对值|x i -x j|小,则观测值精确性高;反之则低。准确性、精确性的意

四、随机误差与系统误差

试验中出现的误差分为两类:随机误差(random error)与系统误差(systematic error)。随机误差也叫抽样误差(sampling error),这是由于许多无法控制的内在和外在的偶然因素如试验动物的初始条件、饲养条件、管理措施等尽管在试验中力求一致但不可能绝对一致所造成。随机误差带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。系统误差也叫片面误差(lopsided error),这是由于试验动物的初始条件如年龄、初始重、性别、健康状况等相差较大,饲料种类、品质、数量、饲养条件未控制相同,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。图1-1(c)、(d)所表示的情况,则是由于出现了系统误差的缘故。

第三节平均数、标准差与变异系数

介绍平均数(mean)、标准差(standard deviation)与变异系数(variation coefficient)三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而分布的性质;后两者用于反映资料的离散性,即观测值离中分散变异的性质。

一、平均数

平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有算术平均数(arithmetic mean)、中位数(median)、众数(mode)、几何平均数(geometric mean)及调和平均数(harmonic mean),现分别介绍如下。

(一)算术平均数

算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,

记为x 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。

(一)直接法 主要用于样本含量n ≤30以下、未经分组资料平均数的计算。

设某一资料包含n 个观测值:x 1、x 2、…、x n ,则样本平均数x 可通过下式计算:

n

x

n

x x x x n

i i

n ∑==

+++=1

21

其中,Σ为总和符号;

∑=n

i i x 1表示从第一个观测值x 1

累加到第n 个观测值x n

。当∑=n

i i

x

1

在意义上已明确时,可简写为Σx ,(3-1)式即可改写为:

n x x ∑=

(二)加权法 对于样本含量n ≥30以上且已分组的资料,可以在次数分布表的基础

上采用加权法计算平均数,计算公式为:

∑∑∑∑==

++++++===f fx f x f f f f x f x f x f x k

i i

k

i i i k

k

k 1

1

212211 式中:i x —第i 组的组中值; i f —第i 组的次数;

k —分组数

第i 组的次数f i 是权衡第i 组组中值x i 在资料中所占比重大小的数量,因此f i 称为是x i

的“权”,加权法也由此而得名。 (三)平均数的基本性质

1、样本各观测值与平均数之差的和为零,即离均差之和等于零。

0)(1=-∑=x x n

i i 或简写成∑=-0)(x x

2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。

=n

i 1

(x i -x )2<

=n

i 1

(x i - a )2 (常数a ≠x )

或简写为:

∑-2)(x x <∑-2)(αx

对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:

N x n

i i ∑==1

μ (3-3)

式中,N 表示总体所包含的个体数。

当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数(x )作为总体平均数(μ)的估计量,并已证明样本平均数x 是总体平均数μ的无偏估计量。

(二)中位数

将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为M d 。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。

(一)未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大

依次排列。

1、当观测值个数n 为奇数时,(n+1)/2位置的观测值,即x (n+1)/2为中位数;

M d =2/)1(+n x

2、当观测值个数为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中

位数,即:

2

)

12/(2/++=

n n d x x M

(二)已分组资料中位数的计算方法 若资料已分组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为:

)2

(c n

f i L M d -+

= 式中:L —中位数所在组的下限; i —组距;

f —中位数所在组的次数; n —总次数;

c —小于中数所在组的累加次数。

(三)几何平均数

n 个观测值相乘之积开n 次方所得的方根,称为几何平均数,记为G 。它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下:

n n n n x x x x x x x x G 1

)(321321 ??=??=

为了计算方便,可将各观测值取对数后相加除以n ,得lgG ,再求lgG 的反对数,即得G 值,即

)]lg lg (lg 1

[lg 211n x x x n

G +++=-

(四) 众 数

资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M 0。

(五) 调和平均数

资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为H ,即

=

++

=

x

n

x x x n n

H 1111111

)

(1

2

1

调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。 对于同一资料,算术平均数>几何平均数>调和平均数。 上述五种平均数,最常用的是算术平均数。

二、标准差

(一) 标准差的意义

为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,即(x x -),称为离均差。先将各个离均差平方,即 (x x -)2,再求离均差平方和,即Σ2)(x x -,简称平方和,记为SS ;由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,即Σn x x /)(2-,求出离均差平方和的平均数;为了使所得的统计量是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n ,而用自由度n-1,于是,我们采用统计量Σ

1/)(2--n x x 表示资料的变异程度。统计量Σ1/)(2--n x x 称为均方(mean square 缩写为

MS ),又称样本方差,记为S 2

,即

S 2

=

∑--1/)(2n x x

相应的总体参数叫总体方差,记为σ2

。对于有限总体而言,σ2

的计算公式为:

σ2

-=

x (μ)2

/N

由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S 2

的平方根叫做样本标准差,记为S ,即:

1

)(2

--=

∑n x x S

由于

∑∑+-=-)2()(222

x x x x x x

222x n x x x +-=

∑∑

22

2)(

)(2

n

x n n

x x ∑∑∑+-=

n

x x 2

2

)(∑∑-

=

可改写为:

1

2)(2

--=

∑∑n x S n

x

相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为:

σ=

∑-N x /)(2μ

在统计学中,常用样本标准差S 估计总体标准差σ。

(二)标准差的计算方法

(一)直接法 对于未分组或小样本资料,可直接计算标准差。

【例】 计算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550,600,600,650(g )的标准差。

此例n =10,经计算得:Σx =5400,Σx 2=2955000,代入(3—12)式得:

828.651

1010

/540029550001

/)(222=--=

--=

∑∑n n x x S (g)

即10只辽宁绒山羊产绒量的标准差为65.828g 。

(二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权

法计算标准差。计算公式为:

∑∑∑∑∑∑--=

--=

1

/)(1

)(222

f f

fx fx f x x f S

式中,f 为各组次数;x 为各组的组中值;Σf = n 为总次数。

【例】 利用某纯系蛋鸡200枚蛋重资料的次数分布表(见下表)计算标准差。

表 某纯系蛋鸡200枚蛋重资料次数分布及标准差计算表

组别 组中值(x )

次数(f )

fx fx 44.15— 45.0 3 135.0 6075.0 45.85— 46.7 6 280.2 13085.34 47.55— 48.4 16 774.4 37480.96 49.25— 50.1 22 1102.2 55220.22 50.95— 51.8 30 1554.0 80497.20 52.65— 53.5 44 2354.0 125939.00 54.35— 55.2 28 1545.0 85317.12 56.05— 56.9 30 1707.0 97128.30 57.75— 58.6 12 703.2 41207.52 59.45— 60.3 5 301.5 18180.45 61.15— 62.0

4

248.0

15376.00

合计

Σf =200 Σfx =10705.1 Σfx 2=575507.11

5524.31

200200/1.1070511.5755071

/)(222=--=--=

∑∑∑∑f f

fx fx S (g )

即某纯系蛋鸡200枚蛋重的标准差为3.5524g 。

(三) 标准差的特性

(一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。

(二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。

(三)当每个观测值乘以或除以一个常数a ,则所得的标准差是原来标准差的a 倍或1/a 倍。

(四)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(x ±S )范围内;约有95.43%的观测值在平均数左右两倍标准差(x ±2S )范围内;约有99.73%的观测值在平均数左右三倍标准差(x ±3S )范围内。也就是说全距近似地等于6倍标准差,可用(6/全距)来粗略估计标准差。

三、 变异系数

变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平均数的比值称为变异系数,记为C ·V 。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。

变异系数的计算公式为:

%100?=

?x

S

V C 【例】 已知某良种猪场长白成年母猪平均体重为190kg ,标准差为10.5kg ,而大约克成年母猪平均体重为196kg ,标准差为8.5kg ,试问两个品种的成年母猪,那一个体重变异程度大。

此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较其变异程度的大小。

由于,长白成年母猪体重的变异系数:%53.5%100190

5

.10=?=

?V C 大约克成年母猪体重的变异系数:%34.4%100196

5

.8=?=

?V C 所以,长白成年母猪体重的变异程度大于大约克成年母猪。

注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。

习题

1、什么是生物统计?

2、什么是总体、个体、样本、样本含量、随机样本?统计分析的两个特点是什么?

3、什么是参数、统计量?二者有何关系?

4、什么是试验的准确性与精确性?如何提高试验的准确性与精确性?

5、什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差?

6、生物统计中常用的平均数有几种?各在什么情况下应用?

7、何谓算术平均数?算术平均数有哪些基本性质?

8、何谓标准差?标准差有哪些特性?

9、何谓变异系数?为什么变异系数要与平均数、标准差配合使用?

10、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。(x=9.8头,S=2.098头,C·V=21.40%)。

第二章资料的整理

一、学时:2

二、要点:

试验资料的分类,各类资料的次数分布表和次数分布图的制作方法;熟悉概率的基本概念,事件之间的关系和计算事件概率的方法。

三、难点:

各类资料的次数分布表和次数分布图的制作。

第一节资料的分类

在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为数量性状资料、质量性状资料和半定量(等级)资料三大类。

一、数量性状资料

数量性状(quantitative character)是指能够以量测或计数的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料(data of quantitative characteristics)。数量性状资料的记载有量测和计数两种方式,因而数量性状资料又分为计量资料和计数资料两种。

(一)计量资料指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。其数据是用长度、容积、重量等来表示,如体高、产奶量、体重、绵羊剪毛量等。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定,它们之间的变异是连续性的。因此,

计量资料也称为连续性变异资料。

(二)计数资料指用计数方式得到的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。如猪的产仔数、鸡的产蛋数、鱼的尾数、母猪的乳头数等,这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。

二、质量性状资料

质量性状(qualitative character)是指能观察到而不能直接测量的性状,如颜色、性别、生死等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:

(一)统计次数法在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头数分类统计如下表。

表2-1 白猪和黑猪子二代的毛色分离情况

毛色次数(f)频率(%)

白色332 73.78

黑色96 21.33

花色22 4.89

合计450 100.00

这种由质量性状数量化得来的资料又叫次数资料。

(二)评分法对某一质量性状,因其类别不同,分别给予评分。例如,在研究猪的肉色遗传时,常用的方法是将屠宰后2小时的猪眼肌横切面与标准图谱对比,由浅到深分别给予15分的评分,以便统计分析。

三、半定量(等级)资料

半定量或等级资料(semi-quantitative or ranked data)是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同。如用某种药物治疗畜禽的某种疾病,疗效分为“无效”、“好转”、“显效”和“控制”四个级别。

三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按白细胞总数过高、正常、过低分为三组,清点各组次数,就转化成了半定量资料。

第二节资料的整理

在对原始资料进行整理之前,首先要对全部资料进行检查与核对,然后再根据资料的类型及研究的目的对资料进行整理。

一、资料的检查与核对

检查和核对原始资料的目的在于确保原始资料的完整性和正确性。所谓完整性是指原始资料无遗缺或重复。所谓正确性是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。

二、资料的整理方法

当观测值不多(n≤30)时,不必分组,直接进行统计分析。当观测值较多(n>30)时,宜将观测值分成若干组,以便统计分析。

(一)计数资料的整理现以50枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。

表2-2 50枚受精种蛋孵化出雏鸡的天数

21 20 20 21 23 22 22 22 21 22 20 23 22 23 22 19 22 23 24 22 19 22 21 21 21 22 22 24 22 21 21 22 22 23 22 22 21 22 22 23 22 23 22 22 22 23 23 22 21 22

小鸡出壳天数在19─24天范围内变动,有6个不同的观察值。用各个不同观察值进行分组,共分为6组,可得表2-3形式的次数分布表。

孵化天数划线计数次数(f)

19 ║ 2

20 ║│ 3

21 ╫╫╫╫10

22 ╫╫╫╫╫╫╫╫║║24

23 ╫╫║║9

24 ║ 2

合计50

从表2-3可以看出:种蛋孵化出雏天数大多集中在2123天,以22 天的最多,孵化天数较短(1920天)和较长(24天)的都较少。

表2-4 100只蛋鸡每年产蛋数的次数分布表

产蛋数划线计数次数(f)

200209 ║ 2

210219 ╫╫║│8

220229 ╫╫╫╫╫╫15

230239 ╫╫╫╫╫╫╫╫20

240249 ╫╫╫╫╫╫╫╫║│23

250259 ╫╫╫╫╫╫║17

260269 ╫╫║│8

270279 ║║ 4

280289 ║ 2

290299 │ 1

合计100

例如观测某品种100只蛋鸡每年每只鸡产蛋数(原始资料略),其变异范围为200299枚。这样的资料如以每个观察值为一组,则组数太多(该资料最多可分为100组),如间隔10枚为一组,则可使组数适当减少。经初步整理后分为10组,资料的规律性就比较明显,见表2-4。

从表2-4可以看到,大部分蛋鸡的年产蛋数在220259枚,但也有少数蛋鸡每年产蛋数少到200209枚,多到290299枚。

(二)计量资料的整理计量资料不能按计数资料的分组方法进行整理,在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组。下面以126头基础母羊的体重资料为例,说明其整理的方法及步骤。

【例2.1】将126头基础母羊的体重资料(见表2-5)整理成次数分布表。

1、求全距全距是资料中最大值与最小值之差,又称为极差(r ange),用R表示,即

R=Max(x)-Min(x)

表2-5中,基础母羊的最大体重为65.0kg,最小体重为37.0kg,因此

R=65.0-37.0=28.0kg。

2、确定组数组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。一般组数的确定,可参考表2-6。

表2-5 126头基础母羊的体重资料

单位:kg

53.0 50.0 51.0 57.0 56.0 51.0 48.0 46.0 62.0 51.0 61.0 56.0 62.0 58.0 46.5 48.0 46.0 50.0 54.5 56.0 40.0 53.0 51.0 57.0 54.0 59.0 52.0 47.0 57.0 59.0 54.0 50.0 52.0 54.0 62.5 50.0 50.0 53.0 51.0 54.0 56.0 50.0 52.0 50.0 52.0 43.0 53.0 48.0 50.0 60.0 58.0 52.0 64.0 50.0 47.0 37.0 52.0 46.0 45.0 42.0 53.0 58.0 47.0 50.0 50.0 45.0 55.0 62.0 51.0 50.0 43.0 53.0 42.0 56.0 54.5 45.0 56.0 54.0 65.0 61.0 47.0 52.0 49.0 49.0 51.0 45.0 52.0 54.0 48.0 57.0 45.0 53.0 54.0 57.0 54.0 54.0 45.0 44.0 52.0 50.0 52.0 52.0 55.0 50.0 54.0 43.0 57.0 56.0 54.0 49.0 55.0 50.0 48.0 46.0 56.0 45.0 45.0 51.0 46.0 49.0 48.5 49.0 55.0 52.0 58.0 54.5

样本含量(n)组数

10—100 7—10

100—200 9—12

200—500 12—17

500以上17—30

本例中,n=126,根据表2-6,初步确定组数为10组。

3、确定组距每组最大值与最小值之差称为组距,记为i。分组时要求各组的组距相等。组距的大小由全距与组数确定,计算公式为:

组距(i)=全距/组数

本例i=28.0/10≈3.0。

4、确定组限及组中值各组的最大值与最小值称为组限。最小值称为下限,最大值称为上限。每一组的中点值称为组中值,它是该组的代表值。组中值与组限、组距的关系如下:

组中值=(组下限+组上限)/2=组下限+1/ 2组距=组上限-1/2组距由于相邻两组的组中值间的距离等于组距,所以当第一组的组中值确定以后,加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推。

组距确定后,首先要选定第一组的组中值。在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近于或等于资料中的最小值为好。第一组组中值确定后,该组组限即可确定,其余各组的组中值和组限也可相继确定。注意,最末一组的上限应大于资料中的

最大值。

5、归组划线计数,作次数分布表分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。如表2-5中,第一个观察值53.0,应归入表2-7中第六组,组限为51.0 54.0;第二个数50.0,应归入第五组,组限为48.0 51.0;依次将126个观察值都进行归组划线计数,制成次数分布表,见表2-7。

表2-7 126头基础母羊的体重的次数分布表

组别组中值划线计数次数(f)

36.0 37.5 │ 1

39.0 40.5 │ 1

42.0 43.5 ╫╫│ 6

45.0 46.5 ╫╫╫╫╫╫║│18

48.0 49.5 ╫╫╫╫╫╫╫╫│26

51.0 52.5 ╫╫╫╫╫╫╫╫║27

54.0 55.5 ╫╫╫╫╫╫╫╫│26

57.0 58.5 ╫╫╫╫║12

60.0 61.5 ╫╫║7

63.0 64.5 ║ 2

合计126

次数分布表不仅便于观察资料的规律性,而且可根据它绘成次数分布图及计算平均数、标准差等统计量。从表2-7可以看出126头基础母羊体重资料分布的一般趋势:体重的变异范围在37.0 65.0kg,大部分母羊的体重在45.060.0kg之间。

在归组划线时应注意,不要重复或遗漏,归组划线后将各组的次数相加,结果应与样本含量相等,如不等,证明归组划线有误,应予纠正。在分组后所得实际组数,有时和最初确定的组数不同,如第一组下限和资料中的最小值相差较大或实际组距比计算的组距为小,则实际分组的组数将比原定组数多;反之则少。

(三)质量性状资料、半定量(等级)资料的整理对于质量性状资料、半定量(等级)资料,可按性状或等级进行分组,分别统计各组的次数,然后制成次数分布表。例如,研究山羊的角遗传时,用纯种的有角羊与无角羊交配,杂种一代全为无角羊,观察F2代山羊共120只,有角无角的分离情况列于表2-8。

表2-8 F2代山羊的有角无角分离情况

角次数(f)频率(%)无角87 72.50

有角33 27.50

合计120 100.00

又如,整理仔猪死亡情况资料可根据死亡原因将仔猪分组,并统计次数,计算出频率即构成比,见表2-9。

表2-9 仔猪死亡情况

死亡原因死亡数频率(%)

冻死15 19.23

发育不良20 25.46

肺炎13 16.67

白痢10 12.82

寄生虫20 25.64

合计78 100.00

第三节常用统计表与统计图

统计表是用表格形式来表示数量关系;统计图是用几何图形来表示数量关系。用统计表与统计图,可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。

一、统计表

(一)统计表的结构和要求统计表由标题、横标目、纵标目、线条、数字及合计构成,其基本格式如下表:

表号标题

总横标目(或空白)纵标目合计

横标目数字资料

合计

编制统计表的总原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,

便于理解和比较分析。具体要求如下:

1、标题标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。

2、标目标目分横标目和纵标目两项。横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位,如%、kg、cm等等。

3、数字一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用“─”表示,数字是“0”的,则填写“0”。

4、线条表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可省去,表的左上角一般不用斜线。

(二) 统计表的种类统计表可根据纵、横标目是否有分组分为简单表和复合表两

类。

1、简单表由一组横标目和一组纵标目组成,纵横标目都未分组。此类表适于简单资料的统计,如表2-10。

表2-10 某品种鸡杂种二代冠形分离情况

冠形次数(f)频率(%)

玫瑰冠106 74.13

单冠37 25.87

合计143 100.00

2、复合表由两组或两组以上的横标目与纵标目结合而成,或由一组横标目与两组或两组以上的纵标目结合而成,或由两组或两组以上的横、纵标目结合而成。此类表适于复杂资料的统计,如表2-11。

表2-11 几种动物性食品的营养成分

品别

百分比(%)

蛋白质脂肪糖类无机盐水分其它

牛奶 3.3 4.0 5.0 0.7 87.0

牛肉19.2 9.2 1.0 62.1 8.5

鸡蛋

11.9 9.3 1.2 0.9 65.5 11.2

咸带鱼15.5 3.7 1.8 10.0 29.0 40.0

二、统计图

常用的统计图有长条图 (bar chart)、园图(pie chart)、线图(linear chart)、直方图(histogram)和折线图(broken-line chart)等。图形的选择取决于资料的性质,一般情况下,计量资料采用直方图和折线图,计数资料、质量性状资料、半定量(等级)资料常用长条图、线图或园图。

(一)统计图绘制的基本要求

1、标题简明扼要,列于图的下方。

2、纵、横两轴应有刻度,注明单位。

3、横轴由左至右、纵轴由下而上,数值由小到大;图形长宽比例约5:4或6:5。

4、图中需用不同颜色或线条代表不同事物时,应有图例说明。

(二)常用统计图及其绘制方法

1、长条图它用等宽长条的长短或高低表示按某一研究指标划分属性种类或等级的次数或频率分布。如表示奶牛几种疾病的发病率;几种家畜对某一寄生虫感染的情况;不同公羊油汗色泽的次数分布情况等。如果只涉及一项指标,则采用单式长条图;如果涉及两个或两个以上的指标,则采用复式长条图。

在绘制长条图时,应注意以下几点:

(1)纵轴尺度从“0”开始,间隔相等,标明所表示指标的尺度及单位。

(2)横轴是长条图的共同基线,应标明各长条的内容。长条的宽度要相等,间隔相同。间隔的宽度可与长条宽度相同或者是其一半。

(3)在绘制复式长条图时,将同一属性种类、等级的两个或两个以上指标的长条绘制在一起,各长条所表示的指标用图例说明,同一属性种类、等级的各长条间不留间隔。

例如,根据表2-10绘制的长条图是单式的,见图2-1。根据表2-11绘制的长条图是复式的,见图2-2。

图2-1 杂种二代鸡的冠形分离的次数分布图图2-2 几种动物性食品的营养成分(条形

2、园图 用于表示计数资料、质量性状资料或半定量(等级)资料的构成比。 所谓构成比,就是各类别、等级的观测值个数(次数)与观测值总个数(样本含量)的百分比。把园图的全面积看成100%,按各类别、等级的构成比将园面积分成若干分, 以扇形面积的大小表分别表示各类别、等级的比例。 绘制园图时,应注意以下三点:

(1)圆图每3.6°园心角所对应的扇形面积为1%。

(2)圆图上各部分按资料顺序或大小顺序,以时钟9时或12时为起点,顺时针方向排列。

(3)圆图中各部分用线条分开,注明简要文字及百分比。

例如根据表2-11中的数据用圆图绘出四种动物性食品的营养成分,见图2-3。

3、线图 用来表示事物或现象随时间而变化发展的情况。线图有单式和复式两种。

(1)单式线图 表示某一事物或现象的动态。

例如,某猪场长白猪从出生到6月龄出栏平均体重的变化如表2-12所示,根据该资料可以绘制成单式线图,以表示该猪场长白猪体重随月龄变化的情况,见图2-4。

表2-12 长白猪体重的变化(出生——6月龄)

单位:kg

月龄 出生 1 2 3 4 5 6 体重

2.0

13.5

27.5

43.0

61.2

83.8

118.5

(2)复式线图 在同一图上表示两种或两种以上事物或现象的动态。这时可用实线“”,断线“------”,点线“····”,横点线“-?-?-?-”等来标志区别。 例如,长白猪、大约克、大白猪三个品种从出生到6月龄出栏平均体重的变化如表2-13所示,根据该资料绘制的复式线图,见图2-5。

图2-3 四种动物性食品的营养成分(圆图)

图2-4 长白猪体重的变化(0-6月龄)

表2-13 三个品种猪体重的变化(出生——6月龄)

单位:kg

出生 1 2 3 4 5 6 长白猪 2.0 13.5 27.5 43.0 61.2 83.8 118.5 大约克 1.8 12.0 24.5 38.0 53.6 72.3 104.5 大白猪

1.6

10.0

21.0

32.0

45.0

60.5

85.7

4、直方图(柱形图、矩形图) 对计量资料, 可根据次数分布表作出直方图以表示资料的分布情况。其作法是:在横轴上标记组限,纵轴标记次数(f ),在各组上作出其高等于次数的矩形,即得次数分布直方图。

例如根据表2-7绘制的次数分布直方图,见图2-6。

5、折线图 对于计量资料,还可根据次数分布表作出次数分布折线图。 其作法是:

在横轴上标记组中值,纵轴上标记次数,以各组组中值为横坐标,次数为纵坐标描点,用线段依次连接各点,即可得次数分布折线图。

例如根据表2-7绘制的次数分布折线图,见图2-7。

习 题

图2-5 三个品种猪体重的变化(0-6月龄)

图2-6 126头基础母羊体重的次数分布直方图2-7 126头基础母羊体重的次数分布折线图

1、资料可以分为哪几类?它们有何区别与联系?

2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?

3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?

4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么?

第三章几种常见的概率分布

一、学时:2

二、要点:

1. 二项分布、泊松分布等离散型分布的意义和概率计算方法;

2.正态分布等连续分布的的意义和概率计算方法,中心极限定理。

三、难点:

二项分布、泊松分布和正态分布的概率计算和中心极限定理。

第三章常用概率分布

介绍生物科学研究中常用的几种随机变量的概率分布——正态分布、二项分布、波松分布以及样本平均数的抽样分布和t分布。

第一节事件与概率

一、事件

(一)必然现象与随机现象自然界的现象,大体上分为两大类:一类是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生(或必然不发生)。例如,在标准大气压下,水加热到100℃必然沸腾;步行条件下必然不可能到达月球等。这类现象称为必然现象(inevitable phenomena)或确定性现象(definite phenomena)。另一类是事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同。在个别试验中其结果呈现偶然性、不确定性现象,称为随机现象(random phenomena)或不确定性现象(indefinite phenomena)。

(二)随机试验与随机事件

1、随机试验通常我们把根据某一研究目的,在一定条件下对自然现象所进行的观察或试验统称为试验(trial)。而一个试验如果满足下述三个特性,则称其为一个随机试验(random trial),简称试验:

(1)试验可以在相同条件下多次重复进行;

(2)每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果;

(3)每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这

次试验会出现哪一个结果。

2、随机事件随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,

称为随机事件(random event),简称事件(event),通常用A、B、C等来表示。

(1)基本事件我们把不能再分的事件称为基本事件(elementary event),也称为样本点(sample point)。

(2)必然事件我们把在一定条件下必然会发生的事件称为必然事件(certain event),用Ω表示。

(3)不可能事件我们把在一定条件下不可能发生的事件称为不可能事件(impossible event),用ф表示。

二、概率

(一)概率的统计定义

概率(probability),事件A的概率记为P(A)。在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率。这样定义的概率称为统计概率(statistics probability),或者称后验概率(posterior probability)。

在一般情况下,随机事件的概率p是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。

即P(A)=p≈m/n(n充分大)(3-1)(二)概率的古典定义

有很多随机试验具有以下特征:

1、试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个;

2、各个试验的可能结果出现的可能性相等,即所有基本事件的发生是等可能的;

3、试验的所有可能结果两两互不相容。

具有上述特征的随机试验,称为古典概型(classical model)。对于古典概型,概率的定义如下:

设样本空间由n个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A的概率为m/n,即

P(A)=m/n (3-2)这样定义的概率称为古典概率(classical probability)或先验概率(prior probability)。

(三)概率的性质根据概率的定义,概率有如下基本性质:

1、对于任何事件A,有0≤P(A)≤1;

2、必然事件的概率为1,即P(Ω)=1;

3、不可能事件的概率为0,即P(ф)=0。

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学 实验报告 大肠杆菌

A 题 细胞体内代谢物浓度预测 随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。 对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM 数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。 活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质? 试根据附件中的数据完成如下问题: 1 根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。 2 筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价; 1.线性插补法处理缺失数据 原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺失点在线性插值函数的函数值填充该缺失值,即: 在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 代谢物浓度:取对数 代谢物理化性质:标准差标准化法 )1,1( m j n i S x x x j j ij ij ≤≤≤≤-=' 式中:.)(11,1121∑∑==--= =n i j ij j n i ij j x x n S x n x 3.SAS 软件建立多元线性回归方程 回归模型一般形式: u X b X b X b b Y k k +++++= (22110)

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学实验指导

《生物统计学》实验教学教案 [实验项目] 实验一平均数标准差及有关概率的计算 [教学时数] 2课时。 [实验目的与要求] 1、通过对平均数、标准差、中位数、众数等数据的计算,掌握使用计算机计算统计量的方法。 2、通过对正态分布、标准正态分布、二项分布、波松分布的学习,掌握使用计算机计算有关概率和分位数的方法。为统计推断打下基础。 [实验材料与设备] 计算器、计算机;有关数据资料。 [实验内容] 1、平均数、标准差、中位数、众数等数据的计算。 2、正态分布、标准正态分布有关概率和分位数的计算。 3、二项分布有关概率和分位数的计算。 4、波松分布有关概率和分位数的计算。 [实验方法] 1、平均数、标准差、中位数、众数等数据的计算公式。 平均数=Average(x1x2…x n) 几何平均数=Geomean(x1x2…x n) 调和平均数=Harmean(x1x2…x n) 中位数=median(x1x2…x n) 众数=Mode(x1x2…x n) 最大值=Max(x1x2…x n) 最小值=Min(x1x2…x n) 平方和(Σ(x- )2)=Devsq(x1x2…x n) x 样本方差=Var (x1x2…x n) 样本标准差=Stdev(x1x2…x n) 总体方差=Varp(x1x2…x n) 总体标准差=Stdevp(x1x2…x n) 2、正态分布、标准正态分布有关概率和分位数的计算。 一般正态分布概率、分位数计算:

概率=Normdist(x,μ,σ,c) c 取1时计算 -∞-x 的概率 c 取0时计算 x 的概率 分位数=Norminv(p, μ, σ) p 取-∞到分位数的概率 练习: 猪血红蛋白含量x 服从正态分布N(12.86,1.332),(1) 求猪血红蛋白含量x 在11.53—14.19范围内的概率。(0.6826)(2) 若P(x <1l )=0.025,P(x >2l )=0.025,求1l ,2l 。 (10.25325) L1=10.25 L2=15.47 标准正态分布概率、分位数计算: 概率=Normsdist(x) c 取1时计算 -∞--x 的概率 c 取0时计算 x 的概率 分位数=Normsinv(p) p 取-∞到分位数的概率 练习: 1、已知随机变量u 服从N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 参考答案: (0.080757,0.06811,0.00988,0.5605) 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1; 0.52 (2) P(-αu ≤u <αu )=0.42; 0.95 参考答案: [1.644854, 0.63345; 0.553385, 1.959964] 3、二项分布有关概率和分位数的计算。 概率=Binomdist(x,n,p,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: 1、已知随机变量x 服从二项分布B (100,0.1),求μ及σ。 参考答案: 见P48,μ= np, σ=(npq)0.5 2、已知随机变量x 服从二项分布B(10,0.6),求P(2≤x ≤6),P(x ≥7),P(x<3)。 参考答案: 0.6054, 0.38228, 0.012295 4、波松分布有关概率和分位数的计算。 概率=Poisson(x,λ,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: ),(m n Permut C m n =

贵州大学《生物统计学》考试试卷(含答案)

贵州大学《生物统计学》考试试卷(含答案) 一 单项选择题(每题3分,共21分) 1.在假设检验中,显著性水平α的意义是___C___。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 2.设123,,X X X 是总体2( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是__C___。 A. 123X X X +- B. 4 1 i i X μ=-∑ C. 2 1X σ+ D. 4 21 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为___A____。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.比较身高和体重两组数据变异程度的大小应采用__D___。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 5.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选择统计量___B_____。 A. 2 (1)n S σ- B. 2 2 (1)n S σ- X X 6.单侧检验比双侧检验的效率高的原因是___B_____。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是____D____。 A.63e μ μ- B.36e μμ- C.36e μ μ- D. 316 e μμ-

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学实验

渤海大学学生实验报告 课程名称:生物统计学实验任课教师:何余堂 实验室名称:计算机室房间号:理工Ⅱ--205 实验时间:2012-6-14 学院化学化工与食品安全学院专业食品质量与安 全 班级10-10 姓名宋帅婷学号10150142同组人其余19人 实验项目统计数据的整理及次数分布 表/图的制作 组 别第二组 实验成绩 一、实验目的 1、掌握Excel数据输入、输出与编辑方法; 2、掌握Excel用于描述性统计的基本菜单操作及命令; 3、掌握数据整理的基本方法; 4、熟练制作次数分布表/图。 二、实验原理 当观测值较多(n>30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。 连续性资料的整理,需要先确定全距、组数、组距、组中值及组限,然后将全部观测值计数归组。分组结束后,将资料中的每一观测值逐一归组,统计每组内所包含的观测值个数,制作次数分布表。利用Excel的数据统计工具可以辅助完成上述工作。 三、实验步骤 1、加载分析工具库 单击Excel程序“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。 2、练习 某地80例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 5.21

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

生物统计学期末复习题库及答案

生物统计学期末复习题 库及答案 https://www.sodocs.net/doc/5115151472.html,work Information Technology Company.2020YEAR

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )(

判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空

SPSS17.0在生物统计学中的应用-实验五、方差分析报告 六、简单相关与回归分析报告

SPSS在生物统计学中的应用 ——实验指导手册 实验五:方差分析 一、实验目标与要求 1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理 2.掌握方差分析的过程。 3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。 二、实验原理 在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。 方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。 方差分析有3个基本的概念:观测变量、因素和水平。 ●观测变量是进行方差分析所研究的对象; ●因素是影响观测变量变化的客观或人为条件; ●因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销 量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。 ?根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析; ?根据因素个数,可分为单因素方差分析和多因素方差分析。 在SPSS中,有One-way ANOV A(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单变量方差分析。 三、实验演示内容与步骤 ㈠单变量-单因素方差分析 单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-way ANOV A过程。 采用One-way ANOV A过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。 【例6.1】欲比较四种饲料对仔猪增重效果的优劣,随机选取了性别、年龄、体重相同,无亲缘关系的20头猪,随机分为4组,每组5头,分别饲喂一种饲料所得增重数据如下在。试利用这些数据对4种饲料对仔猪

相关主题