搜档网
当前位置:搜档网 › 生物统计学(第3版)杜荣骞 课后习题答案 第十二章 实验设计

生物统计学(第3版)杜荣骞 课后习题答案 第十二章 实验设计

生物统计学(第3版)杜荣骞 课后习题答案 第十二章  实验设计
生物统计学(第3版)杜荣骞 课后习题答案 第十二章  实验设计

第十二章实验设计

12.1一项关于在干旱地区生长的一种杨树(Populus euphratica),在土壤中的水分逐渐丧失后,其基因表达、蛋白谱、生态生理学及生长性能等方面产生可逆性改变的研究。作者在本实验的5个时间点上(H5为对照),用qPCR方法度量了该杨树叶子中的三个基因的转录丰度比[83],表中给出的为阵列数据:

GenBank ID 基因H1H2H3H4H5

AJ 780 423 半胱氨酸蛋白酶0.7 1.0 2.3 13.1 1.9

AJ 780 698 环核苷酸和钙调节的离子通道 1.5 1.2 3.0 4.3 1.5

AJ 777 362 核糖体蛋白 1.1 1.1 1.0 0.9 1.2

借用上述数据,以三个基因作为三个区组,计算在5个时间点上转录丰度比差异是否显著?

答:随机化完全区组实验设计方差分析的程序,类似于两因素交叉分组实验设计。以下是本题的程序和结果:

options linesize=76 nodate;

data poplar;

do block=1 to 3;

do time=1 to 5;

input trans @@;

output;

end;

end;

cards;

0.7 1.0 2.3 13.1 1.9

1.5 1.2 3.0 4.3 1.5

1.1 1.1 1.0 0.9 1.2

;

proc anova;

class block time;

model trans=block time;

run;

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

block 3 1 2 3

time 5 1 2 3 4 5

Number of observations 15

The SAS System

The ANOVA Procedure

Dependent Variable: trans

Sum of

Source DF Squares Mean Square F Value Pr > F Model 6 72.5560000 12.0926667 1.53 0.2809

Error 8 63.1013333 7.8876667

Corrected Total 14 135.6573333

R-Square Coeff Var Root MSE trans Mean

0.534848 117.6745 2.808499 2.386667

Source DF Anova SS Mean Square F Value Pr > F block 2 18.82533333 9.41266667 1.19 0.3519 time 4 53.73066667 13.43266667 1.70 0.2416

从上表中的结果可以看出,如果按随机化完全区组设计进行分析,不同时间点之间的差异不显著。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

区组18.825 333 33 2 9.412 666 67 1.19 0.351 9

时间点53.730 666 67 4 13.432 666 67 1.70 0.241 6

误差63.101 333 33 8 7.887 666 7

总和135.657 333 3 14

12.2测定了新疆维吾尔、哈萨克、柯尔克孜族乡村不同年龄的男生(n =100),50米跑的平均成绩(s),结果如下[10]:

年龄/a 7 8 9 10 11 12 13 14 15 16 17 18 维吾尔10.54 10.16 9.58 9.41 9.11 8.83 8.65 8.24 7.89 7.85 7.70 7.41 哈萨克10.27 9.70 9.38 9.21 8.84 8.74 8.32 7.92 7.69 7.48 7.40 7.40 柯尔克孜11.19 10.66 10.12 9.84 9.48 9.24 8.94 8.50 8.27 7.91 7.76 7.63 该试验的目的,是为了推断不同民族间,男生50米跑的平均成绩差异是否显著。首先判断该试验属于一种什么设计,然后再计算。

答:该试验为随机化完全区组设计,年龄为区组。程序不再给出,下面只给出结果。

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

block 12 1 2 3 4 5 6 7 8 9 10 11 12

people 3 1 2 3

Number of observations 36

The SAS System

The ANOVA Procedure

Dependent Variable: second

Sum of

Source DF Squares Mean Square F Value Pr > F Model 13 38.51329167 2.96256090 193.30 <.0001 Error 22 0.33718333 0.01532652

Corrected Total 35 38.85047500

R-Square Coeff Var Root MSE second Mean

0.991321 1.404826 0.123800 8.812500

Source DF Anova SS Mean Square F Value Pr > F block 11 36.34027500 3.30366136 215.55 <.0001 people 2 2.17301667 1.08650833 70.89 <.0001

从方差分析可知,不同民族间,男生50米跑的平均成绩差异极显著。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

区组36.340 275 00 11 3.303 661 36 215.5

5

<0.000 1

民族间2.173 016 67 2 1.086 508 33 70.8

9

<0.000 1

误差0.337 183 33 22 0.015 326 52

总和38.850 475 00 35

12.3测试了新疆维吾尔、哈萨克、柯尔克孜族乡村不同年龄男生(n =100)立位体前屈的平均次数,结果如下[10]:

年龄/a 7 8 9 10 11 12 13 14 15 16 17 18 维吾尔 6.65 7.28 7.65 7.63 7.72 7.79 9.12 9.27 12.87 12.83 14.91 16.30 哈萨克 6.94 7.31 6.03 6.50 7.23 6.36 7.52 7.47 10.31 11.91 12.89 13.08 柯尔克孜 5.15 5.56 5.83 6.38 6.80 7.12 8.16 10.77 12.03 15.74 16.89 17.65 与上题类似,请推断三个不同民族间,男生立位体前屈平均次数差异是否显著?

答:与上题类似,以下只给出结果。

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

block 12 1 2 3 4 5 6 7 8 9 10 11 12

people 3 1 2 3

Number of observations 36

The SAS System

The ANOVA Procedure

Dependent Variable: number

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 13 418.8897361 32.2222874 22.21 <.0001

Error 22 31.9233611 1.4510619

Corrected Total 35 450.8130972

R-Square Coeff Var Root MSE number Mean

0.929187 12.69299 1.204600 9.490278

Source DF Anova SS Mean Square F Value Pr > F block 11 405.3856972 36.8532452 25.40 <.0001 people 2 13.5040389 6.7520194 4.65 0.0206

从上述计算结果可以看出,不同民族间,男生立位体前屈平均次数,在α=0.05水平上差异显著。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

区组405.385 697 2 11 36.853 245 2 25.40 <0.000 1

民族间13.504 038 9 2 6.7520 194 4.65 0.020 6

误差31.923 361 1 22 1.4510 619

总和450.813 097 2 35

12.4一项促进刺五加苗木木质化试验[84],选择4种生长刺激剂各选择3种浓度,设计方案见下表:

刺激剂多效唑(A)比久(B)矮壮素(C)富尔655(D)稀释倍数500 600 700 100 200 300 500 700 1000 500 600 700 重复数 3 3 3 3 3 3 3 3 3 3 3 3 按上述方案,每重复调查30株,记录木质化的株数,试验结果如下:

刺激剂多效唑(A)比久(B)矮壮素(C)富尔655(D)稀释倍数500 600 700 100 200 300 500 700 1000 500 600 700

重复23 29 20 28 20 9 11 10 11 8 16 19 22 26 12 26 19 26 18 16 20 15 21 13 16 22 19 15 18 26 18 9 21 14 20 17

先考虑这是哪一种试验设计?根据实验设计的要求做方差分析并解释所得结果。

答:这是一个套设计,所得结果是服从二项分布的随机变量,需做反正弦变换。

options linesize=76 nodate;

data nested;

do reagent=1 to 4;

do multiple=1 to 3;

do rep=1 to 3;

infile 'e:\data\er12-4e.dat';

input num @@;

number=arsin(sqrt(num/30))*180/3.14159265;

output;

end;

end;

end;

proc anova;

class reagent multiple;

model number=reagent multiple(reagent);

test h=reagent e=multiple(reagent);

run;

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

reagent 4 1 2 3 4

multiple 3 1 2 3

Number of observations 36

The SAS System

The ANOVA Procedure

Dependent Variable: number

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 11 2535.035123 230.457738 2.20 0.0513

Error 24 2511.056137 104.627339

Corrected Total 35 5046.091260

R-Square Coeff Var Root MSE number Mean

0.502376 19.78509 10.22875 51.69928

Source DF Anova SS Mean Square F Value Pr > F

reagent 3 1295.597384 431.865795 4.13 0.0171

multiple(reagent) 8 1239.437739 154.929717 1.48 0.2160

Tests of Hypotheses Using the Anova MS

for multiple(reagent) as an Error Term

Source DF Anova SS Mean Square F Value Pr > F

reagent 3 1295.597384 431.865795 2.79 0.1095

从方程分析结果可知,不同刺激剂(reagent)的显著水平P=0.109 5,套在刺激剂下之稀释倍数(multiple)的显著水平P=0.216 0。两者都是不显著的。

套设计,归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

刺激剂 1 295.597 384 3 431.865 795 2.79 0.109 5 倍数(刺激剂) 1 239.437 739 8 154.929 717 1.48 0.216 0 误差 2 511.056 137 24 104.627 339

总和 5 046.091 260 35

12.5为了研究不同稀释剂对活菌数的影响,设计了下述实验[85]:吸取制备好的菌液,分别加入8种稀释剂中,每种1 mL,控制各稀释剂中含菌量约为50 cfu/mL。在0,1,2,3,4,5小时,从每一稀释剂中取1 mL倾入一个平皿内,再取1 mL倾入另一个平皿内。加入45℃营养琼脂培养基20 mL,于34℃培养48 h,计数。请同学们分析一下,这是哪一种实验设计?有没有更好的设计方法?

答:根据作者的初衷,本实验应当是一个裂区设计,目的是研究不同稀释剂对活菌数的影响。根据裂区实验设计的特点,放在次区的因素检验效率更高,故主因素应当放在次区。根据裂区设计的这个特点,更理想的设计是把时间放在主区,在每一时间下,配制8种稀释剂。这样安排虽然增加了实验工作量,但得到的信息更可靠。

12.6试验采用六种密度(A,B,C,D,E,F)和四个年份(1996-1999)观察湿地松树高(cm)生长情况[86]。以下是引用的部分原文内容:

A市密度试验,采用随机区组排列,设6个密度处理,即1 m×1.5 m,1.5 m×2 m,2 m×2 m,2 m×2.5 m,2 m×3 m,2.5 m×3 m分别用A,B,C,D,E,F表示,4次重复,小区面积600 m2。

A市B镇C村6个不同密度处理的试验林4年的树高调查观测资料见下表。

A市密度试验林树高生长情况表

区组年度

小区

A B C D E F

I 1996 39.03 43.54 41.96 45.96 43.27 41.75 1997 83.5 90.5 99.5 81.5 85.2 84.8 1998 1.34 1.29 1.93 1.42 1.25 1.16 1999 2.20 2.10 2.0 2.0 1.4 1.9

II 1996 43.64 40.90 40.25 49.33 41.87 45.80 1997 83.8 95.0 90.0 104.5 87.5 94.2 1998 1.51 1.37 1.51 1.56 1.25 1.35 1999 1.7 2.0 2.2 2.3 1.4 1.7

III 1996 42.84 42.13 46.31 43.41 41.44 47.83 1997 81.1 82.3 92.2 90.1 77.3 99.2 1998 1.66 1.42 1.25 1.32 1.45 1.26 1999 2.1 2.3 2.2 2.1 1.9 2.1

IV 1996 39.24 38.22 43.28 38.36 37.39 39.55 1997 74.9 67.2 78.3 75.9 63.8 86.2 1998 1.31 1.41 1.34 1.30 1.05 1.44 1999 2.1 2.2 1.9 1.9 1.9 2.1

平均1996 41.19 41.20 42.95 44.27 40.99 43.73 1997 80.83 83.75 90.0 88.0 78.45 91.1 1998 1.46 1.37 1.51 1.40 1.25 1.30 1999 2.03 2.15 2.08 2.08 1.05 1.95

注:1996-1998年单位为cm,1999年单位为m。

“A市密度试验林树高方差分析表

年度

方差分析结果

离差来源平方和自由度均方均方比(F) 组间41.794 61 5 8.358 92

0.845 9

1996 组内177.862 67 18 9.881 26

总的219.657 29 23

注:另三个年度与1996年的分析方法完全一样,这里只引用了1996年一个年度的分析结果。请读者考虑对于以上数据,是否有更好的处理方法。

答:1.试验采用随机区组设计,但没有给出区组的排列,仅仅给出了4次重复。

2.在第1个表中将4个年度作为1个区组是不合适的。根据区组的定义,区组内的条件应当是尽量一致的,不同年份间的条件差别是很大的,不能作为一个区组。

3.第1个表的“注”里1998年的单位也应当是“m”。

4.第2个方差分析表,并未采用随机区组方差分析方法处理数据,在方差分析表中未出现“区组”项。

5.表4是按完全随机化设计方法处理的数据,但不知在设计试验时是否在7个密度和4次重复间进行了完全随机化。

作为一个随机化完全区组设计,以年度作为区组会更合理一些。因为在一个年度内的自然条件是一致的(前提是土壤条件一致),符合区组的要求。虽然在年度间不能将密度进

行随机化,但只要土壤条件一致,这点还是允许的。每一个年度内有4次重复,由于增加了重复次数,即增加了误差自由度,使密度间的差异更容易检验出来。下表是按年度整理出的结果,表中的数据为树的(cm)。

年度重复

密度/(株·600m)

A B C D E F

1996 1 39.03 43.54 41.96 45.96 43.27 41.75

2 43.64 40.90 40.25 49.3

3 41.87 45.80

3 高度

42.84 42.13 46.31 43.41 41.44 47.83

4 39.24 38.22 43.28 38.36 37.39 39.55

1997 1 83.5 90.5 99.5 81.5 85.2 84.8

2 83.8 95.0 90.0 104.5 87.5 94.2

3 81.1 82.3 92.2 90.1 77.3 99.2

4 74.9 67.2 78.3 75.9 63.8 86.2 1998 1 134 129 193 142 12

5 116

2 151 137 151 156 125 135

3 166 142 125 132 145 126

4 131 141 134 130 10

5 144

1999 1 220 210 200 200 140 190

2 170 200 220 230 140 170

3 210 230 220 210 190 210

4 210 220 190 190 190 210 以年度作为区组进行方差分析的程序和结果如下:

options linesize=76 nodate;

data nested;

do block=1 to 4;

do density=1 to 6;

do rep=1 to 4;

infile 'e:\data\er12-6e.dat';

input height @@;

output;

end;

end;

end;

proc anova;

class block density;

model height=block density;

run;

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

block 4 1 2 3 4

density 6 1 2 3 4 5 6

Number of observations 96

The SAS System

The ANOVA Procedure

Dependent Variable: height

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 8 332867.0928 41608.3866 192.60 <.0001

Error 87 18794.9323 216.0337

Corrected Total 95 351662.0251

R-Square Coeff Var Root MSE height Mean

0.946554 12.65395 14.69809 116.1542

Source DF Anova SS Mean Square F Value Pr > F

block 3 328678.8075 109559.6025 507.14 <.0001

density 5 4188.2853 837.6571 3.88 0.0032

从方差分析结果可以得知,密度间F值的显著性概率P=0.003 2,P<0.01。因此,不同密度的株高差异极显著。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

区组328 678.807 5 3 109 559.602 5 507.14 <0.000 1

密度 4 188.285 3 5 837.657 1 3.88 0.003 2

误差18 794.932 3 87 216.033 7

总和351 662.025 1 95

12.7为了研究喷洒生物有机肥“垦易”对人参地上部分生长的影响,设计了以下试验[87](摘录原文):

试验地点:A研究所试验基地,六年生人参地块。

试验方法:小区面积10m2,随机排列三次重复。设喷洒生物有机肥“垦易”200倍(A),400倍(B),800倍(C),和喷清水对照(D)四个处理。

不同处理对人参茎粗(cm)的影响

处理

重复

A B C D

1 0.713

2 0.807 2 0.694 6 0.632 4

2 0.705 0 0.784 8 0.681 9 0.647 2

3 0.686 0 0.766 8 0.656 2 0.638 2

人参茎粗方差分析表

变异来源df SS MS F F0.05 F0.01

重复 2 0.001 4 0.000 7 7 5.14 10.92

处理 3 0.035 0 0.011 7 117 4.96 9.78

误差 6 0.000 6 0.000 1

总变异11

首先分析这是一个什么试验设计,重复可以作为区组吗?区组可以作为重复吗?为什么?如果以重复作为一个因素与重复仅仅是一个简单的重复试验,对方差分析结果会有什么不同?列出相应的两种方差分析表。

答:从试验方法的叙述,“随机排列三次重复”,很明显这是一个完全随机化设计。完全随机化设计方差分析的变差来源,只有“处理”(组间)和“误差”(组内)。然而,在第2个表中,除上述两项外还有“重复”项。在完全随机化设计中,误差就是由重复得到的,这两项应是同一个变差来源,不能分成两项。如果“重复”是由区组引起的,还可以接受(严格来说应称为“区组”)。但试验并未设置区组,使人茫然不知“重复”所云为何。

完全随机化设计要求全部试验材料(a×n个)都是同质的,如果同质性不能得到满足,至少每一组处理(a个)也必须是同质的,构成一个区组。n个重复构成n个区组。这样做的目的是为了在不具同质性的情况下,从总的平方和中分解出一部分可控的平方和(区组平方和),减少误差平方和,提高试验的有效性。

本例,试验设计中并未安排区组,武断地从从误差平方和中分出一个区组平方和是没有根据的,应将区组平方和归还给误差平方和,也就是将两个平方和合并,作为误差平方和。

下面将武断得出的“随机化完全区组”设计的方差分析表和完全随机化设计的方差分析表列出,比较两者的异同。

下表(1)是按“随机化完全区组”设计计算的。根据上面第1个表所给出的数据,以A1B1C1D1为一区组,A2B2C2D2为1区组,依此类推。由于重复的三个水平是可以随机组合的,故下述结果不是唯一的。

(表1)按“随机化完全区组”设计计算:

The SAS System

The SAS System

The ANOVA Procedure

Dependent Variable: height

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 5 0.03622465 0.00724493 57.76 <.0001

Error 6 0.00075258 0.00012543

Corrected Total 11 0.03697722

R-Square Coeff Var Root MSE height Mean

0.979648 1.597364 0.011200 0.701125

Source DF Anova SS Mean Square F Value Pr > F

block 2 0.00133276 0.00066638 5.31 0.0470

treat 3 0.03489188 0.01163063 92.73 <.0001

显然,题干的方差分析表是按随机区组计算的,表中的“重复”即区组项。在该表之前已经说过,由于试验并未设置区组,只是简单的三次重复。因此,三次重复间是可以随机组合的,区组的排列不是唯一的,方差分析表也不是唯一的。这样随意搞出一个区组是绝对不允许的,其结果没有意义。

(2)按完全随机化设计计算:

The SAS System

The ANOVA Procedure

Dependent Variable: thick

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 3 0.03489188 0.01163063 44.62 <.0001

Error 8 0.00208534 0.00026067

Corrected Total 11 0.03697722

R-Square Coeff Var Root MSE thick Mean

0.943605 2.302756 0.016145 0.701125

Source DF Anova SS Mean Square F Value Pr > F

treat 3 0.03489188 0.01163063 44.62 <.0001

由以上数据可知(2)与(1)的处理项的平方和SS处理(1)=SS处理(2)=0.034 891 88,但误差平方和不同。SS E(2)=0.00208534,而SS E(1)=0.000 752 58。SS E(1)< SS E(2)。究其原因是,(1)的误差项从(2)的误差项中分出一个区组项,即:SS E(2)=SS E(1)+SS区组。如果试验设置了区组这样是很好的,减小了误差平方和,提高了F值,使处理更容易达到显著。但本试验并未设置区组,这样做便没有道理了。

应采用完全随机化设计。归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

处理0.034 891 88 3 0.011 630 63 44.62 <0.000 1

误差0.002 085 34 8 0.000 260 67

总和0.036 977 22 11

12.8为了研究生物菌肥对西洋参生长的功效,选择了三个处理。处理1为液体菌肥,处理2 为固体菌肥,处理3为空白对照。采用单因素随机区组设计,小区面积为3 m2。

西洋参地上部分调查结果[88]/cm

区组

叶长叶宽株高

处理1 处理2 处理3 处理1 处理2 处理3 处理1 处理2 处理3

Ⅰ9.9 9.6 9.3 5.8 5.7 5.5 11.7 11.5 11.4 Ⅱ9.7 9.5 9.0 5.9 5.7 5.3 11.8 11.6 11.2 Ⅲ9.5 9.7 9.1 5.7 5.6 5.2 11.9 11.7 11.5

对叶长、叶宽和株高分别做方差分析,若处理间的差异显著还要做多重比较。

答:结果如下:

options linesize=76 nodate;

data incw;

do block=1 to 3;

do treat=1 to 3;

input length @@;

output;

end;

end;

cards;

;

run;

proc anova;

class block treat;

model length = block treat;

means length / duncan;

run;

(1)叶长:

The SAS System

The ANOVA Procedure

Dependent Variable: length

Sum of

Source DF Squares Mean Square F Value Pr > F Model 4 0.61777778 0.15444444 7.94 0.0347 Error 4 0.07777778 0.01944444

Corrected Total 8 0.69555556

R-Square Coeff Var Root MSE length Mean

0.888179 1.471266 0.139443 9.477778

Source DF Anova SS Mean Square F Value Pr > F block 2 0.06888889 0.03444444 1.77 0.2812 treat 2 0.54888889 0.27444444 14.11 0.0154 The SAS System

The ANOVA Procedure

Duncan's Multiple Range Test for length

NOTE: This test controls the Type I comparisonwise error rate, not the

experimentwise error rate.

Alpha 0.05

Error Degrees of Freedom 4

Error Mean Square 0.019444

Number of Means 2 3

Critical Range .3161 .3230

Means with the same letter are not significantly different.

Duncan Grouping Mean N treat

A 9.7000 3 1

A

A 9.6000 3 2

B 9.1333 3 3

方差分析表明,叶长在α=0.05水平上显著。多重比较指出,在α=0.05水平上,处理1和处理2之间差异不显著;处理3分别与处理1和处理2之间差异显著。

(2)叶宽:

The SAS System

The ANOVA Procedure

Dependent Variable: wide

Sum of

Source DF Squares Mean Square F Value Pr > F Model 4 0.39333333 0.09833333 14.75 0.0116 Error 4 0.02666667 0.00666667

Corrected Total 8 0.42000000

R-Square Coeff Var Root MSE wide Mean

0.936508 1.458030 0.081650 5.600000

Source DF Anova SS Mean Square F Value Pr > F block 2 0.04666667 0.02333333 3.50 0.1322 treat 2 0.34666667 0.17333333 26.00 0.0051 The SAS System

The ANOVA Procedure

Duncan's Multiple Range Test for length

NOTE: This test controls the Type I comparisonwise error rate, not the

experimentwise error rate.

Alpha 0.05

Error Degrees of Freedom 4

Error Mean Square 0.006667

Number of Means 2 3

Critical Range .1851 .1891

Means with the same letter are not significantly different.

Duncan Grouping Mean N treat

A 5.80000 3 1

A

A 5.66667 3 2

B 5.33333 3 3

方差分析表明,叶宽在α=0.01水平上显著。多重比较指出,在α=0.05水平上,处理1和处理2之间差异不显著;处理3分别与处理1和处理2之间差异显著。

(3)株高:

The SAS System

The ANOVA Procedure

Dependent Variable: height

Sum of

Source DF Squares Mean Square F Value Pr > F Model 4 0.33777778 0.08444444 10.86 0.0201 Error 4 0.03111111 0.00777778

Corrected Total 8 0.36888889

R-Square Coeff Var Root MSE height Mean

0.915663 0.761002 0.088192 11.58889

Source DF Anova SS Mean Square F Value Pr > F block 2 0.05555556 0.02777778 3.57 0.1289 treat 2 0.28222222 0.14111111 18.14 0.0099 The SAS System

The ANOVA Procedure

Duncan's Multiple Range Test for length

NOTE: This test controls the Type I comparisonwise error rate, not the

experimentwise error rate.

Alpha 0.05

Error Degrees of Freedom 4

Error Mean Square 0.007778

Number of Means 2 3

Critical Range .1999 .2043

Means with the same letter are not significantly different.

Duncan Grouping Mean N treat

A 11.80000 3 1

B 11.60000 3 2

C 11.36667 3 3

方差分析表明,株高在α=0.01水平上显著。多重比较指出,在α=0.05水平上,处理1和处理2分别与处理3之间差异均显著。

12.9用9种药物喷洒甘薯,期望从中选出一种杀灭小象甲的最佳药物[89]。下面引用部分原文说明试验设计方法:

……共10个处理,重复3次,共30个小区,随机排列,每小区面积45 m2(3m×15m),小区间设1m 保护行

……关于数据分析的原文如下:

甘薯收获时(2005年1月11-12日)调查各小区薯块被害数,计算薯块被害率及防效,防效(% )=(对照组受害率?处理组受害率) /对照组受害率,调查数据采用Excel 97自带分析,工具库进行方差分析并用Duncans'法进行差异显著性测定。

得到的防效(%)如下:

处理

重复

ⅠII ⅢⅣⅤⅥⅦⅧⅨ

1 85.00 90.48 86.76 72.53 81.57 65.90 89.40 86.2

2 87.41

2 80.15 79.62 69.05 65.18 86.11 62.57 88.21 82.31 80.79

3 82.35 67.89 57.83 85.29 93.46 51.09 84.50 89.93 89.69

原文方差分析表如下:

方差分析表

显著水平

变异来源df(自由度) SS(平方和) MS(均方) F值

0.05 0.01

处理间8 2 086.21 260.78 4.14 2.59 3.89

重复间 2 168.85 84.43 1.34 3.63 6.23 误差16 1 006.99 62.94

总计26 3 262.05

在这项研究中,重复可以作为一个因素吗?为什么?在上面的处理中有些重复之间的差距很大,在重复之间为什么会有这么大的差距,是什么原因造成的?重复间差距过大的后果是什么?如果把重复作为一个因素会对方差分析的结果产生什么影响?同学们可以分别按完全随机化设计和两因素交叉分组设计做方差分析,然后比较两个方差分析表,并对表中的结果做解释。

答:关于“重复”的问题,本题与第7题情况类似。试验没有设置区组,但在处理数据时却出现了“重复”这样一个因素,这是没有道理的。关于这个问题已经讲了很多,不再重复。

重复间的数据差距过大,多数是由于条件的不一致或操作的不严格造成的。在完全随机化试验中,误差是由重复估计的,重复间的差距过大,会使误差均方加大,在用误差均方检验处理效应时,由于过大的误差均方,有可能使本来存在的效应检验不出来。

在上面引用的方差分析表中,作者可能是将重复作为区组对待的,也可能是作为一个因素对待的,将重复作为一个区组对待和作为一个因素对待,在实验设计上是截然不同的。但在数据处理的方法上是一样的。下面就本题所给出的数据,经反正弦变换后,分别按两因素交叉分组设计和完全随机化设计处理数据。

(1)按两因素交叉分组设计计算:

options linesize=76 nodate;

data spotato;

do repetit=1 to 3;

do treat=1 to 9;

infile 'e:\data\er12-9e.dat';

input y @@;

efficy=arsin(sqrt(y/100))*180/3.14159265;

output;

end;

end;

run;

proc anova;

class repetit treat;

model efficy = repetit treat;

run;

(1)

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

repetit 3 1 2 3

treat 9 1 2 3 4 5 6 7 8 9

Number of observations 27

The SAS System

The ANOVA Procedure

Dependent Variable: efficy

Sum of

Source DF Squares Mean Square F Value Pr > F Model 10 1039.382838 103.938284 3.29 0.0166 Error 16 504.906144 31.556634

Corrected Total 26 1544.288982

R-Square Coeff Var Root MSE efficy Mean

0.673049 8.829797 5.617529 63.62014

Source DF Anova SS Mean Square F Value Pr > F repetit 2 81.1431435 40.5715718 1.29 0.3035 treat 8 958.2396941 119.7799618 3.80 0.0111

(2)按完全随机化设计计算:

options linesize=76 nodate;

data spotato;

do repetit=1 to 3;

do treat=1 to 9;

infile 'e:\data\er12-9e.dat';

input y @@;

efficy=arsin(sqrt(y/100))*180/3.14159265;

output;

end;

end;

run;

proc print; run;

proc anova;

class treat;

model efficy = treat;

run;

(2)

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

treat 9 1 2 3 4 5 6 7 8 9

Number of observations 27

The SAS System

The ANOVA Procedure

Dependent Variable: efficy

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 8 958.239694 119.779962 3.68 0.0103

Error 18 586.049288 32.558294

Corrected Total 26 1544.288982

R-Square Coeff Var Root MSE efficy Mean

0.620505 8.968839 5.705988 63.62014

Source DF Anova SS Mean Square F Value Pr > F

treat 8 958.2396941 119.7799618 3.68 0.0103

比较表1和表2,可以看出,SS误差(1)

应采用完全随机化设计,归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

处理958.239 694 8 119.779 961 8 3.68 0.010 3

误差586.049 288 18 32.558 294

总和1 544.288 982 26

12.10研究不同处理对毛竹株数增长率的影响,采用3×3拉丁方设计,三个处理分别为:A:对照;B:每公顷穴施N,P混合肥150 kg;C:每株施“富神”毛竹营养液5 mL。各处理的株数增长率如下表[90]:

1 2 3

1 70.6(C)28.4(A)39.5(B)

行 2 50.8(B)66.1(C)49.2(A)

3 31.8(A)48.7(B)54.1(C)

对上述结果进行方差分析。

答:程序和结果如下:

options linesize=76 nodate;

data bamboo;

infile 'e:\data\er12-10e.dat';

input row column treat increase @@;

run;

proc anova;

class row column treat;

model increase=row column treat;

run;

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

row 3 1 2 3

column 3 1 2 3

treat 3 1 2 3

Number of observations 9

The SAS System

The ANOVA Procedure

Dependent Variable: increase

Sum of

Source DF Squares Mean Square F Value Pr > F Model 6 1351.433333 225.238889 1.82 0.3956 Error 2 247.006667 123.503333

Corrected Total 8 1598.440000

R-Square Coeff Var Root MSE increase Mean

0.845470 22.77296 11.11321 48.80000

Source DF Anova SS Mean Square F Value Pr > F row 2 196.580000 98.290000 0.80 0.5568 column 2 23.146667 11.573333 0.09 0.9143 treat 2 1131.706667 565.853333 4.58 0.1792

从方差分析结果看,行、列和处理均不显著。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P 行196.580 000 2 98.290 000 0.80 0.556 8

列23.146 667 2 11.573 333 0.09 0.914 3 处理 1 131.706 667 2 565.853 333 4.58 0.179 2

误差247.006 667 2 123.503 333

总和1 598.440 000 8

12.11研究黄芪水煎工艺,设计了三个因素,每因素三个水平,见下表:

水平提取次数(A) 加溶媒倍数(B) 提取时间/h(C)

1 2 4.5 0.5

2 3 9.0 1.0

3 4 13.5 2.0

选用L18(37)正交表,A因素排在第一列,B因素排在第二列,C因素排在第五列。实验结果是黄芪甲甙含量(mg),按实验号列在下表中[91]:

实验号 1 2 3 4 5 6 7 8 9

结果18.71 23.42 16.99 29.25 17.42 22.54 22.52 26.20 30.27

实验号10 11 12 13 14 15 16 17 18

结果12.89 21.23 23.88 18.44 21.31 15.84 19.52 19.54 18.11

对上述正交实验结果进行方差分析。

答:首先根据L18(37)正交表的第1,2,5列的水平组合建立外部数据文件,或在CARDS 语句后输入数据行。为了直观起见,我们采用在作业流中输入。程序和结果如下:options linesize=76 nodate;

data tech;

input A B C content @@;

cards;

1 1 1 18.71 1

2 2 23.42 1

3 3 16.99 2 1 2 29.25 2 2 3 17.42

2 3 1 22.54 3 1 3 22.52 3 2 1 26.20 3 3 2 30.27 1 1 2 12.89

1 2 3 21.23 1 3 1 23.88 2 1 1 18.44 2 2 2 21.31 2 3 3 15.84

3 1 3 19.52 3 2 1 19.5

4 3 3 2 18.11

;

run;

proc anova;

class A B C;

model content=A B C;

run;

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

A 3 1 2 3

B 3 1 2 3

C 3 1 2 3

Number of observations 18

The SAS System

The ANOVA Procedure

Dependent Variable: content

Sum of

Source DF Squares Mean Square F Value Pr > F Model 6 78.3304667 13.0550778 0.54 0.7701 Error 11 267.4523778 24.3138525

Corrected Total 17 345.7828444

R-Square Coeff Var Root MSE content Mean

0.226531 23.47555 4.930908 21.00444

Source DF Anova SS Mean Square F Value Pr > F

A 2 30.58631111 15.29315556 0.63 0.5513

B 2 5.69967778 2.84983889 0.12 0.8905

C 2 42.04447778 21.02223889 0.86 0.4480

从F的显著水平可以得知,A,B,C三个因素都是不显著因素。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

A 30.586 311 11 2 15.293 155 56 0.63 0.551 3

B 5.699 677 78 2 2.849 838 89 0.12 0.890 5

C 42.044 477 78 2 21.022 238 89 0.86 0.448 0

误差267.452 377 8 11 24.313 852 5

总和345.782 844 4 17

12.12研究除草剂“果尔”不同浓度的除草效果,设计一随机区组试验。共设三个区组,每一区组内含三个处理,处理为“果尔”不同浓度的药土:A:0 mL/亩,B:30 mL/亩和C:70 mL/亩。(注:1亩=666.7 m2)试验排列为:

区组处理

Ⅰ A B C

Ⅱ C A B

Ⅲ B C A

调查每一小区的杂草株数,结果如下[92]:

处理

区组ⅠⅡⅢ

A 9 34 56

B 3 7 5

C 3 5 3

分析上述结果,小区内的杂草株数是服从泊松分布的随机变量。

答:与第7题和第9题不同,本试验设置了区组,必须按随机化完全区组处理。因为观测值是服从泊松分布的随机变量,所以对数据要做平方根变换。程序不再给出,结果如下:

The SAS System

The ANOVA Procedure

Class Level Information

Class Levels Values

block 3 1 2 3

treat 3 1 2 3

Number of observations 9

The SAS System

The ANOVA Procedure

Dependent Variable: number

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 4 27.89576601 6.97394150 4.62 0.0838

Error 4 6.03979789 1.50994947

Corrected Total 8 33.93556390

R-Square Coeff Var Root MSE number Mean

0.822022 38.63030 1.228800 3.180923

Source DF Anova SS Mean Square F Value Pr > F

block 2 4.83003279 2.41501640 1.60 0.3087

treat 2 23.06573322 11.53286661 7.64 0.0431

从上述方差分析结果可以得知,处理的效应是显著的。如果未做平方根变换,则处理效应不显著(结果没有给出),可见对数据进行变换的重要性。

归纳成一般格式的方差分析表如下:

变差来源平方和自由度均方 F P

区组 4.830 032 79 2 2.415 016 40 1.60 0.3087

处理23.065 733 22 2 11.532 866 61 7.64 0.0431

误差 6.039 797 89 4 1.509 949 47

总和33.935 563 90 8

12.13下面是从一项研究中摘录的部分叙述及数据[93]。

试验设计本试验采用随机区组设计……1992年春盆栽,选择规格一致的花盆,每树种草种各种40株,出苗后3.5个月开始试验工作,各随机选择30盆参试,按设计要求,以2株为小区进行排列,放入各自的试验区……耐阴试验:把参试材料放在三个光照环境中,即无光照(光照强度450 lx)、半光照(光照强度4 500~8 000 lx)和全光照(光照强度8 000~12 000 lx);实验结果与分析……12个草种树种耐阴特性分析通过试验研究,获得了12个树种草种的耐阴极限值,即树种草种的耐阴时间列入表中。根据上述统计方法同样得方差分析表9……

12个树种草种耐阴极限值试验结果/d

种类 1 2 3

刺槐68.0 68.0 56.0

黄荆87.0 79.0 85.0

枣树89.0 93.0 87.0

黄栀子128.0 129.0 128.0

银杏115.0 111.0 119.0

木荷105.0 107.0 100.0

黄豆75.0 79.0 77.0

油茶109.0 105.0 108.0

樟树98.0 101.0 99.0

生姜112.0 112.0 111.0

板栗74.0 70.0 69.0

湿地松95.0 90.0 92.0

耐阴方差分析表

因子自由度离差平方和均方F值/×1038F临界值检验结果

A 2 24.000 12.00 1.701 4 3.44 *

B 11 19 868.75 1806.25 1.701 4 2.26 *

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学(第3版)杜荣骞 课后习题答案 第六章 参数估计

第六章参数估计 6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]: y/(μg · L-1)s/(μg · L-1)n 对照组 4.20 0.35 12 5-羟色胺处理组8.49 0.37 9 建立对照组和5-羟色胺处理组平均数差的0.95置信限。 答:程序如下: options nodate; data common; alpha=0.05; input n1 m1 s1 n2 m2 s2; dfa=n1-1; dfb=n2-1; vara=s1**2; varb=s2**2; if vara>varb then F=vara/varb; else F=varb/vara; if vara>varb then Futailp=1-probf(F,dfa,dfb); else Futailp=1-probf(F,dfb,dfa); df=n1+n2-2; t=tinv(1-alpha/2,df); d=abs(m1-m2); lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); k=vara/n1/(vara/n1+varb/n2); df0=1/(k**2/dfa+(1-K)**2/dfb); t0=tinv(1-alpha/2,df0); lcldmsun=d-t0*sqrt(vara/n1+varb/n2); ucldmsun=d+t0*sqrt(vara/n1+varb/n2); cards; 12 4.20 0.35 9 8.49 0.37 ; proc print; id f; var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun; title1 'Confidence Limits on the Difference of Means'; title2 'for Non-Primal Data'; run; 结果见下表: Confidence Limits on the Difference of Means for Non-Primal Data F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN 1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664 首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。 6.2不同年龄的雄岩羊角角基端距如下表[27]: 年龄/a y/cm s/cm n

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学答案 第三章 几种常见的概率分布律

第三章 几种常见的概率分布律 3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少? 答:代入二项分布概率函数,这里φ=1/2。 ()75218.02565621562121!5!3!838 3 5 == ??? ??=??? ????? ??=p 结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为 0.218 75。 3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1) 5 4322345 5 414143541431041431041435434143??? ??+??? ????? ??+??? ????? ??+??? ????? ??+??? ????? ??+??? ??=?? ? ??+ 表型共有1+5+10+10+5+1 = 32种。 (2) ()()()()()()6 976000.0024114165 014.0024 1354143589 087.002419 104143107 263.0024127 104143105 395.0024181 5414353 237.002412434355 43 2 2 3 4 5 541322314==??? ??==?=??? ????? ??==?=??? ????? ??==?=??? ????? ??==?=??? ????? ??===??? ??=隐隐显隐显隐显隐显显P P P P P P 它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。 3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大? 答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为: ()()() ()()φφφ--= -=--=-1lg 1lg 1lg 1lg 11a a a n P n P n P

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

李春喜《生物统计学》第三版 课后作业答案知识分享

李春喜《生物统计学》第三版课后作 业答案

《生物统计学》第三版课后作业答案 (李春喜、姜丽娜、邵云、王文林编著) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用 表现在以下四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。

(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏 离真值的差异,可以分为随机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控 制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避 免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完 全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他 条件明显不一致所产生的倾向性的或定向性的偏差。系统误差主要由一 些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得 精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或 性状的观测值与其真值接近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状 的重复观测值彼此接近程度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值 的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各 个变量间变异程度的大小来衡量。

《生物统计学》复习题及答案

《生物统计学》复习题 一、填空题(每空1分,共10分) 1.变量之间的相关关系主要有两大类:( 因果关系),(平行关系 ) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数 )、(调和平均数) 3.样本标准差的计算公式( 1)(2--= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生 ) 5.在标准正态分布中,P (-1≤u ≤1)=(0。6826 ) (已知随机变量1的临界值为0.1587) 6.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(依变量) 二、单项选择题(每小题1分,共20分) 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 原假设 D 、有效假设 10、抽取样本的基本首要原则是

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

李春喜《生物统计学》第三版课后作业答案

《生物统计学》第三版课后作业答案(李春喜、姜丽娜、邵云、王文林编着) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么?答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本 作用表现在以下四个方面:①提供整理和描述数据资料的科学方法; ②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提 供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。 (7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。

(8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的 观测值偏离真值的差异,可以分为随机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无 法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外 的其他条件明显不一致所产生的倾向性的或定向性的偏差。系统误 差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要 试验工作做得精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验 指标或性状的观测值与其真值接近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标 或性状的重复观测值彼此接近程度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真 值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间 的各个变量间变异程度的大小来衡量。 习题1.3 误差与错误有何区别?

生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理

第一章统计数据的收集与整理 1.1算术平均数是怎样计算的?为什么要计算平均数? n 、y i -4 y = _ 答:算数平均数由下式计算: n ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。 计算算数平均数的目的, 是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之 间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。 在比较两个平均数不同的样本时所 得结果更可靠。 1.4完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数 据,不要忘记,体 重是通过度量得到的, 属于连续型数据。根据表中所给出的数据编制频数 分布表。 序和计算结果如下: proc format; value hfmt 56-57='56-57' 62-63='62-63' 68-69='68-69' 70-71=70-71' 72-73=72-73' 74-75=74-75: run; data weight; in file 'E:\data\exer1-5e.dat'; 64 6 66 62 64 7 66 5 7 13 4 66 6 6 6 66 64 64 4 6 10 3 6 6 6 7 6 9 6 12 7 6 6 6 6 6 16 4 3 7 6 6 6 6 6 14 2 8 7 6 6 6 6 6 566 7 66 74 64 75 62 6664646469 64 64 66 64 64 64 66 62 726166 64 6 66 66 6661 答:首先建立一个外部数据文件,名称和路径为: 62 6 66 6 7264 62 7 72 E:\data\exer1-5e.dat 。所用的 SAS 程 58-59='58-59' 64-65='64-65' 60-6仁'60-61' 66-67='66-67'

生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理经典.doc

第一章统计数据的收集与整理1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:n y y n i i ∑ = =1 ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67'

生物统计学(第四版)答案 1—6章

2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。24号:19,21,20,20,18,19,22,21,21,19; 金皇后:16,21,24,15,26,18,20,19,22,19。 【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。 2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46; 第三章概率与概率分布 3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96; (5)P(-2.58<u≤2.58)。 【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。 3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值: (1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。 【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。 3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。 (1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率; (2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。假定F2代播种了2000株,试问糯稻株有多少?非糯株有多少? 课后答案网https://www.sodocs.net/doc/f011470077.html,1=42.7,R=30,s1=7.078,CV1=16.58%;2=52.1,R=30,s2=6.335,CV2=12.16%。 第四章统计推断 课后答案网https://www.sodocs.net/doc/f011470077.html,=0=21g,4.5接受HA:≠0;95%置信区间:(19.7648,20.2352)。 4.6核桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。 【答案】t=-0.371,接受H0:=0=2.40%。 4.7检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为2 5.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为4 6.8粒。试检验两代每卵块的卵数有无显著差异。 【答案】u=-4.551,否定H0:1=2,接受HA:1≠2。 4.8假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120。试检验这一假说。 【答案】t=-0.147,接受H0:1=2。 4.9用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:序

生物统计学各章题目(含答案)

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现 代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变 量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

生物统计学(第三版)

概论 名词: 生物统计:将概率论和数理统计的原理应用到生物学中以分析和解释其数量资料的科学 试验设计:试验工作未进行之前应用生物统计原理,来制定合理的试验方案,包括选择动物,分组和对比以及相应的资料搜集整理和统计分析的方法。 总体与样本 ?数据具有不齐性。 ?根据研究目的确定的研究对象的全体称为总体(population); ?含有有限个个体的总体称为有限总体; ?包含有无限多个个体的总体叫无限总体; ?总体中的一个研究单位称为个体(individual); ?从总体中随机抽出一部分具有代表性的个体称为样本(sample); ?样本中所包含的个体数目叫样本容量或大小,常记为n。 ?通常把n≤30的样本叫小样本,n >30的样本叫大样本。 随机抽取(random sampling) 的样本是指总体中的每一个个体都有同等的机会被抽取组成 样本。 变数与变异数列、变量: ?变数:研究中对样本个体的观察值。 ?变量:相同性质的事物间表现差异性的某种特征。如:身高、体重。 ?变异数列:将变数按从小到大的顺序排列的一组数列。 参数与统计量 ?由总体计算的特征数叫参数(parameter); ?由样本计算的特征数叫统计量(staistic)。 准确性与精确性 ?准确性(accuracy)也叫准确度,指观测值与其真值接近的程度。若x与μ相差的 绝对值|x-μ|小,则观测值x的准确性高;反之则低。 ?精确性(precision)也叫精确度,指重复观测值彼此接近的程度。若观测值彼此接 近,即任意二个观测值xi、xj相差的绝对值|xi -xj |小,则观测值精确性高;反之 则低。 ?调查或试验的准确性、精确性合称为正确性。由于真值μ常常不知道,所以准确性 不易度量,但利用统计方法可度量精确性。 随机误差与系统误差 随机误差也叫抽样误差(sampling error) ,是由于许多无法控制的内在和外在的偶然因素所造成。带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。 系统误差也叫片面误差(lopsided error),是试验处理之外的其他条件明显不一致所带来的偏差。是由于试验动物的初始条件相差较大,饲料种类、品质、数量、饲养条件未控制相同,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。 系统误差是一种有原因的偏差,因而在试验过程中要防止这种偏差的出现。随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度愈大。随机误差不可避免,但可减少,这主要依赖控制试验过程,尤

最新生物统计学课后习题解答-李春喜

。 第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90

计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。 24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ; 金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50 绳测其毛重(kg) ,结果分别如下: 单养50 绳重量数据:45 ,45 ,33 ,53 ,36 ,45 ,42 ,43 ,29 ,25 ,47 ,50 ,43 ,49 ,36 ,30 ,39 ,44 ,35 ,38 ,46 ,51 ,42 ,38 ,51 ,45 ,41 ,51 ,50 ,47 ,44 ,43 ,46 ,55 ,42 ,27 ,42 ,35 ,46 ,53 ,32 ,41 ,48 ,50 ,51 ,46 ,41 ,34 ,44 ,46 ; 混养50 绳重量数据:51 ,48 ,58 ,42 ,55 ,48 ,48 ,54 ,39 ,58 ,50 ,54 ,53 ,44 ,45 ,50 ,51 ,57 ,43 ,67 ,48 ,44 ,58 ,57 ,46 ,57 ,50 ,48 ,41 ,62 ,51 ,58 ,48 ,53 ,47 ,57 ,51 ,53 ,48 ,64 ,52 ,59 ,55 ,57 ,48 ,69 ,52 ,54 ,53 ,50 。 试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论。【答案】 1 =4 2 . 7, R=30, s 1 =7 . 078, CV 1 =16 . 58% ; 2 =52.1,R=30 ,s 2 =6.335, CV 2 =12.16% 。

相关主题