搜档网
当前位置:搜档网 › 试验设计与数据处理课后作业

试验设计与数据处理课后作业

试验设计与数据处理课后作业
试验设计与数据处理课后作业

习题三

3-7

(1)金球

SAS处理结果:

Sample Statistics for x

N Mean Std. Dev. Std. Error

-------------------------------------------------

6 6.68 0.00 0.00

Hypothesis Test

Null hypothesis: Mean of x = 0

Alternative: Mean of x ^= 0

t Statistic Df Prob > t

---------------------------------

4228.344 5 <.0001

90 % Confidence Interval for the Mean

Lower Limit: 6.67

Upper Limit: 6.68

由运行结果可知,μ的置信度为0.9的置信区间(6.67,6.68)。

Sample Statistics for x

N Mean Std. Dev. Variance

---------------------------------------------

6 6.6782 0.0039 15E-6

Hypothesis Test

Null hypothesis: Variance of x = 1

Alternative: Variance of x ^= 1

Chi-square Df Prob

---------------------------------

0.000 5 <.0001

90% Confidence Interval for the Variance

Lower Limit Upper Limit

----------- -----------

676E-8 0.0001

由运行结果可知,σ2的置信度为0.9的置信区间(676E-8,0.0001)。

(2)铂球

SAS处理结果:

Sample Statistics for x

N Mean Std. Dev. Std. Error

-------------------------------------------------

5 6.6

6 0.00 0.00

Hypothesis Test

Null hypothesis: Mean of x = 0

Alternative: Mean of x ^= 0

t Statistic Df Prob > t

---------------------------------

4967.052 4 <.0001

90 % Confidence Interval for the Mean

Lower Limit: 6.66

Upper Limit: 6.67

由运行结果可知,μ置信度为0.9的的置信区间(6.66,6.67)。

Sample Statistics for x

N Mean Std. Dev. Variance

---------------------------------------------

5 6.664 0.003 9E-6

Hypothesis Test

Null hypothesis: Variance of x = 1

Alternative: Variance of x ^= 1

Chi-square Df Prob

---------------------------------

0.000 4 <.0001

90% Confidence Interval for the Variance

Lower Limit Upper Limit

----------- -----------

379E-8 507E-7

由运行结果可知,σ的置信度为0.9的置信区间(379E-8,507E-7)。

3-10

SAS处理结果:

Sample Statistics for x

N Mean Std. Dev. Std. Error

-------------------------------------------------

5 3.25 0.01 0.01

Hypothesis Test

Null hypothesis: Mean of x = 3.25

Alternative: Mean of x ^= 3.25

t Statistic Df Prob > t

---------------------------------

0.343 4 0.7489

说明:因为在t 检验中,p-value 值0.7489> 0.01(显著性水平),所以接受原假设,即这批矿砂的镍含量的均值为3.25。

3-13

SAS处理结果:

Sample Statistics

Group N Mean Std. Dev. Std. Error

----------------------------------------------------

x 8 0.231875 0.0146 0.0051

y 10 0.2097 0.0097 0.0031

Hypothesis Test

Null hypothesis: Mean 1 - Mean 2 = 0

Alternative: Mean 1 - Mean 2 ^= 0

If Variances Are t statistic Df Pr > t

----------------------------------------------------

Equal 3.878 16 0.0013

Not Equal 3.704 11.67 0.0032

说明:因为在t 检验中p-value 值0.0013<0.05 (显著性水平),所以拒绝原假设,即认为两个作家所写的小品文中包含由3个字母组成的词的比例有显著的差异。

3-14

SAS处理结果:

Sample Statistics

Group N Mean Std. Dev. Variance

--------------------------------------------------

x 8 0.231875 0.0146 0.000212

y 10 0.2097 0.0097 0.000093

Hypothesis Test

Null hypothesis: Variance 1 / Variance 2 = 1

Alternative: Variance 1 / Variance 2 ^= 1

- Degrees of Freedom -

F Numer. Denom. Pr > F

----------------------------------------------

2.27 7 9 0.2501

说明:因为在F检验中p-value 值0.2501>0.05 (显著性水平),所以接受原假设,即认为两总体方差无显著性差异。

习题四

4-1

SAS处理结果:

The ANOVA Procedure

Class Level Information

Class Levels Values

c 5 1 2 3 4 5

Number of observations 20

The ANOVA Procedure

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 4 1480.823000 370.205750 40.88 <.0001

Error 15 135.822500 9.054833

Corrected Total 19 1616.645500

R-Square Coeff Var Root MSE y Mean

0.915985 13.12023 3.009125 22.93500

Source DF Anova SS Mean Square F Value Pr > F

c 4 1480.823000 370.205750 40.88 <.0001

说明:由于概率Pr小于0.0001,即远小于0.01,说明这些抗生素百分比的均值有高度显著的差异。

4-2

SAS处理结果:

The GLM Procedure

Class Level Information

Class Levels Values

浓度C 3 1 2 3

温度T 4 1 2 3 4

Number of observations 24

The GLM Procedure

Dependent Variable: R

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 11 82.8333333 7.5303030 1.39 0.2895

Error 12 65.0000000 5.4166667

Corrected Total 23 147.8333333

R-Square Coeff Var Root MSE Mean

0.560316 22.34278 2.327373 10.41667

Source DF Factoid SS Mean Square F Value Pr > F

C 2 44.33333333 22.16666667 4.09 0.0442

T 3 11.50000000 3.83333333 0.71 0.5657

C* T 6 27.00000000 4.50000000 0.83 0.5684

说明:由于浓度C的概率Pr为0.0442,即小于0.05,说明浓度C的作用是显著的。而温度T的Pr为0.5657,大于0.05,C* T的Pr为0.5684,大于0.05,说明温度与温度和

浓度的交互作用都是不显著的。

4-4

答:(1)不用协变量,做方差分析时,结果如下图,p值为0.2766>0.05所以不能通过显著性检验。

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F Model 3 1041.791667 347.263889 1.38 0.2766 Error 20 5018.166667 250.908333

Corrected Total 23 6059.958333

R-Square Coeff Var Root MSE y Mean

0.171914 22.88754 15.84009 69.20833

Source DF Type I SS Mean Square F Value Pr > F

v 1 330.0416667 330.0416667 1.32 0.2650

m 1 693.3750000 693.3750000 2.76 0.1120

v*m 1 18.3750000 18.3750000 0.07 0.7895

Source DF Type III SS Mean Square F Value Pr > F

v 1 330.0416667 330.0416667 1.32 0.2650

m 1 693.3750000 693.3750000 2.76 0.1120

v*m 1 18.3750000 18.3750000 0.07 0.7895

(2)引入协变量后,p值<0.0001,所以品种(V)和温度(m)和两者的相互影响对鲜花有显著性影响。

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 3 5757.647088 1919.215696 126.97 <.0001

Error 20 302.311245 15.115562

Corrected Total 23 6059.958333

R-Square Coeff Var Root MSE y Mean

0.950113 5.617638 3.887874 69.20833

Source DF Type I SS Mean Square F Value Pr > F

v 1 330.041667 330.041667 21.83 0.0001

m 1 693.375000 693.375000 45.87 <.0001

x 1 4734.230422 4734.230422 313.20 <.0001

Source DF Type III SS Mean Square F Value Pr > F

v 1 24.963949 24.963949 1.65 0.2134

m 1 480.821422 480.821422 31.81 <.0001

x 1 4734.230422 4734.230422 313.20 <.0001

(3)平行斜率假设引入后,对各种品种和湿度组合选用相同的系数不合适,结果如图所示。

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 6 5855.840709 975.973452 81.28 <.0001 Error 17 204.117624 12.006919

Corrected Total 23 6059.958333

R-Square Coeff Var Root MSE y Mean

0.966317 5.006767 3.465100 69.20833

Source DF Type I SS Mean Square F Value Pr > F

v 1 330.041667 330.041667 27.49 <.0001

m 1 693.375000 693.375000 57.75 <.0001

v*m 1 18.375000 18.375000 1.53 0.2329

x 1 4790.927419 4790.927419 399.01 <.0001

x*v 1 3.634628 3.634628 0.30 0.5893

x*m 1 19.486995 19.486995 1.62 0.2198

Source DF Type III SS Mean Square F Value Pr > F

v 1 0.153803 0.153803 0.01 0.9112

m 1 180.365030 180.365030 15.02 0.0012

v*m 1 83.385265 83.385265 6.94 0.0174

x 1 4186.834293 4186.834293 348.70 <.0001

x*v 1 3.263044 3.263044 0.27 0.6089 x*m 1 19.486995 19.486995 1.62 0.2198

习题五

5-3

用L9(34)确定配比试验方案。如表所示

A :

B :

C :D=0.1:0.3:0.2:0.5

配比方案中,要求各行四个比值之和为1。在1号条件中,四种数值分别是

A=0.1ⅹ5

.02.03.01.01

+++=0.091

B=0.3ⅹ5

.02.03.01

.01

+++=0.272

C=0.2ⅹ5

.02.03.01.01

+++=0.182

D=0.5ⅹ5

.02.03.01.01

+++=0.455

其余试验条件可按照相同方法得出。

习题六

6-5

(1)做散点图。(2)以模型22012y ,(0,)b b x b x N εεσ=+++拟合数据,

其中2012,,,b b b σ与x 无关,求

^^^

^2

012x x

b b b y =++。

散点图

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 38.93714 19.46857 9.54 0.0033

Error 12 24.47619 2.03968

Corrected Total 14 63.41333

Root MSE 1.42817 R-Square 0.6140

Dependent Mean 30.03333 Adj R-Sq 0.5497

Coeff Var 4.75530

Parameter Estimates

Parameter Standard

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 19.03333 3.27755 5.81 <.0001

t1 1 1.00857 0.35643 2.83 0.0152

t2 1 -0.02038 0.00881 -2.31 0.039

所以

2

=+-

x x

y19.03333 1.00857*0.02038*

6-6

(1)采用逐步回归法,SAS 运行结果如下:

The REG Procedure

Model: MODEL1

Dependent Variable: y

Stepwise Selection: Step 1

Variable x3 Entered: R-Square = 0.6216 and C(p) = 14.7345

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 1 10.58000 10.58000 9.86 0.0201

Error 6 6.44000 1.07333

Corrected Total 7 17.02000

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept 9.90000 0.36629 784.08000 730.51 <.0001

x3 1.15000 0.36629 10.58000 9.86 0.0201

Bounds on condition number: 1, 1

------------------------------------------------------------------------------------------------------

Stepwise Selection: Step 2

Variable x1 Entered: R-Square = 0.7770 and C(p) = 9.0400

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 13.22500 6.61250 8.71 0.0235

Error 5 3.79500 0.75900

Corrected Total 7 17.02000

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept 9.90000 0.30802 784.08000 1033.04 <.0001

x1 0.57500 0.30802 2.64500 3.48 0.1209

x3 1.15000 0.30802 10.58000 13.94 0.0135

The REG Procedure

Model: MODEL1

Dependent Variable: y

Stepwise Selection: Step 2

Bounds on condition number: 1, 4

------------------------------------------------------------------------------------------------------

Stepwise Selection: Step 3

Variable x2 Entered: R-Square = 0.9192 and C(p) = 4.0000

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 3 15.64500 5.21500 15.17 0.0119

Error 4 1.37500 0.34375

Corrected Total 7 17.02000

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept 9.90000 0.20729 784.08000 2280.96 <.0001

x1 0.57500 0.20729 2.64500 7.69 0.0501

x2 0.55000 0.20729 2.42000 7.04 0.0568

x3 1.15000 0.20729 10.58000 30.78 0.0052

Bounds on condition number: 1, 9

------------------------------------------------------------------------------------------------------

All variables left in the model are significant at the 0.1500 level.

All variables have been entered into the model.

Summary of Stepwise Selection

Variable Variable Number Partial Model

Step Entered Removed Vars In R-Square R-Square C(p) F Value Pr > F

1 x3 1 0.6216 0.6216 14.7345 9.86 0.0201

2 x1 2 0.1554 0.7770 9.0400 3.48 0.1209

3 x2 3 0.1422 0.9192 4.0000 7.0

4 0.0568

在а=0.1下,回归方程为:y

=9.90+0.575x1+0.550x2+1.150x3。

(2)采用逐步回归法,SAS 运行结果如下:

The REG Procedure Model: MODEL1 Dependent Variable: y

Stepwise Selection: Step 1

Variable x3 Entered: R-Square = 0.6216 and C(p) = 14.7345

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 1 10.58000 10.58000 9.86 0.0201 Error 6 6.44000 1.07333 Corrected Total 7 17.02000

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept 9.90000 0.36629 784.08000 730.51 <.0001 x3 1.15000 0.36629 10.58000 9.86 0.0201

Bounds on condition number: 1, 1

------------------------------------------------------------------------------------------------------

All variables left in the model are significant at the 0.0500 level.

No other variable met the 0.0500 significance level for entry into the model.

Summary of Stepwise Selection

Variable Variable Number Partial Model

Step Entered Removed Vars In R-Square R-Square C(p) F Value Pr > F

1 x3 1 0.6216 0.6216 14.7345 9.86 0.0201

在а=0.05下,回归方程为:y

=9.90+1.150x3。

6-9

The REG Procedure

Model: MODEL1 Dependent Variable: y

Stepwise Selection: Step 1

Variable x2 Entered: R-Square = 0.2872 and C(p) = 12.2386

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 1 63.04712 63.04712 5.64 0.0324

Error 14 156.48048 11.17718

Corrected Total 15 219.52760

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept 7.96038 1.64304 262.36439 23.47 0.0003

x2 0.08614 0.03627 63.04712 5.64 0.0324

Bounds on condition number: 1, 1

------------------------------------------------------------------------------------------------------

Stepwise Selection: Step 2

Variable x3 Entered: R-Square = 0.5361 and C(p) = 5.7737

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 117.69530 58.84765 7.51 0.0068

Error 13 101.83230 7.83325

Corrected Total 15 219.52760

Parameter Standard

Variable Estimate Error Type II SS F Value Pr > F

Intercept 17.05188 3.70671 165.77106 21.16 0.0005

x2 0.08614 0.03036 63.04712 8.05 0.0140

x3 -1.65300 0.62583 54.64818 6.98 0.0203

Bounds on condition number: 1, 4

------------------------------------------------------------------------------------------------------

All variables left in the model are significant at the 0.0500 level.

21:58 Sunday, October 25, 2009 2

The REG Procedure

Model: MODEL1

Dependent Variable: y

Stepwise Selection: Step 2

No other variable met the 0.0500 significance level for entry into the model.

Standard Error

Variable Variable Number Partial Model

Step Entered Removed Vars In R-Square R-Square C(p) F Value Pr > F

1 x

2 1 0.2872 0.2872 12.2386 5.64 0.0324 2 x

3 2 0.2489 0.5361 5.7737 6.98 0.0203

由运行结果可知,y

=17.05188+0.08614 x 2-1.65300 x 3

6-10

c 0.8189841 1.0000000 -0.5460930 a -0.2988564 -0.5460930 1.0000000

由运行结果可知,y

=

)

5510.05878.3exp(10439

.22x -++ε

习题七

7-1

在根据变换x=2z-77将x 换成z ,则x1=1,x2=2,x3=3,…,x9=9。 并可设y

=b0+b1Ф1(x)+ b2Ф2(x)+ b2Ф2(x)+ b4Ф4(x)

The SAS System

The ORTHOREG Procedure

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 4 1.5430950272 0.3857737568 45.57 0.0014 Error 4 0.0338605284 0.0084651321 Corrected Total 8 1.5769555556

Root MSE 0.0920061525 R-Square 0.9785279121

Standard

Variable DF Parameter Estimate Error t Value Pr > |t|

Intercept 1 2.07222222222222 0.0306687175 67.57 <.0001 w1 1 0.1195 0.0118779432 10.06 0.0005 w2 1 0.01527777777777 0.0017475124 8.74 0.0009 w3 1 -0.00629292929292 0.0029241475 -2.15 0.0978 w4 1 0.00017482517482 0.0020562922 0.09 0.9363

由结果分析得,w3、w4的P 值都大于0.05,说明三次项、四次项不显著,回归方程只需要配到二次就可以了。

只保留一次项、二次项进行SAS 操作:

The ORTHOREG Procedure

Dependent Variable: y

Sum of

Source DF Squares Mean Square F Value Pr > F

Model 2 1.5038288889 0.7519144444 61.69 <.0001 Error 6 0.0731266667 0.0121877778 Corrected Total 8 1.5769555556

Root MSE 0.1103982689 R-Square 0.953627947

Standard

Variable DF Parameter Estimate Error t Value Pr > |t|

Intercept 1 2.07222222222222 0.036799423 56.31 <.0001 w1 1 0.1195 0.0142523552 8.38 0.0002 w2 1 0.01527777777777 0.0020968417 7.29 0.0003

从结果可以看到模型的Pr<.0001,说明模型更加显著了。b1、b2的值分别是0.1195、0.01527777777777。 查附表6,当n=9时, 11122222()()5

758

()()3(10)330379

6

x x x x x x x x x ?λφ?λφ==-==?-+=-+

011222()()

2.072220.1195(5)0.01528(330379)y b b x b x x x x ??=++=+?-+?-+ 将277x z =-代入上式得所求多项式回归方程: 20.1833614.79452304.5489y z z =-+

7-3

解:

采用二水平,做变换:x1=

103101-z ,x2=5252-z ,x3=252253-z ,x4=10

90

4-z data E731;

input x1-x4 y; cards;

1 1 1 1 92.4 1 1 -1 -1 90.4 1 -1 1 -1 87.8 1 -1 -1 1 87.3 -1 1 1 -1 84.5 -1 1 -1 1 86.0 -1 -1 1 1 83.7 -1 -1 -1 -1 83.4 ;

proc reg data=E731; model y=x1-x4; run;

Model: MODEL1 Dependent Variable: y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 4 68.48500 17.12125 12.73 0.0317 Error 3 4.03375 1.34458 Corrected Total 7 72.51875

Root MSE 1.15956 R-Square 0.9444

Dependent Mean 86.93750 Adj R-Sq 0.8702 Coeff Var 1.33379

Parameter Estimates

Parameter Standard

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 86.93750 0.40997 212.06 <.0001 x1 1 2.53750 0.40997 6.19 0.0085 x2 1 1.38750 0.40997 3.38 0.0430 x3 1 0.16250 0.40997 0.40 0.7183 x4 1 0.41250 0.40997 1.01 0.3885

x3、x4 的P 值大于0.05,不显著,删掉后重新进行检验。

The REG Procedure

Model: MODEL1 Dependent Variable: y

Analysis of Variance

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 2 66.91250 33.45625 29.84 0.0017 Error 5 5.60625 1.12125 Corrected Total 7 72.51875

Root MSE 1.05889 R-Square 0.9227 Dependent Mean 86.93750 Adj R-Sq 0.8918 Coeff Var 1.21799

Parameter Estimates

Parameter Standard

Variable DF Estimate Error t Value Pr > |t|

Intercept 1 86.93750 0.37437 232.22 <.0001 x1 1 2.53750 0.37437 6.78 0.0011 x2 1 1.38750 0.37437 3.71 0.0139

与第一次分析结果相比,模型的显著性明显提高。y=86.93750+2.53750x1+1.38750x2,

用z1、z2替换x1、x2,得回归方程y

=0.25375 z1+0.2375 z2+1.3375

习题九

(1)反射点E 的坐标(5,

3

10

,0) (2)(i )扩大,а>1(ii )内收缩,а<0(iii )收缩,0<а<1

(3) 新单纯形A’BC’D’,各点坐标B(2,4,3),A’(1.5,3,3.5),C’(2.5,2.5,2.5),

D”(3,3.5,2)。

习题十

10-4

ADX Report for Untitled Experiment Today's date: 09JUL1993 Experiment creation date: 09JUL1993 DESIGN DETAILS Design-type: Response Surface Number of factors: 3 Number of runs: 15 FACTORS Factors and Levels: ________________________ Factor Low Center High ________________________ X1 -1 0 1 X2 -1 0 1 X3 -1 0 1 ________________________ RESPONSE ________ Response ________ Y1 ________ FIT DETAILS: Y1 Check Assumptions Analysis _______________________________________________________ Response Transformation Optimal power from Box-Cox plot: 1/Y1**2 Power recommended by ADX: Y1 Power applied for response transformation: Y1 Response Scaling Shift: 0 Outlier Observations

Run numbers deleted from analysis: None

Influential Observations

Run numbers deleted from analysis: None

_______________________________________________________

ANOVA for Y1

________________________________________________________________________________________________ _____

Master Model Predictive Model _____________________________________________

_____________________________________________

Source DF SS MS F Pr > F DF SS MS F Pr > F

________________________________________________________________________________________________ _____

X1 1 0.405 0.405 0.395959 0.556811 1 0.405 0.405 0.395959 0.556811 X2 1 0.78125 0.78125 0.76381 0.422123 1 0.78125 0.78125 0.76381 0.422123

X3 1 5.61125 5.61125 5.485987 0.066197 1 5.61125 5.61125 5.485987 0.066197 X1*X1 1 34.4416 34.4416 33.67274 0.002143 1 34.4416 34.4416 33.67274 0.002143 X1*X2 1 32.49 32.49 31.76471 0.002438 1 32.49 32.49 31.76471 0.002438 X1*X3 1 26.01 26.01 25.42936 0.003958 1 26.01 26.01 25.42936 0.003958 X2*X2 1 31.68006 31.68006 30.97285 0.002578 1 31.68006 31.68006 30.97285 0.002578 X2*X3 1 109.2025 109.2025 106.7647 0.000146 1 109.2025 109.2025 106.7647 0.000146 X3*X3 1 38.5016 38.5016 37.64211 0.00167 1 38.5016 38.5016 37.64211 0.00167 Model 9 265.2098 29.46776 28.80993 0.000874 9 265.2098 29.46776 28.80993 0.000874 Error 5 5.114167 1.022833 5 5.114167 1.022833

Total 14 270.324 14 270.324

________________________________________________________________________________________________ _____

Fit Statistics for Y1

____________________________________________

Master Model Predictive Model

____________________________________________

Mean 32.52 32.52

R-square 98.11% 98.11%

Adj. R-square 94.70% 94.70%

RMSE 1.011352 1.011352

CV 3.109939 3.109939

____________________________________________

Alias Structure for Y1

_________________________________________

Master Model Predictive Model

_________________________________________

No effects aliased. No effects aliased.

_________________________________________

Predictive Model for Y1

______________________________________________________________________________

Coded Levels(-1,1):

Y1 = 37.43333 - 0.225*X1 - 0.3125*X2 - 0.8375*X3 - 3.054167*X1*X1 - 2.85*X1*X2

- 2.55*X1*X3 - 2.929167*X2*X2 - 5.225*X2*X3 - 3.229167*X3*X3

Uncoded Levels: Y1 = 37.43333 - 0.225*X1 - 0.3125*X2 - 0.8375*X3 - 3.054167*X1*X1 - 2.85*X1*X2 - 2.55*X1*X3 - 2.929167*X2*X2 - 5.225*X2*X3 - 3.229167*X3*X3 ______________________________________________________________________________ Effect Estimates for Y1

________________________________________________________________________________________________

__________

Master Model Predictive Model ___________________________________________

___________________________________________ Term Estimate Std Err t Pr > |t| Estimate Std Err t Pr > |t|

__________________________________________________________________________________________________________

X1 -0.225 0.357567 -0.62925 0.556811 -0.225 0.357567 -0.62925 0.556811 X2 -0.3125 0.357567 -0.87396 0.422123 -0.3125 0.357567 -0.87396 0.422123 X3 -0.8375 0.357567 -2.34222 0.066197 -0.8375 0.357567 -2.34222 0.066197 X1*X1 -3.054167 0.526324 -5.80282 0.002143 -3.054167 0.526324 -5.80282 0.002143 X1*X2 -2.85 0.505676 -5.63602 0.002438 -2.85 0.505676 -5.63602 0.002438 X1*X3 -2.55 0.505676 -5.04275 0.003958 -2.55 0.505676 -5.04275 0.003958 X2*X2 -2.929167 0.526324 -5.56533 0.002578 -2.929167 0.526324 -5.56533 0.002578 X2*X3 -5.225 0.505676 -10.3327 0.000146 -5.225 0.505676 -10.3327 0.000146 X3*X3 -3.229167 0.526324 -6.13532 0.00167 -3.229167 0.526324 -6.13532 0.00167

__________________________________________________________________________________________________________

习题十一

11-5

解:2

23222223222

)8()4(8,

4T

l g T

l T T

l

T g T

l g σπσπσππ-+=-=??=??

习题十二

累计频率

0.2 0.6 0.9 1 累计频率是累计概率即分布函数的近似,离散等级的出现频率可以近似看成是该等级为中点,左、右各半个等级长为区间上的概率近似 所以:

1y :0.2, 1

()0.5*0.20.1p x x <== 2:0.4,y 2()0.20.5*0.40.4p x x <=+= 3:0.3,y 3

()0.60.5*0.30.75p x x <=+=

4:0.1,y 4()0.9

0.5*0.10.95p x x <=+= 查正态分布表,得到:

0.1对应的1 1.28x =- 0.4对应的20.25x =- 0.75对应的30.66x = 0.95对应的

4 1.64x =

所以三等、二等、一等、特等的分值(-1.28,-0.25,0.66,1.64)

习题十三

13-1

(1)对指标进行主成份分析并解释主成份 (2)利用主成份对12个行业排序和分类

答案:前3项的特征根大于1,自第4个特征根开始,数值明显减少。由此确定主成份个数k=3.前3个主成份的累积方程贡献率达到86.8%,信息丢失很小。

13-4

The PRINCOMP Procedure

Observations 11

Variables 3

Simple Statistics

x1 x2 x3

Mean 194.5909091 3.300000000 139.7363636

StD 29.9995151 1.649242250 20.6344020

Correlation Matrix

x1 x2 x3

x1 1.0000 0.0259 0.9973

x2 0.0259 1.0000 0.0357

x3 0.9973 0.0357 1.0000

Eigenvalues of the Correlation Matrix

Eigenvalue Difference Proportion Cumulative

1 1.99915493 1.00100076 0.6664 0.6664

2 0.99815418 0.99546329 0.3327 0.9991

3 0.00269089 0.0009 1.0000

Eigenvectors

z1 z2 z3

x1 0.706330 -0.035689 0.706982

x2 0.043501 0.999029 0.006971

x3 0.706544 -0.025830 -0.707197

上表给出协差阵的三个特征值分别是λ1=1.99915493,λ2= 0.99815418,

λ3=0.00269089.

对应的特征向量分别是:

t1=(0.706330,0.043501,0.706544),t2=(-0.035689,0.999029,-0.025830),t3=(0.706982,0.006971,-0.707197)。

由此可得第一、二、三主成分:

Z1=0.706330 x1+0.043501 x2+0.706544 x3

Z2=-0.035689x1+0.999029x2-0.025830x3

Z3=0.706982x1+0.006971 x2-0.707197 x3

实验设计与数据处理心得

实验设计与数据处理心得体会 刚开始选这门课的时候,我觉得这门课应该就是很难懂的课程,首先我们做过不少的实验了,当然任何自然科学都离不开实验,大多数学科(化工、化学、轻工、材料、环境、医药等)中的概念、原理与规律大多由实验推导与论证的,但我觉得每次到处理数据的时候都很困难,所以我觉得这就是门难懂的课程,却也就是很有必要去学的一门课程,它对于我们工科生来说也就是很有用途的,在以后我们实验的数据处理上有很重要的意义。 如何科学的设计实验,对实验所观测的数据进行分析与处理,获得研究观测对象的变化规律,就是每个需要进行实验的人员需要解决的问题。“实验设计与数据处理”课程就就是就是以概率论数理统计、专业技术知识与实践经验为基础,经济、科学地安排试验,并对试验数据进行计算分析,最终达到减少试验次数、缩短试验周期、迅速找到优化方案的一种科学计算方法。它主要应用于工农业生产与科学研究过程中的科学试验,就是产品设计、质量管理与科学研究的重要工具与方法,也就是一门关于科学实验中实验前的实验设计的理论、知识、方法、技能,以及实验后获得了实验结果,对实验数据进行科学处理的理论、知识、方法与技能的课程。 通过本课程的学习,我掌握了试验数据统计分析的基本原理,并能针对实际问题正确地运用,为将来从事专业科学的研究打下基础。这门课的安排很合理,由简单到复杂、由浅入深的思维发展规律,先讲单因素试验、双因素试验、正交试验、均匀试验设计等常用试验设计

方法及其常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识,最后将得出的方差分析、回归分析等结论与处理方法直接应用到试验设计方法。 比如我对误差理论与误差分析的学习:在实验中,每次针对实验数据总会有误差分析,误差就是进行实验设计与数据评价最关键的一个概念,就是测量结果与真值的接近程度。任何物理量不可能测量的绝对准确,必然存在着测定误差。通过学习,我知道误差分为过失误差,系统误差与随机误差,并理解了她们的定义。另外还有对准确度与精密度的学习,了解了她们之间的关系以及提高准确度的方法等。对误差的学习更有意义的应该就是如何消除误差,首先消除系统误差,可以通过对照试验,空白试验,校准仪器以及对分析结果的校正等方法来消除;其次要减小随机误差,就就是要在消除系统误差的前提下,增加平行测定次数,可以提高平均值的精密度。 比如我对方差分析的理解:方差分析就是实验设计中的重要分析方法,应用非常广泛,它就是将不同因素、不同水平组合下试验数据作为不同总体的样本数据,进行统计分析,找出对实验指标影响大的因素及其影响程度。对于单因素实验的方差分析,主要步骤如下:建立线性统计模型,提出需要检验的假设;总离差平方与的分析与计算;统计分析,列出方差分析表。对于双因素实验的方差分析,分为两种,一种就是无交互作用的方差分析,另一种就是有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但就是总体步骤都与单因素实验的方差分析一样。

试验设计与数据处理作业 333333.

试验设计与数据处理 题目正交实验方差分析法确定优方案 学院名称化学化工学院 指导教师范明舫 班级化工081班 学号20084540104 学生姓名陈柏娥

2011年04月20日 《实验设计与数据处理》课程的收获与体会 《实验设计与数据处理》课程具有公式多、计算多、图表多等特点,涉及较多概率论基础知识,课程本身的繁杂性决定了理解和掌握起来难度较大。一开始的时候,我还有点担心这一门课会学不好,因为我的概率论和数理统计的知识基础薄弱,可能会对里面的内容产生难以理解的心理,有点感觉他是郁闷枯燥乏味的课程。不过,在老师的指导下我否认了之前的观点。 这门课的安排很合理,从简单到复杂,由浅入深的思维发展规律,现将单因素试验、双因素试验、正交试验、均匀实验设计等常用实验设计方法及常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识、最后讲得出的方差分析、回归分析等结论和处理方法直接应用到实验设计方法。老师也让我们先熟悉实验设计方法,并掌握常规数据处理方法,使我较早的感受到应用试验设计方法指导实践的“收获”,从而激发并维持学习兴趣。 通过学习,我初步认识了这一门课。这门课是研究如何合理而有效地获得数据资料的方法。讨论如何合理安排实验、取得数据、然后进行综合的科学分析,从而达到尽快获得最优方案的目的,即实验的最优设计。实验设计方法是数据统计学的应用方法之一。一般的数据统计方法主要是对已获得的数据资料尽可能精确的判断。如果试验安排得好且分析得当,就能以较少的试验次数、较短的试验时间、较低的费用,得到较满意的实验结果;反之,如果试验安排的不得当,分析不得当,则试验次数增加,试验时间延长,浪费人力、物力、财力,难以达到预期的结果,甚至导致实验失败。通过这门课程的学习,是我对误差理论、方差分析、正交试验设计与应用、回归分析都有了一个很好的理解,并且将它们做了笔记。 比如方差分析的理解:方差分析市实验设计中的重要分析方法,应用非常广泛,它是将不同因素,不同水平组合下的实验数据作为不同总体的样本数据,进行统计分析,找出对实验结果影响大的因素及其影响程度。对于单因素试验的数据进行统计分析,找出对试验指标影响大的因素及其影响程度。对于单因素试验的方差分析,主要步骤如下:1,建立线性统计模型,提出需要检验的假设。2,总离差平方和的分析与计算。3,统计分析,列出方差分析表。对于双因素试验的方差分析,分为两种,一种无交互作用的方差分析,另一种有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但是总体步骤都和单因素试验的方差分析一样。 我们又通过正交试验设计合理安排实验,他是尽快有效的获得最优方案的一种设计方法。了解了他是避免做全面试验,再多因素多水平实验中选择最有代表性的搭配。否则花费时间过长,人力,物力,财力消耗太多。尤其是一些长周期、高费用或破坏性试验,更不要

数据处理的基本方法

第六节数据处理的基本方法 前面我们已经讨论了测量与误差的基本概念,测量结果的最佳值、误差和不确定度的计算。然而,我们进行实验的最终目的是为了通过数据的获得和处理,从中揭示出有关物理量的关系,或找出事物的内在规律性,或验证某种理论的正确性,或为以后的实验准备依据。因而,需要对所获得的数据进行正确的处理,数据处理贯穿于从获得原始数据到得出结论的整个实验过程。包括数据记录、整理、计算、作图、分析等方面涉及数据运算的处理方法。常用的数据处理方法有:列表法、图示法、图解法、逐差法和最小二乘线性拟合法等,下面分别予以简单讨论。 列表法是将实验所获得的数据用表格的形式进行排列的数据处理方法。列表法的作用有两种:一是记录实验数据,二是能显示出物理量间的对应关系。其优点是,能对大量的杂乱无章的数据进行归纳整理,使之既有条不紊,又简明醒目;既有助于表现物理量之间的关系,又便于及时地检查和发现实验数据是否合理,减少或避免测量错误;同时,也为作图法等处理数据奠定了基础。 用列表的方法记录和处理数据是一种良好的科学工作习惯,要设 计出一个栏目清楚、行列分明的表格,也需要在实验中不断训练,逐步掌握、熟练,并形成习惯。 一般来讲,在用列表法处理数据时,应遵从如下原则:

(1) 栏目条理清楚,简单明了,便于显示有关物理量的关系。 (2) 在栏目中,应给出有关物理量的符号,并标明单位(一般不重复写在每个数据的后面)。 (3) 填入表中的数字应是有效数字。 (4) 必要时需要加以注释说明。 例如,用螺旋测微计测量钢球直径的实验数据列表处理如下。 用螺旋测微计测量钢球直径的数据记录表 从表中,可计算出 D i D = n = 5.9967 ( mm)

实验设计与数据处理试题库

一、名词解释:(20分) 1. 准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2. 重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部 就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4?总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5. 试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1. 资料常见的特征数有:(3空)算术平均数方差变异系数 2. 划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3. 方差分析的三个基本假定是(3空)可加性正态性同质性 4. 要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5. 减小难控误差的原则是(3空)设置重复随机排列局部控制 6. 在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式 阶梯式 7. 正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8. 在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2. 统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3. 变异系数的计算方法是(B) 4. 样本平均数分布的的方差分布等于(A) 5. t检验法最多可检验(C)个平均数间的差异显著性。 6. 对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7. 进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8. 进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9. 进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10. 自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1. 回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次 效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2. 一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3. 田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争 差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1. 研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy =60, l yy=300,r=0.6。根

实验设计与数据处理

《实验设计与数据处理》大作业 班级:环境17研 姓名: 学号: 1、 用Excel (或Origin )做出下表数据带数据点的折线散点图 余浊(N T U ) 加量药(mL) 总氮T N (m g /L ) 加量药(mL ) 图1 加药量与剩余浊度变化关系图 图2 加药量与总氮TN 变化关系图 总磷T P (m g /L ) 加量药(mL) C O D C r (m g /L ) 加量药(mL) 图3 加药量与总磷TN 变化关系图 图4 加药量与COD Cr 变化关系图 去除率(%) 加药量(mL)

图5 加药量与各指标去除率变化关系图

2、对离心泵性能进行测试的实验中,得到流量Q v 、压头H 和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式(要求作双Y 轴图)。 η H (m ) Q v (m 3 /h) 图6 离心泵特性曲线 扬程曲线方程为:H=效率曲线方程为:η=+、列出一元线性回归方程,求出相关系数,并绘制出工作曲线图。 (1) 表1 相关系数的计算 Y 吸光度(A ) X X-3B 浓度(mg/L ) i x x - i y y - l xy l xx l yy R 10 -30 2800 20 -20 30 -10 40 ()() i i x x y y l R --= = ∑

50 10 60 20 70 30 平均值 40 吸光度 X-3B浓度(mg/L) 图7 水中染料活性艳红(X-3B )工作曲线 一元线性回归方程为:y=+ 相关系数为:R 2= (2) 代入数据可知: 样品一:x=样品二:x=、试找出某伴生金属c 与含量距离x 之间的关系(要求有分析过程、计算表格以及回归图形)。 表2 某伴生金属c 与含量距离x 之间的关系分析计算表 序号 x c lgx 1/x 1/c 1 2 2 3 3 4 4 5 5 7 6 8 7 10 1

试验设计与数据处理复习提纲

第0章 1 试验数据处理的主要作用 试验设计合理的规划试验,以通过较高效的试验方案获得更具代表性的数据 数据处理对试验数据进行分析研究,从而获得研究对象的变化规律,为生产和科研提供指导。 数据处理的具体作用: 第一章 2 真值的概念和特点 真值 某时刻和某一状态下,某量的可观值或实际值。 真值很多是位置的,但部分又是已知的。 3 平均值,尤其是算数平均值,加权平均值的概念。 平均值 科学实验中,经常将多次试验值得平均值作为真值的近似值。 (1) 算数平均值(arithmetic mean ) 同样试验条件下,如多次试验值服从正态分布,则算数平均值是这组等精度试验值中最佳或最可信赖的值。 (2) 加权平均值(weighted mean ) 若一组试验数据的精度或可靠度不一致,为了突出可靠性高的数值,可以采用加权平均值 权值的确定方法:①取试验值出现的频率ni/n ②若xi 为每组试验值的平均值,则权值为每组试验的次数 ③根据权与绝对误差的平方成反比确定 ④根据试验者的经验确定 4 误差的概念,包括绝对误差与相对误差。 判断影响结果的因素主次 优化试验或生产方案 确定试验因素与试验结果之间的近似函数关系 判断试验数据的可靠性 预测试验结果 控制试验结果 n n x i n ===121n x x x x i n ==+++= 121

5 误差的类型及产生的原因。 随机误差 系统误差 过失误差 6 精密度、正确度和准确度的概念。 1精密度定义:一定条件下多次试验值得彼此符合程度或一致程度。 正确度定义:大量试验结果的算数平均值与真值的一致程度。 准确度定义:反映系统误差与随机误差的综合 正确度:大量试验结果的算数平均值与真值的一致程度。 反映试验系统随机误差的大小 准确度:反映系统误差与随机误差的综合 7随机误差的检验法F 检验法。 1)检验两组实验数据精密度是否一致—双侧检验 (2)检验两组实验数据精密度优劣—单侧检验 a. 左侧检验 ① 取统计量为: ②给定显著性水平α ③查表确定临界值: ④ 判断:若 且 结论:S12相对S12两无显著减小。 b. 右侧检验 8 系统误差的t 检验法。 2122S F S = ① 取统计量为: ②给定显著性水平α ③查表确定临界值: 1212 (1,1) F n n α - --122(1,1) F n n α--④ 判断:若 121212 2 (1,1)F (1,1) F n n F n n αα- --<<--结论:则两组数据方差无显著差异。 2 122 S F S =112(1,1)F n n α---F 1<12F (1 ,1)F n n α<--12(1,1)F n n α--12F (1 ,1)F n n α<--

实验设计与数据处理第三次课后作业答案.docx

现代实验方法及数据处理 作业三 1、用乙醇水溶液分离某种废弃农作物中的木质素,考察了三个因素(溶剂浓度、温度和时间)对木质素得率的影响,因素水平如下表所示。将因素 A,B,C 依次安排在正交表 L9(34)的 1,2,3 列,不考虑因素间的交互作用。 9 个试验结果 y(得 率/%)依次为: 5.3、 5.0、 4.9、 5.4、 6.4、 3.7、 3.9、 3.3、 2.4。试用直观分析法确定因素主次和优方案,并画出趋势图。 水平(A)溶剂浓度 /%(B)反应温度 / ℃(C)保温时间 /h 1601403 2801602 31001801 解:下表展示了分析过程及结果: 试验号 因素 得率A B C 11111 5.3 212225 31333 4.9 42123 5.4 52231 6.4 62312 3.7 73132 3.9 83213 3.3 93321 2.4 K115.214.612.314.1 K215.514.712.812.6 K39.61115.213.6 k1 5.07 4.87 4.10 4.70 k2 5.17 4.90 4.27 4.20 k3 3.20 3.67 5.07 4.53优水平A2B2C3 极差 R 1.97 1.230.970.50 主次顺序A、B、 C 因素主次为: A、 B、C,最优方案为:A2B2C3 即溶剂浓度取 80%,反应温度取 160℃,保温时间取1h。

而各因素的趋势图如下所示: 2.采用直接还原法制备超细铜粉的研究中,需要考察的影响因素有反应温度、 cu2+与氨水质量比和 CuSO4溶液浓度,并通过初步试验确定的因素水平如下表: 水平(A)反应温度 / ℃ 2+ (C)CuSO4溶液浓度 /(g/mL) (B)Cu 与氨水质量比 1701:0.10.125 2801:0.50.5 3901:1.5 1.0 试验指标有两个:( 1)转化率,越高越好;(2)铜粉松密度,越小越好。用正交表 L9(34 )安排试验,将 3 个因素依次放在 1,2,3 列上,不考虑因素间的交互作用, 9 次试验结果依次如下: 转化率 /%: 40.26,40.46, 61.79,60.15,73.97, 91.31,73.52, 87.19,97.26; 松密度 /(g/mL): 2.008,0.693,1.769,1.269,1.613,2.775,1.542,1.115,1.824。试用综合平衡法对结果进行分析,找出最好的试验方案。

大学物理实验数据处理基本方法

实验数据处理基本方法 实验必须采集大量数据,数据处理是指从获得数据开始到得出最后结 论的整个加工过程,它包括数据记录、整理、计算与分析等,从而寻找出 测量对象的内在规律,正确地给出实验结果。因此,数据处理是实验工作 不可缺少的一部分。数据处理涉及的内容很多,这里只介绍常用的四种方 法。 1列表法 对一个物理量进行多次测量,或者测量几个量之间的函数关系,往往 借助于列表法把实验数据列成表格。其优点是,使大量数据表达清晰醒目, 条理化,易于检查数据和发现问题,避免差错,同时有助于反映出物理量 之间的对应关系。所以,设计一个简明醒目、合理美观的数据表格,是每 一个同学都要掌握的基本技能。 列表没有统一的格式,但所设计的表格要能充分反映上述优点,应注意以下几点:1.各栏目均应注明所记录的物理量的名称(符号 )和单位; 2.栏目的顺序应充分注意数据间的联系和计算顺序,力求简明、齐全、有条理; 3.表中的原始测量数据应正确反映有效数字,数据不应随便涂改,确实要修改数据时, 应将原来数据画条杠以备随时查验; 4.对于函数关系的数据表格,应按自变量由小到大或由大到小的顺序排列,以便于判 断和处理。 2图解法 图线能够明显地表示出实验数据间的关系,并且通过它可以找出两个 量之间的数学关系,因此图解法是实验数据处理的重要方法之一。图解法 处理数据,首先要画出合乎规范的图线,其要点如下: 1.选择图纸作图纸有直角坐标纸 ( 即毫米方格纸 ) 、对数坐标纸和 极坐标纸等,根据 作图需要选择。在物理实验中比较常用的是毫米方格纸,其规格多为17 25 cm 。 2.曲线改直由于直线最易描绘 , 且直线方程的两个参数 ( 斜率和截距 ) 也较易算得。所以对于两个变量之间的函数关系是非线性的情形,在用图解法时 应尽可能通过变量代换 将非线性的函数曲线转变为线性函数的直线。下面为几种常用的变换方法。 ( 1) xy c ( c 为常数 ) 。 令 z 1,则 y cz,即 y 与 z 为线性关系。 x ( 2) x c y ( c 为常x2,y 1 z ,即 y 与为线性关系。

试验设计与数据处理

试验设计与数据处理方法总述及总结 王亚丽 (数学与信息科学学院 08统计1班 081120132) 摘要:实验设计与数据处理是一门非常有用的学科,是研究如何经济合理安排 试验可以解决社会中存在的生产问题等,对现实生产有很重要的指导意义。因此本文根据试验设计与数据处理进行了总述与总结,以期达到学习、理解、掌握的以及灵活运用的目的。 1 试验设计与数据处理基本知识总述 1.1试验设计与数据处理的基本思想 试验设计与数据处理是数理统计学中的一个重要分支。它是以概率论、数理统计及线性代数为理论基础,结合一定的专业知识和实践经验,研究如何经济、合理地安排实验方案以及系统、科学地分析处理试验结果的一项科学技术,从而解决了长期以来在试验领域中,传统的试验方法对于多因素试验往往只能被动地处理试验数据,而对试验方案的设计及试验过程的控制显得无能为力这一问题。 1.2试验设计与数据处理的作用 (1)有助于研究者掌握试验因素对试验考察指标影响的规律性,即各因素的水平改变时指标的变化情况。 (2)有助于分清试验因素对试验考察指标影响的大小顺序,找出主要因素。(3)有助于反映试验因素之间的相互影响情况,即因素间是否存在交互作用。(4)能正确估计和有效控制试验误差,提高试验的精度。 (5)能较为迅速地优选出最佳工艺条件(或称最优方案),并能预估或控制一定条件下的试验指标值及其波动范围。 (6)根据试验因素对试验考察指标影响规律的分析,可以深入揭示事物内在规律,明确进一步试验研究的方向。

1.3试验设计与数据处理应遵循的原则 (1)重复原则:重可复试验是减少和估计随机误差的的基本手段。 (2)随机化原则:随机化原则可有效排除非试验因素的干扰,从而可正确、无偏地估计试验误差,并可保证试验数据的独立性和随机性。 (3)局部控制原则:局部控制是指在试验时采取一定的技术措施方法减少非试验因素对试验结果的影响。用图形表示如下: 2试验设计与数据处理方法总述和总结 2.1方差分析 (1)概念:方差分析是用来检验两个或两个以上样本的平均值差异的显著程度。并由此判断样本究竟是否抽自具有同一均值的总体。 (2)优点:方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。 (3)缺点:对所检验的假设会发生错判的情况,比如第一类错误或第二类错误的发生。 (4)基本原理:方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的第一个估计值;另一方面再考虑在同一水平下不同试验数据对于这一水平的均值的方差,由此计算出对由所有试验数据所组成的全部数据的总体方差的第 二个估计值。比较上述两个估计值,如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设;否则,说明因素的不同水平下的均值间的差异比较大。

实验设计与数据处理试题库

一、名词解释:(20分) 1.准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2.重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4.总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5.试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1.资料常见的特征数有:(3空)算术平均数方差变异系数 2.划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3.方差分析的三个基本假定是(3空)可加性正态性同质性 4.要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5.减小难控误差的原则是(3空)设置重复随机排列局部控制 6.在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式阶梯式 7.正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8.在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2.统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3.变异系数的计算方法是(B) 4.样本平均数分布的的方差分布等于(A) 5.t检验法最多可检验(C)个平均数间的差异显著性。 6.对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7.进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8.进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9.进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10.自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1.回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2.一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3.田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1.研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy=60, l yy=300,r=0.6。根据所得数据建立直线回归方程。(5分)a=2 b=1.8 y=2+1.8 x 2.完成下列方差分析表,计算出用LSR法进行多重比较时各类数据填下表:

实验数据处理的几种方法

实验数据处理的几种方法 物理实验中测量得到的许多数据需要处理后才能表示测量的最终结果。对实验数据进行记录、整理、计算、分析、拟合等,从中获得实验结果和寻找物理量变化规律或经验公式的过程就是数据处理。它是实验方法的一个重要组成部分,是实验课的基本训练内容。本章主要介绍列表法、作图法、图解法、逐差法和最小二乘法。 1.4.1 列表法 列表法就是将一组实验数据和计算的中间数据依据一定的形式和顺序列成表格。列表法可以简单明确地表示出物理量之间的对应关系,便于分析和发现资料的规律性,也有助于检查和发现实验中的问题,这就是列表法的优点。设计记录表格时要做到:(1)表格设计要合理,以利于记录、检查、运算和分析。 (2)表格中涉及的各物理量,其符号、单位及量值的数量级均要表示清楚。但不要把单位写在数字后。 (3)表中数据要正确反映测量结果的有效数字和不确定度。列入表中的除原始数据外,计算过程中的一些中间结果和最后结果也可以列入表中。 (4)表格要加上必要的说明。实验室所给的数据或查得的单项数据应列在表格的上部,说明写在表格的下部。 1.4.2 作图法 作图法是在坐标纸上用图线表示物理量之间的关系,揭示物理量之间的联系。作图法既有简明、形象、直观、便于比较研究实验结果等优点,它是一种最常用的数据处理方法。 作图法的基本规则是: (1)根据函数关系选择适当的坐标纸(如直角坐标纸,单对数坐标纸,双对数坐标纸,极坐标纸等)和比例,画出坐标轴,标明物理量符号、单位和刻度值,并写明测试条件。 (2)坐标的原点不一定是变量的零点,可根据测试范围加以选择。,坐标分格最好使最低数字的一个单位可靠数与坐标最小分度相当。纵横坐标比例要恰当,以使图线居中。 (3)描点和连线。根据测量数据,用直尺和笔尖使其函数对应的实验点准确地落在相应的位置。一张图纸上画上几条实验曲线时,每条图线应用不同的标记如“+”、“×”、“·”、“Δ”等符号标出,以免混淆。连线时,要顾及到数据点,使曲线呈光滑曲线(含直线),并使数据点均匀分布在曲线(直线)的两侧,且尽量贴近曲线。个别偏离过大的点要重新审核,属过失误差的应剔去。 (4)标明图名,即做好实验图线后,应在图纸下方或空白的明显位置处,写上图的名称、作者和作图日期,有时还要附上简单的说明,如实验条件等,使读者一目了然。作图时,一般将纵轴代表的物理量写在前面,横轴代表的物理量写在后面,中间用“~”

数据处理与实验设计小论文

上海大学2014~2015学年秋季学期研究生课程考试课程名称:数据处理与实验设计课程编号:11S009003论文题目:正交实验在锂离子电极材料制备中的应用 研究生姓名:李艳峰学号:14722191 论文评语: 成绩:任课教师: 评阅日期:

正交实验在锂离子电极材料制备中的应用 李艳峰 (上海大学环境与化学工程学院,上海200444) 摘要:锂源、反应温度、反应时间和锂钛摩尔比是影响锂离子电极负极材料Li4Ti5O12制备的重要因素,本文利用正交实验L9 (34)的方法对液相法制备Li4Ti5O12的各种影响因素进行进一步优化,从而得到最优水平组合,并对各种影响因素进行权重分析。最后,利用正交实验确定了液相法制备Li4Ti5O12的最佳工艺:烧结温度为750℃,烧结时间为8h,LiOH·H2O 为锂源,原料中锂钛摩尔比为0.85。 关键词:正交实验设计;液相法;影响因素; 中图分类号:O242.1文献标识码:A The application of orthogonal experimental design on liquid method in the production of Lithium-ion electrode materials Yanfeng Li (School of Environmental and Chemical Engineering, Shanghai University, Shanghai 200444, China) Abstract:lithium source, reaction temperature, reaction time and lithium titanium molar ratio are important factors for the preparation of Li4Ti5O12 conditions of liquid method. Based on the single factor experiment, this study use L9 (34) orthogonal experiments to optimized the removal of the preparation of Li4Ti5O12 of liquid method. The optimal technological parameters of solution method determined by the orthogonal experiment were as follows: sintering temperature was 750℃, sintering time was 8 h, the lithium resource was LiOH·H2O and the mole ration of Li to Ti was 0.85. Key words: Orthogonal experimental design;Liquid method; Factors;

实验设计与数据处理分析大作业(正交试验)

枣果皮中酚类物质提取工艺优化及抗氧化活性分析 1.实验数据背景叙述。 一:实验关于枣果皮中酚类物质提取工艺优化及抗氧化活性分析。酚类物质是植物体内重要的次生代谢产物,主要通过莽草酸和丙二酸途径合成,广泛分布于植物界。许多的酚类物质具有营养保健功效。现代流行病学研究证明,经常食用富含酚类物质的果蔬能够预防由活性氧导致的相关疾病如癌症、糖尿病、肥胖症等的发生。 二:实验问题:为提高枣果皮中的酚类物质的提取效率,该文以马牙枣为试验材料,对枣果皮中酚类物质提取条件进行了优化。同时分析枣果皮提取物中酚类物质的抗氧化活性。 三:实验目的:要通过实验得到枣果皮中酚类物质提取的最优条件。并对提取物中酚类物质清除DPPH,2,2'-连氮基双(3-乙基苯并噻唑啉)-6-磺酸(ABTS)自由基及铁还原能力进行探讨,同时与合成抗氧化剂2,6-二叔丁基对甲酚(BHT)的抗氧化能力进行比较。 2. 实验数据处理方法选择及论述。 一:单因素试验(获得数据,将数据输入excel中,使用excel绘制图表,以便直观感受影响因素对实验的影响趋势。)

以冻干枣果皮为材料,分别以甲醇浓度、提取温度、提取料液比和提取时 间作为因素,分析不同的提取条件对枣果皮中酚类物质提取效果的影响,检测 指标为提取物中总酚含量。 二:正交试验(设计正交试验以便获得到枣果皮中酚类物质提取的最优条件, 用excel进行结果直观分析,见表2。) 以冻干枣果皮为材料,以提取溶剂浓度(A)、提取温度(B)、料液比(C)、和浸提时间(D)作4 因素3水平的L9(34)正交设计(见表1),检测指标为 提取物中总酚含量。 表1 枣果皮中酚类物质提取因素水平表 三:统计分析 所有提取试验均重复3 次,每次提取液的测定均重复3 次。结果表示为平 均值±标准偏差。应用excel软件对所有数据进行方差分析。 3. 实验数据的处理的过程叙述。 一:在单因素试验中,将每次试验结果输入excel中,选中表格,点击“插入”柱形图。

大学物理实验数据处理方法总结

有效数字 1、有效数字不同的数相加减时,以参加运算各量中有效数字最末一位位数最高的为准,最后结果与它对其,余下的尾数按舍入规则处理。 2、乘除法以参与运算的数值中有效位数最少的那个数为准,但当结果的第1位数较小,比如1、2、3时可以多保留一位(较小:结果的第一位数小于 有效数字最少的结果第一位数)! 例如:n=tg56° θ=56° d θ=1° θθθθθ2cos d d d dtg dn == 为保留) (,带入848.156n 15605.018056cos 1cos 22=?=∴?=??=≈?=?= ?tg n θθπθθ 3、可以数字只出现在最末一位:对函数运算以不损失有效数字为准。 例如:20*lg63.4 可疑最小位变化0.1 Y=20lgx 01.04 .631.010ln 2010ln 20ln 10ln 20≈===x dx dx dx x d dy 04.364.63lg 20=∴ 4、原始数据记录、测量结果最后表示,严格按有效数字规定处理。(中间过程、结果多算几次) 5、4舍5入6凑偶 6、不估计不确定度时,有效数字按相应运算法则取位;计算不确定度时以不确定度的处理结果为准。 真值和误差 1、 误差=测量值-真值 ΔN=N-A 2、 误差既有大小、方向与政府。 3、 通常真值和误差都是未知的。 4、 相对约定真值,误差可以求出。 5、 用相对误差比较测量结果的准确度。 6、 ΔN/A ≈ΔN/N 7、 系统误差、随机误差、粗大误差 8、 随机误差:统计意义下的分布规律。粗大误差:测量错误 9、 系统误差和随机误差在一定条件下相互转化。 不确定度 1、P (x )是概率密度函数 dx P dx x x P p )x (之间的概率是测量结果落在+当x 取遍所有可能的概率值为1. 2、正态分布且消除了系统误差,概率最大的位置是真值A 3、曲线“胖”精密度低“瘦”精密度高。 4、标准误差:无限次测量?∞∞-=-2 )()(dx X P A X x )(σ 有限次测量且真值不知道标准偏

试验设计与数据处理课程论文

课 程 论 文 课程名称试验设计与数据处理 专业2012级网络工程 学生姓名孙贵凡 学号201210420136 指导教师潘声旺职称副教授

成绩 科学研究与数据处理 学院信息科学与技术学院专业网络工程姓名孙贵凡学号:201210420136 摘要:《实验设计与数据处理》这门课程列举典型实例介绍了一些常用的实验设计及实验数据处理方法在科学研究和工业生产中的实际应用,重点介绍了多因素优化实验设计——正交设计、回归分析方法以对目标函数进行模型化处理。其适于工艺、工程类本科生使用,尤其适用于化学化工、矿物加工、医学和环境学等学科的本科生使用。其对行实验设计可提供很大的帮助,也可供广大分析化学工作者应用。关键字:优化实验设计; 标函数进行模型化处理; 正交设计; 回归分析方法 1 引言 实验是一切自然科学的基础,科学界中大多数公式定理是由试验反复验证而推导出来的。只有经得起试验验证的定理规律才具有普遍实用性。而科学的试验设计是利用自己已有的专业学科知识,以大量的实践经验为基础而得出的既能减少试验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法,就必然涉及到数据处理,也只有对试验得出的数据做出科学合理的选择,才能使实验结果更具说服力。实验设计与数据处理在水处理中发挥着不可估量的作用,通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使水处理原理,内在规律性被很好的发现,从而更好的应用于生产实践。 2 材料与方法 2.1 供试材料 1. 论文所围绕的目标和假设 研究的目标就是实验的目的,我们设计了这个实验是想来做什么以及想得到什么样的结论。要正确的识别问题和陈述问题,这些需要专业知识和大量的阅读文献综述等方法来获得我们所要提出的问题。需要对某一个具体的问题,并且对这个具体的问题提出假设。如水处理中混凝剂的最佳投加量,混凝剂的最佳投加量有一个适宜的PH值范围。

实验设计与数据处理

试验设计与数据处理 学院 班级 学号 学生姓名 指导老师

第一章 4、 相对误差18.20.1%0.0182x mg mg ?=?= 故100g 中维生素C 的质量范围为:±。 5、1)、压力表的精度为级,量程为, 则 max 0.2 1.5%0.00333 0.375 8 R x MPa KPa x E x ?=?==?=== 2)、1mm 的汞柱代表的大气压为, 所以 max 2 0.1330.133 1.662510 8 R x KPa x E x -?=?===? 3)、1mm 水柱代表的大气压为gh ρ,其中2 9.8/g m s = 则: 3max 33 9.8109.810 1.22510 8 R x KPa x E x ---?=???===? 6. 样本测定值 算数平均值 几何平均值 调和平均值 标准差s 标准差σ 样本方差S 2 总体方差σ2 算术平均误差△ 极差R 7、S ?2=,S ?2= F =S ?2/ S ?2== 而F ()=,= 所以F ()< F < 两个人测量值没有显著性差异,即两个人的测量方法的精密度没有显著性差异。 |||69.947|7.747 6.06 p p d x =-=>

分析人员A分析人员B 8样本方差1 8样本方差2 10Fa值 104F值 6 68 4705 6 6 88 8.旧工艺新工艺 %% %% %% %% %% %% %% %% %% % % % % t-检验: 双样本异方差假设 变量 1变量 2 平均 方差 观测值139假设平均差0 df8 t Stat-38. P(T<=t) 单尾0 t 单尾临界 P(T<=t) 双尾0 t 双尾临界 F-检验双样本方差分析

大学物理实验数据处理作业答案

路漫漫其修远兮,吾将上下而求索 - 百度文库 五、用分度值为0.01mm的一级千分尺测得钢球的直径为15.561mm、15.562mm、15.560mm、15.563mm、15.564mm 、15.560mm ,千分尺的零点读数为0.011mm ,试求钢球体积的测量结果。 解:数据列表 1 2 3 4 5 6 平均值 标准差 d'(mm) 15.561 15.562 15.560 15.563 15.564 15.560 15.562 0.00163 d(mm) 15.550 15.551 15.549 15.552 15.553 15.549 15.551 0.00163 肖维涅系数C6=1.73,0016.073.16?=?d S C 30028.0= d ’数据有效范围:下限:559.150028.0562.15=- 上限:565.150028.0562.15=+ 数据全部有效 mm d 551.15= mm S d u d a 0007.06/)(== 3/004.0)(=d u b =0.0023 220023.00007.0)(+=d u =0.0024mm 最终结果 330.196961 mm d V ==π 329.0)(21 )()(mm d u d d u d V V u ==??=π ()% 046.0%100) ()() 683.0(9.00.1969)(3=?==±=±=V V u V E P mm V u V V 六、利用单摆测重力加速度g,当摆角很小时有2 24T L g π= ,式中L 为摆长,T 为周期,它们的测量 结果用不确定度分别表示为:L =(97.69±0.02)cm (P=0.683);T =(1.9842±0.0002)s (P=0.683)试求重力加速度g 的测量结果。 解: 22 4T L g π==979.58m/s 2 T L g ln 2ln )4ln(ln 2-+=π, T dT L dL g dg 2-=

最新实验数据与处理大作业题目及答案

1、用Excel作出下表数据带数据点的折线散点图: (1)分别作出加药量和余浊、总氮T-N、总磷T-P、COD的变化关系图(共四张图,要求它们的格式大小一致,并以两张图并列的形式排版到Word中,注意调整图形的大小); (2)在一张图中作出加药量和浊度去除率、总氮T-N去除率、总磷T-P去除率、COD 去除率的变化关系折线散点图。

2、对离心泵性能进行测试的实验中,得到流量Q v 、压头H和效率η的数据如表所示,绘制离心泵特性曲线。将扬程曲线和效率曲线均拟合成多项式。(要求作双Y轴图) 流量Qv、压头H和效率η的关系数据 序号 1 2 3 4 5 6 Q v(m3/h) H/m 0.0 15.00 0.4 14.84 0.8 14.56 1.2 14.33 1.6 13.96 2.0 13.65 η0.0 0.085 0.156 0.224 0.277 0.333 序号7 8 9 10 11 12

Q v(m3/h) H/m η 2.4 13.28 0.385 2.8 12.81 0.416 3.2 12.45 0.446 3.6 11.98 0.468 4.0 11.30 0.469 4.4 10.53 0.431 3、用荧光法测定阿司匹林中的水杨酸(SA),测得的工作曲线和样品溶液的数据如下表: (1)列出一元线性回归方程,求出相关系数,并给出回归方程的精度; (2)求出未知液(样品)的水杨酸(SA)浓度。 (1) C(SA)/μg.mL-10.50 1.00 1.50 2.00 3.00 1.75 1.80 F(荧光强度) 10.9 22.3 33.1 43.5 65.4 38.2 39.2

相关主题