搜档网
当前位置:搜档网 › 应用数理统计试卷2010-12

应用数理统计试卷2010-12

应用数理统计试卷2010-12
应用数理统计试卷2010-12

《应用数理统计》试卷

注意:将完成的试卷用本人邮箱以附件发送到xuehr@https://www.sodocs.net/doc/5c3085237.html,,邮件标题注名应用数理统计答卷+姓名。并在元月七日之前提交,过时不再受理。

班级:_____________姓名:_____赵立慧_______ 学号:________2010210009___

一.有四个品牌的彩电在五个地区销售,为分析彩电的品牌(因素A)和销售地区(因素B)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据,见下表。试分析品牌和销售地区对彩电的销售量是否有显著影响?

回答如下问题:

(1)品牌和销售地区这两个因素总得来说对彩电的销售量是否有显著影响(即方差分析模型的显著性)?显著水平是多少?

答:品牌和销售地区这两个因素总得来说对彩电的销售量是有显著影响的,显著水平是0.0006.

(2)品牌和销售地区分别对销售量影响作用是否显著?显著水平是多少?

答:品牌对彩电的销售量有显著影响,显著水平是小于0.001.而销售地区对彩电的销售量在0.1水平下都不显著。

(3)对在0.1水平下显著的因素求均值及组间差异显著性检验(Duncan检验法)。答:在0.1水平下,只有品牌因素有显著性。4个品牌的均值分别为344.2,,347.8,337.0,284.8。第四个品牌和其他三个品牌在0.05水平下有显著差异。

(4)写出完整的sas程序

data fanfcha;

do a = 1to4;

do b = 1to5;

input y @;output;

end;

end;

cards;

365 350 343 340 323

345 368 363 330 333

358 323 353 343 308

288 280 298 260 298

;

proc anova;

class a b;

model y = a b;

means a b/duncan;

run;

二、在林木生物量生产率研究中,为了了解林地施肥量(x1,kg)、灌水量(x2,

m)与生物量(Y,kg)的关系,在同一林区共进行了20次试验,观察值见103

下表,试建立Y关于x1,x2的线性回归方程。

回答如下问题:

(1)回归模型是否显著,显著水平是多少?复相关系数是多少?

答:回归模型是显著的,显著水平是0.0001,复相关系数是0.9659

(2)回归系数的估计值是多少?显著性如何?

答:回归系数的估计值分别是-4.94048,1.53952,-0.94385。常数项不显著,X1和X2的估计值在0.001下显著。

(3)写出回归方程的表达式。

答:Y=-4.94048+1.53952*x1-0.94385*x2

(4)利用残差(实测值与预测值之差)、95%置信取间的上下限讨论预测预报效果及预报的稳定性。

Dependent Predicted Std Error

Obs Variable Value Mean Predict 95% CL Predict Residual 1 50.0000 50.8219 1.1444 44.7311 56.9126 -0.8219

2 51.0000 52.1600 0.9892 46.1915 58.1285 -1.1600

3 52.0000 50.574

4 1.2382 44.402

5 56.7462 1.4256

4 54.0000 57.5211 0.923

5 51.599

6 63.4425 -3.5211

5 53.0000 52.4075 1.0108 46.4229 58.3921 0.5925

6 60.0000 56.2752 1.7095 49.6211 62.9292 3.7248

7 59.0000 57.2736 0.8577 51.3963 63.1508 1.7264

8 65.0000 66.8127 1.1528 60.7149 72.9105 -1.8127

9 67.0000 68.5452 0.6473 62.7891 74.3013 -1.5452

10 70.0000 70.5335 0.6431 64.7795 76.2875 -0.5335

11 70.0000 70.3867 0.9447 64.4504 76.3231 -0.3867

12 73.0000 74.1076 0.6295 68.3603 79.8548 -1.1076

13 74.0000 73.7132 0.9112 67.8002 79.6263 0.2868

14 78.0000 80.0643 0.8697 74.1792 85.9494 -2.0643

15 82.0000 84.3346 0.9811 78.3721 90.2972 -2.3346

16 80.0000 79.1204 0.8966 73.2174 85.0235 0.8796

17 87.0000 87.9632 1.1364 81.8791 94.0473 -0.9632

18 84.0000 81.5576 0.9223 75.6370 87.4783 2.4424

19 88.0000 90.2913 1.3764 83.9906 96.5921 -2.2913

20 92.0000 84.5360 0.9376 78.6047 90.4673 7.4640 答:参差的精度最小的差别在0.2868,最大的差别是7.4640.说明预测预报效果一般。95%置信取间的上下限,仅有少量实测值不属于置信区间之内。基本符合预报报告要求,稳定性还可以。

(5)对本问题再求出Y关于X1、X2的二次多项式回归方程,并与线性回归方程比较,说明优缺点。

data my2;

input x1 x2 y;

cards;

54 29 50

61 39 51

52 26 52

70 48 54

63 42 53

79 64 60

68 45 59

65 30 65

79 51 67

76 44 70

71 36 70

82 50 73

75 39 74

92 60 78

96 62 82

92 61 80

91 50 87

85 47 84

106 72 88

90 52 92

;

proc rsREG;

model y=x1 x2;

run;

Y=13.828062+0.101058*x1+0.543497*x2+0.024467*x1*x1-0.0481 05*x1*x2+0.022633*x2*x2 其中就有x1*x2显著。复相关系数是0.9734.比线性的复相关系数大。说明二次回归效果要好。

(6)写出相应的SAS程序。

data my2;

input x1 x2 y;

cards;

54 29 50

61 39 51

52 26 52

70 48 54

63 42 53

79 64 60

68 45 59

65 30 65

79 51 67

76 44 70

71 36 70

82 50 73

75 39 74

92 60 78

96 62 82

92 61 80

91 50 87

85 47 84

106 72 88

90 52 92

;

proc REG;

model y=x1 x2/p cli;

run;

三.对全国29个省市地区经济发展基本情况的八项指标作主成分分析,原始数

据如下表。

回答如下问题:

(1)写出相关系数矩阵R2。并分析变量之间的相关性。

答: Correlation Matrix

x1 x2 x3 x4 x5 x6 x7 x8

x1 1.0000 0.2668 0.9506 0.1906 0.6172 -.2726 -.2636 0.8737 x2 0.2668 1.0000 0.4261 0.7181 -.1510 -.2351 -.5927 0.3631 x3 0.9506 0.4261 1.0000 0.3996 0.4306 -.2805 -.3591 0.7919 x4 0.1906 0.7181 0.3996 1.0000 -.3556 -.1350 -.5392 0.1044 x5 0.6172 -.1510 0.4306 -.3556 1.0000 -.2532 0.0217 0.6586 x6 -.2726 -.2351 -.2805 -.1350 -.2532 1.0000 0.7628 -.1252 x7 -.2636 -.5927 -.3591 -.5392 0.0217 0.7628 1.0000 -.1921 x8 0.8737 0.3631 0.7919 0.1044 0.6586 -.1252 -.1921 1.0000

x1与x2 x3 x4 x5 x8 是正相关,且与x3达到0.9506,说明很接近。X1与x6 x7是负相关。X2与x1 x3 x4 x8 是正相关,且与x4达到0.7181,说明很接近。X2与x5x6 x7是负相关。X3与x2 x1 x4 x5 x8 是正相关,与x6 x7是负相关。X4与x2 x1 x3 x8 是正相关,与x5 x6 x7是负相关。X5与x1 x3 x7 x8 是正相关,与x2 x6 x4是负相关。

(2)写出R2的前三个最大的特征值及相应的特征向量。

Eigenvalues of the Correlation Matrix

Eigenvalue Difference Proportion Cumulative

1 3.75512808 1.55839208 0.4694 0.4694

2 2.19673600 0.98184422 0.2746 0.7440

3 1.21489177 0.81249198 0.1519 0.8958

4 0.40239979 0.18959738 0.0503 0.9461

5 0.21280241 0.07484352 0.026

6 0.9727

6 0.13795890 0.07250109 0.0172 0.9900

7 0.06545781 0.05083257 0.0082 0.9982

8 0.01462524 0.0018 1.0000

Eigenvectors

Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 Prin7 Prin8

x1 0.456650 0.258828 0.109669 -.320297 -.148962 0.030795 0.094541 0.760122 x2 0.313091 -.403601 0.246160 0.643963 -.164751 0.422080 0.215959 0.108926 x3 0.470475 0.108706 0.192322 -.426335 -.167045 0.222744 0.317157 -.608259 x4 0.240591 -.487408 0.333810 -.257934 0.659378 -.044284 -.297965 0.032653 x5 0.250709 0.498125 -.249714 0.333800 0.661311 0.060607 0.267878 -.049723 x6 -.262440 0.169963 0.722755 0.113077 0.058889 -.433349 0.418820 0.020166 x7 -.319734 0.401028 0.396976 -.042079 0.076571 0.664343 -.360818 0.013491 x8 0.424564 0.287908 0.191413 0.329318 -.203276 -.369469 -.614568 -.190376

前三个最大的特征值是 3.7512808 特征向量是

prin1=0.456650*x1+0.313091*x2+0.4704*x3+0.240591*x4+0.250709*x5-0.26244*x6-0.3179734*x7+0.42 4564*x8

剩下的两项自己写吧。

(3)前几个主成分的累积贡献率达85%?写出这几个主成分的贡献率及累积贡献率?并写出这几个主成分的表达式。

答:前三个主成分的累积贡献率达85%,第一个主成分贡献率是0.4694第二个主成分的贡献率是0.2746第三个主成分的贡献率是0.1519 累积贡献率是0.8958

第一主成分的表达式:prin1=0.456650*x1+0.313091*x2+0.4704*x3+0.240591*x4+0.250709*x5-0.26244*x6-0.3179734*x7+0.42 4564*x8

剩下的两项自己写吧。

(4)说明前三个主成分分别代表哪几个变量的信息量?这些主成分各代表的综合信息量是什么?

第一主成分有x1 x3 x8

第二主成分有x2 x4 x5 x7

第三主成分有x6

分别代表什么自己写

(5)求出每个省市的前两个主成分得分值。

需要做因子分析,参照课本215页

(6)利用前两个主成分得分值绘制29个省市的散点图。

Plot of Prin1*Prin2$name. Symbol used is '*'.

Prin1 | | * 广东 | |

4.5 + | | |

| | | |

| | | |

| | | |

| | | |

| | | |

| | | * 江苏 |

| | | |

| | | |

| * 上海 | | |

3.0 + | | |* 山东

| | | |

| | | |

| | | |

| | | |

| | | |

| | | |

|--------------------+-----------------------+-----------------------+-------------- | | * 浙江| |

| | | |

| | | * 辽宁 |

1.5 + | | |

| | | | * 河北

| | | |

| | | |

| | | | * 河南

| * 北京 | |

| * 天津 | | |

| | | * 黑龙江 * 四川

| | * 福建 |* 安徽 |

| | | |

| | | |

0.0 +--------------------+-----------------------+-----------------------+-------------- | | | |

| | | * 湖北 |

| | * 吉林 * 湖南 |

| * 海南 | |

| | | |

| | | |

| | | * 山西 |

| | | * 广西 |

| | | |

| | | * 江西 |

-1.5 + | | |

| | | * 内蒙 |

| | *|新疆 * 陕西 |

| | | |

|--------------------*-西藏------------------+--------*-云南---------+-------------- | | * 宁夏 | * 甘肃 |

| | | |

| | | |

| | | |

| | | * 贵州 |

-3.0 + | | |

---+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-- -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Prin2

(7)利用上述散点图解释说明各省市的经济发展状况。

课本209页自己分析吧。

(8)写出相应的SAS程序。

data my4;

input name$ x1-x8@@;

cards;

±±?? 1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43

ìì?ò 920.11 2720 345.46 6501 342.8 115.2 110.6 582.51

oó±± 2849.52 1258 704.87 4839 2033.3 115.2 115.8 1234.85

é??÷ 1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25

?ú?é 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39

áé?t 2793.37 2397 387.99 4911 1371.1 116.1 114 1840.55

?aá? 1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47

oúáú?- 2014.53 2334 435.73 4145 824.8 116.1 114.3 1240.37

é?o£ 2462.57 5343 996.48 9279 207.4 118.7 113 1642.95

?-?? 5155.25 1926 1434.95 5943 1025.5 115.8 114.3 2026.64

???- 3524.79 2249 1006.39 6619 754.4 116.6 113.5 916.59 °2?? 2003.58 1254 474 4609 908.3 114.8 112.7 824.14

?£?¨ 2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67

?-?÷ 1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84

é??? 5002.34 1527 1229.55 5145 1196.6 117.6 114.2 2207.69

oó?? 3002.74 1034 670.35 4344 1574.4 116.5 114.9 1367.92

ot±± 2391.42 1527 571.68 4685 849 120 116.6 1220.72

ot?? 2195.7 1408 422.61 4797 1011.8 119 115.5 843.83

1??? 5381.72 2699 1639.83 8250 656.5 114 111.6 1396.35

1??÷ 1606.15 1314 382.59 5105 556 118.4 116.4 554.97

o£?? 364.17 1814 198.35 5340 232.1 113.5 111.3 64.33

??′¨ 3534 1261 822.54 4645 902.3 118.5 117 1431.81

1ó?Y 630.07 942 150.84 4475 301.1 121.4 117.2 324.72

???? 1206.68 1261 334 5149 310.4 121.3 118.1 716.65

?÷2? 55.98 1110 17.87 7382 4.2 117.3 114.9 5.57

é??÷ 1000.03 1208 300.27 4396 500.9 119 117 600.98

?ê?à 553.35 1007 114.81 5493 507 119.8 116.5 468.79

?ào£ 165.31 1445 47.76 5753 61.6 118 116.3 105.8

?t?? 169.75 1355 61.98 5079 121.8 117.1 115.3 114.4

D??? 834.57 1469 376.95 5348 339 119.7 116.7 428.76

;

proc princomp out=prin;

proc print;

id name;

var x1-x8;

proc plot data=prin;

plot prin1*prin2 $ name='*'/

haxis=-3.5 to 3 by 0.5HREF=-2,0,2

vaxis=-3 to 4.5 by 1.5VREF=-2,0,2;

run;

四、利用第三题的数据及结果完成下列各题:

(1)利用第三题的原始数据做系统聚类分析,选用类平均法,分成3类地区,每类包含哪几个省市,说明各类的经济状况。

第一类有上海,第二类有广东、浙江、江苏、山东。其余的为第三类。

经济情况结合X项分析

(2)结合第三题的(5)小题结果,用系统聚类方法的类平均法,利用前两个主成分得分值对29个省市聚为3类,并比较与第四题(1)小题的结果,说明两个聚类结果的差异。

(3)写出相应的SAS程序。

data my4;

input name$ x1-x8@@;

cards;

beijing 1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43 tianjin 920.11 2720 345.46 6501 342.8 115.2 110.6 582.51 hebei 2849.52 1258 704.87 4839 2033.3 115.2 115.8 1234.85 shanxi 1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25 neimeng 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39 liaoning 2793.37 2397 387.99 4911 1371.1 116.1 114 1840.55 jilin 1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47 heilongjiang 2014.53 2334 435.73 4145 824.8 116.1 114.3 1240.37

shanghai 2462.57 5343 996.48 9279 207.4 118.7 113 1642.95

jiangsu 5155.25 1926 1434.95 5943 1025.5 115.8 114.3 2026.64

zhejiang 3524.79 2249 1006.39 6619 754.4 116.6 113.5 916.59

anhui 2003.58 1254 474 4609 908.3 114.8 112.7 824.14

fujian 2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67 jiangxi 1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84 shandong 5002.34 1527 1229.55 5145 1196.6 117.6 114.2 2207.69

henan 3002.74 1034 670.35 4344 1574.4 116.5 114.9 1367.92 hubei 2391.42 1527 571.68 4685 849 120 116.6 1220.72

hunan 2195.7 1408 422.61 4797 1011.8 119 115.5 843.83

guangdong 5381.72 2699 1639.83 8250 656.5 114 111.6 1396.35

guangxi 1606.15 1314 382.59 5105 556 118.4 116.4 554.97 hainan 364.17 1814 198.35 5340 232.1 113.5 111.3 64.33

sichuan 3534 1261 822.54 4645 902.3 118.5 117 1431.81 guizhou 630.07 942 150.84 4475 301.1 121.4 117.2 324.72

yunnan 1206.68 1261 334 5149 310.4 121.3 118.1 716.65

xizang 55.98 1110 17.87 7382 4.2 117.3 114.9 5.57

shanshanxi 1000.03 1208 300.27 4396 500.9 119 117 600.98

gansu 553.35 1007 114.81 5493 507 119.8 116.5 468.79

qinghai 165.31 1445 47.76 5753 61.6 118 116.3 105.8

ningxia 169.75 1355 61.98 5079 121.8 117.1 115.3 114.4 xinjiang 834.57 1469 376.95 5348 339 119.7 116.7 428.76

;

PROC standard mean=0std=1 out ww;

proc cluster m=ave nonorm;

id name;

proc tree;

run;

五、利用第四题的(1)小题的聚类结果及29个省市的原始数据作为训练样本。(1)建立线性判别模式,指出判别正确率。错判的有哪几个省市?错判到了第几类?

判别正确率为100%。没有错判的。

(2)对下面的某地区八项经济指标,利用上面的方法应判别到哪一类,和哪些省市在一类?

判别到第三类里。跟剩余的是一类,如北京、天津、福建、西藏等。

(3)写出相应的SAS程序。

data my5;

input group $ name$ x1-x8@@;

cards;

a beijing 1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43 a tianjin 920.11 2720 345.46 6501 342.8 115.2 110.6 582.51

a hebei 2849.52 1258 704.87 4839 2033.3 115.2 115.8

1234.85

a shanxi 1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25 a neimeng 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39

a liaoning 2793.37 2397 387.99 4911 1371.1 116.1 114 1840.55

a jilin 1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47

a heilongjiang 2014.53 2334 435.73 4145 824.8 116.1 114.3

1240.37

b shanghai 2462.57 5343 996.48 9279 207.4 118.7 113

1642.95

c jiangsu 5155.25 1926 1434.95 5943 1025.5 115.8 114.3

2026.64

c zhejiang 3524.79 2249 1006.39 6619 754.4 116.6 113.5

916.59

a anhui 2003.58 1254 474 4609 908.3 114.8 112.7 824.14

a fujian 2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67 a jiangxi 1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84 c shandong 5002.34 1527 1229.55 5145 1196.6 117.6 114.2

2207.69

a henan 3002.74 1034 670.35 4344 1574.4 116.5 114.9

1367.92

a hubei 2391.42 1527 571.68 4685 849 120 116.6 1220.72

a hunan 2195.7 1408 422.61 4797 1011.8 119 115.5 843.83

c guangdong 5381.72 2699 1639.83 8250 656.5 114 111.6

1396.35

a guangxi 1606.15 1314 382.59 5105 556 118.4 116.4 554.97 a hainan 364.17 1814 198.35 5340 232.1 113.5 111.3 64.33

a sichuan 3534 1261 822.54 4645 902.3 118.5 117 1431.81

a guizhou 630.07 942 150.84 4475 301.1 121.4 117.2 324.72

a yunnan 1206.68 1261 334 5149 310.4 121.3 118.1 716.65

a xizang 55.98 1110 17.87 7382 4.2 117.3 114.9 5.57

a shanshanxi 1000.03 1208 300.27 4396 500.9 119 117 600.98

a gansu 553.35 1007 114.81 5493 507 119.8 116.5 468.79

a qinghai 165.31 1445 47.76 5753 61.6 118 116.3 105.8

a ningxia 169.75 1355 61.98 5079 121.8 117.1 115.3 114.4

a xinjiang 834.57 1469 376.95 5348 339 119.7 116.7 428.76

;

data td;

input group $ name$ x1-x8@@;

cards;

. neimeng 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39

;

PROC discrim data=my5 testdata=td;

class group;

var x1-x8;

RUN;

(4)用逐步判别选择出最重要的变量,利用选出的变量重新建立线性判别模式,并回答上面的三个小题,即五、(1)(2)(3)。

答:X2 x3 x5 x7为重要变量。

data my5;

input group $ name$ x1-x8@@;

cards;

a beijing 1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43 a tianjin 920.11 2720 345.46 6501 342.8 115.2 110.6 582.51

a hebei 2849.52 1258 704.87 4839 2033.3 115.2 115.8

1234.85

a shanxi 1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25 a neimeng 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39

a liaoning 2793.37 2397 387.99 4911 1371.1 116.1 114 1840.55

a jilin 1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47

a heilongjiang 2014.53 2334 435.73 4145 824.8 116.1 114.3

1240.37

b shanghai 2462.57 5343 996.48 9279 207.4 118.7 113

1642.95

c jiangsu 5155.25 1926 1434.95 5943 1025.5 115.8 114.3

2026.64

c zhejiang 3524.79 2249 1006.39 6619 754.4 116.6 113.5

916.59

a anhui 2003.58 1254 474 4609 908.3 114.8 112.7 824.14

a fujian 2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67 a jiangxi 1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84 c shandong 5002.34 1527 1229.55 5145 1196.6 117.6 114.2

2207.69

a henan 3002.74 1034 670.35 4344 1574.4 116.5 114.9

1367.92

a hubei 2391.42 1527 571.68 4685 849 120 116.6 1220.72

a hunan 2195.7 1408 422.61 4797 1011.8 119 115.5 843.83

c guangdong 5381.72 2699 1639.83 8250 656.5 114 111.6

1396.35

a guangxi 1606.15 1314 382.59 5105 556 118.4 116.4 554.97 a hainan 364.17 1814 198.35 5340 232.1 113.5 111.3 64.33

a sichuan 3534 1261 822.54 4645 902.3 118.5 117 1431.81

a guizhou 630.07 942 150.84 4475 301.1 121.4 117.2 324.72

a yunnan 1206.68 1261 334 5149 310.4 121.3 118.1 716.65

a xizang 55.98 1110 17.87 7382 4.2 117.3 114.9 5.57

a shanshanxi 1000.03 1208 300.27 4396 500.9 119 117 600.98

a gansu 553.35 1007 114.81 5493 507 119.8 116.5 468.79

a qinghai 165.31 1445 47.76 5753 61.6 118 116.3 105.8

a ningxia 169.75 1355 61.98 5079 121.8 117.1 115.3 114.4 a xinjiang 834.57 1469 376.95 5348 339 119.7 116.7 428.76

;

PROC discrim data=my5;

class group;

var x2 x3 x5 x7;

RUN;

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

《应用数理统计》期末考试-2011

《应用数理统计》期末考试试题 (2011-11-26上午8:30—10:30) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 1、(20分)设总体X 服从正态分布(0,1)N ,12,X X 为来自总体X 的简单样本,设112212; Y X X Y X X =+=-。 (1)求二维随机变量12(,)Y Y 的联合密度()21,y y f ; (2)分别求12,Y Y 的边缘密度函数()()2121,y f y f Y Y ; (3)12,Y Y 是否独立?说明根据。 (4)叙述2χ分布的构造性定义。能否通过取适当的常数c ,使得2212()c Y Y +服从2χ分布?若可以,求出c ,并写出所服从的2χ分布的自由度。 2、(20分)设12,,,n X X X 是来自正态总体() 2~0,X N σ的简单样本,记 22221 21111??();1n n i i i i X X X n n σσ===-=-∑∑,其中11n i i X X n ==∑, (1)证明:21?σ是2 σ的渐近有效估计量; (2)证明:22?σ是2 σ的有效估计量; (3)试分别以21?σ,22?σ为基础构造2 σ的两种1α-置信区间。你认为你得到的哪个估计区间会更好一些?为什么? 3、(20分)(1)简述假设检验的一般步骤; (2)某厂生产一批产品,质量检查规定:若次品率0.05p ≤,则这批产品可以出厂,否则不能出厂。现从这批产品中抽查400件产品,发现有30件是次品,问:在显著性水平0.05α=下,这批产品能否出厂?若取显著性水平0.02α=,会得出什么结论?α是越小越好吗?对你的答案说明理由。 要求:将此问题转化成统计问题,利用所学知识给出合理的、令人信服的推断,推断过程的每一步要给出理由或公式。分位点定义如下: 若随机变量W ,对任意的()1,0∈α,有()α=≤x W P ,称x 为W 的α分位点,记作αx 。

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

应用数理统计试题

应用数理统计复习题 1.设总体~(20,3)X N ,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,X Y ,则1~(0,)2 X Y N - (||0.3)(0.424)(0.424)0.328P X Y -<=Φ-Φ-= 其中(01)θθ<<为未知参数,已知取得了样本值1231,2,1x x x ===,求θ的矩估计和最大似然估计. 解:(1)矩估计:2 2 22(1)3(1)23EX θθθθθ=+?-+-=-+ 14 (121)33 X =++= 令EX X =,得5?6 θ=. (2)最大似然估计: 2 2 5 6 ()2(1)22L θθθθθθθ=??-=- 45ln() 10120d d θθθθ=-= 得5?6 θ= 3. 设某厂产品的重量服从正态分布,但它的数学期望μ和方差2 σ均未知,抽查10件,测得重量为i X 斤10,,2,1Λ=i 。算出 10 11 5.410i i X X ===∑ 10 21 () 3.6i i X X =-=∑ 给定检验水平0.05 α=,能否认为该厂产品的平均重量为5.0斤? 附:t 1-0.025(9)=2.2622 t 1-0.025(10)=2.2281 t 1-0.05(9)=1.8331 t 1-0.05(10)=1.8125 解: 检验统计量为0 | |/X T S n m -=

将已知数据代入,得2t = = 1/2 0.975(1)(9) 2.26222t n t a - -==> 所以接受0H 。 4. 在单因素方差分析中,因素A 有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平0.05α=下对因素A 是否显著做检验。 解: 0.95(2,9) 4.26F =,7.5 4.26F =>,认为因素A 是显著的. 5. 现收集了16组合金钢中的碳含量x 及强度y 的数据,求得 0.125,45.7886,0.3024,25.5218xx xy x y L L ====,2432.4566yy L =. (1)建立y 关于x 的一元线性回归方程01 ???y x ββ=+; (2)对回归系数1β做显著性检验(0.05α=). 解:(1)1 25.5218 ?84.39750.3024 xy xx l l β== = 01 ??35.2389y x ββ=-= 所以,?35.238984.3975y x =+ (2)1?2432.456684.397525.5218278.4805e yy xy Q l l β=-=-?= 2 278.4805 ?19.8915214 e Q n σ ===- ? 4.46σ ==

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

北航2010应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

2009(上)《数理统计》考试题(A卷)及参考解答

2009(上)《数理统计》考试题(A 卷)及参考解答 一、填空题(每小题3分,共15分) 1,设总体X 和Y 相互独立,且都服从正态分布2(0,3)N ,而129(,,)X X X 和129(,,)Y Y Y 是分别来自X 和Y 的样本,则U = 服从的分布是_______ . 解:(9)t . 2,设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2 ?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 3,“两个总体相等性检验”的方法有_______ 与____ ___. 解:秩和检验、游程总数检验. 4,单因素试验方差分析的数学模型含有的三个基本假定是_______ . 解:正态性、方差齐性、独立性. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计是?β=_______ . 解:1?-''X Y β= ()X X . 二、单项选择题(每小题3分,共15分) 1,设12(,,,)(2)n X X X n ≥ 为来自总体(0,1)N 的一个样本,X 为样本均值,2 S 为样本方差,则 ____D___ . (A )(0,1)nX N ; (B )2 2()nS n χ ; (C ) (1)()n X t n S - ; (D )2 12 2 (1)(1,1)n i i n X F n X =--∑ . 2,若总体2(,)X N μσ ,其中2σ已知,当置信度1α-保持不变时,如果样本容量n 增大,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,分别用α,β表示犯第一类错误和第二类错误的概率,则当样本容量n 一定时,下列说法中正确的是____C___ . (A )α减小时β也减小; (B )α增大时β也增大; (C ),αβ其中一个减小,另一个会增大; (D )(A )和(B )同时成立. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方

北航数理统计期末考试题

材料学院研究生会 学术部 2011 年12 月 2007-2008学年第一学期期末试卷 一、(6 分,A 班不做)设x1,x2,?,x n是来自正态总体N( , 2) 的样本,令 2(x1 x2) T (x3 x4)2 (x5 x6)2 , 试证明T 服从t-分布t(2) 二、( 6 分, B 班不做 ) 统计量F-F(n,m) 分布,证明 1的 (0< <1)的分位点x 是1。 F F1 (n,m) 。 三、(8分)设总体X 的密度函数为 其中1,是位置参数。x1,x2,?,x n是来自总体X 的简单样本, 试求参数的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp ,x p(x; ) 0 , 其它 其中, 已知,0, 是未知参数。x1,x2,?,x n 是来自总体X 的简单样本。

1)试求参数的一致最小方差无偏估计; 2) 是否为的有效估计?证明你的结论。 五、(6分,A 班不做)设x1,x2,?,x n是来自正态总体N( 1, 12) 的 简单样本,y1,y2,?,y n 是来自正态总体N( 2, 22) 的简单样本,且两样本相互独立,其中1, 12, 2, 22是未知参数,1222。为检验假设H0 : 可令z i x i y i, i 1,2,..., n ,1 2 , 1 2, H1 : 1 2, 则上述假设检验问题等价于H0 : 1 0, H1: 1 0,这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,?,z n,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6 分,B 班不做)设x1,x2,?,x n是来自正态总体N( 0, 2) 的简单样本,0 已知,2未知,试求假设检验问题 H0: 202, H1: 202的水平为的UMPT。 七、(6 分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6 分)设方差分析模型为 总离差平方和 试求E(S A ) ,并根据直观分析给出检验假设H0 : 1 2 ... P 0的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D 外,还需考察 A B ,B C 。今选用表L8(27 ) ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

应用数理统计试题

应用数理统计复习题 1.设总体,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,则 2. 设总体具有分布律 1 2 3 其中为未知参数,已知取得了样本值,求的矩估计和最大似然估计. 解:(1)矩估计: 令,得. (2)最大似然估计: 得 3. 设某厂产品的重量服从正态分布,但它的数学期望和方差均未知,抽查10件,测得重量为斤。算出 给定检验水平,能否认为该厂产品的平均重量为5.0斤? 附:t1-0.025(9)=2.2622 t1-0.025(10)=2.2281 t1- 0.05(9)=1.8331 t1-0.05(10)=1.8125 解: 检验统计量为

将已知数据代入,得 所以接受。 4. 在单因素方差分析中,因素有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平下对因素是否显著做检验。 来源平方和自由度均方和F比 因素 4.2 误差 2.5 总和 6.7 解: 来源平方和自由度均方和F比 因素 4.2 2 2.1 7.5 误差 2.5 9 0.28 总和 6.7 11 ,,认为因素是显著的. 5. 现收集了16组合金钢中的碳含量及强度的数据,求得 ,. (1)建立关于的一元线性回归方程; (2)对回归系数做显著性检验(). 解:(1) 所以, (2)

拒绝原假设,故回归效果显著. 6.某正交试验结果如下 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 (1)找出对结果影响最大的因素; (2)找出“算一算”的较优生产条件;(指标越大越好) (3)写出第4号实验的数据结构模型。 解: 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 ⅠⅡR 29.79 25.36 32.0 30.86 35.29 28.65 1.07 9.9 3.35 (1)对结果影响最大的因素是B; (2)“算一算”的较优生产条件为 (3) 4号实验的数据结构模型为 ,

《应用数理统计》期末考试真题_2009年

《应用数理统计》期末考试试题 (2009-12-12上午9:00—11:00) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 一、判断题 (30分) 判断下列说法是否正确,正确的划√,错误的划×。 1、若函数()f x 是某一随机变量X 的概率密度,则一定有()0f x ≥。 ( ) 2、设随机变量X 和Y 相互独立,则期望()()()E XY E X E Y =。 ( ) 3、二维随机变量(,)X Y 的相关系数0ρ=是X 与Y 相互独立的必要条件。 ( ) 4、在数理统计中,总体可视为一个概率分布。( ) 5、样本的函数即为统计量。( ) 6、当x 取定一已知常数时,经验分布函数()n F x 为一统计量。 ( ) 7、设随机变量2~(0,1),~()X N Y n χ 服从自由度为n 的t 分布。 ( ) 8、点估计问题中,一致最小方差无偏估计一定是有效估计。 ( ) 9、假设检验中,在样本容量固定的情形下,第一类错误和第二类错误不可能同时减小。 ( ) 10、假设检验中,第一类错误α的设定越小越好。 ( ) 二、(10分)(1)叙述F 分布的构造性定义。 (2)对连续型随机变量X ,若有()αα=≤x X P ,称αx 为随机变量X (或其分布)的α分位点,记为αX 。其中10<<α。记服从自由度分别为,m n 的F 分布的α分位点为(,)F m n α,试证明:11(,)(,) F m n F n m αα?= 。 三、(15分)设总体X 服从区间],0[θ(0θ>,未知)上的均匀分布,123,,X X X 为来自总体X 的简单样本, (1)试求其顺序统计量(1)(3)(,)X X 的联合概率密度;

概率数理统计试题及答案

应用数理统计试题 1.设15,,X X 是独立且服从相同分布的随机变量,且每一个()1,2,,5i X i = 都服从()0,1.N (1)试给出常数c ,使得()22 12c X X +服从2χ公布,并指出它的自由度; (2)试给出常数,d 使得 服从t 分布,并指出它的自由度. 2.设总体X 的密度函数为 ???<<+=其他, 01 0,)1();(x x x f ααα 其中1->α是未知参数, ),,(1n X X 是一样本, 试求: (1) 参数α的矩估计量; (2) 参数α的最大似然估计量. 3.有一种新安眠剂,据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时,为了检验新安眠剂的这种说法是否正确,收集到一组使用新安眠剂的睡眠时间(单位:小时): 26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4. 根据资料用某种旧安眠剂时平均睡眠时间为20.8小时,假设用安眠剂后睡眠时间服从正态分布,试问这组数据能否说明新安眠剂的疗效?()0.05.α= 4.若总体X 服从正态分布() 22.1,1N ,样本n X X X ,,,21 来自总体X ,要使样本均值X 满足不等式{}95.01.19.0≥≤≤X P ,求样本容量n 最少应取多少? 5.在某种产品表明进行腐蚀刻线实验,得到腐蚀深度y 与腐蚀时间x 对应的一

(1)预测腐蚀时间75s 时,腐蚀深度的范围(α-1=95%); (2)若要求腐蚀深度在10~20um 之间,问腐蚀时间应如何控制? 6.简述方差分析,主成分分析的基本思想 附:统计查表数据 0.025(6) 2.447t =,0.025(7) 2.365t =,(1.96)0.975Φ= 参考答案: 1.设15,,X X 是独立且服从相同分布的随机变量,且每一个()1,2,,5i X i = 都服从()0,1.N (1)试给出常数c ,使得() 22 12c X X +服从2χ公布,并指出它的自由度; (2)试给出常数,d 使得服从t 分布,并指出它的自由度. 解 (1)由于()()()22 21212~0,1,~0,1, ~2X N X N X X +χ故 因此1c =,1222 X X +服从自由度为2的2χ分布. (2)由于()()~0,11,2,5i X N i = 且独立,则()12~0,2X X N + ()~0,1N 而 ()22223453X X X ++=χ ()~3,t ()~3t 所以d =自由度为3. 2. 设总体X 的密度函数为 ???<<+=其他, 01 0,)1();(x x x f ααα 其中1->α是未知参数, ),,(1n X X 是一样本, 试求:

北航数理统计期末考试题

北航数理统计期末考试题 2011年2007-2008学年第一学期期末试卷一、(6分,A班不做)设x1,x2,…,xn是来自正态总体的样本,令,试证明T服从t-分布t(2) 二、(6分,B班不做)统计量F-F(n,m)分布,证明。 三、(8分)设总体X的密度函数为其中,是位置参数。x1,x2,…,xn是来自总体X的简单 样本,试求参数的矩估计和极大似然估计。 四、(12分)设总体X的密度函数为,其中是未知参数。x1,x2,…,xn是来自总体X的简 单样本。 (1)试求参数的一致最小方差无偏估计; (2)是否为的有效估计证明你的结论。 五、(6分,A班不做)设x1,x2,…,xn是来自正态总体的简单样本,y1,y2,…,yn是 来自正态总体的简单样本,且两样本相互独立,其中是未知参数,。为检验假设可令则上述假设检验问题等价于这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,…,zn,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6分,B班不做)设x1,x2,…,xn是来自正态总体的简单样本,已知,未知,试求假 设检验问题的水平为的UMPT。 七、(6分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方 面八、(6分)设方差分析模型为总离差平方和试求,并根据直观分析给出检验假设的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D外,还需考察,。今选用表,表 头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。 列号试验号ABCD实验数据 12345671111111112.82111222228.23122112226.14122221135.35212121230.5621221214 .37221122133.3822121124.0十、(8分)对某中学初中12岁的女生进行体检,测量四个变量,身高x1,体重x2,胸围x3,坐高x4。现测得58个女生,得样本数据(略),经计算指标的协方差阵V的极大似然估计为且其特征根为。 (1)试根据主成分85%的选择标准,应选取几个主要成分(2)试求第一主成分。 2006级硕士研究生《应用数理统计》试题一、选择题(每小题3分,共12分) 1.统计量T~t(n)分布,则统计量T2的α(0α1)分位点xα(P{T2≤xα}=α)是()

清华大学杨虎应用数理统计课后习题参考答案

习题三 1 正常情况下,某炼铁炉的铁水含碳量2 (4.55,0.108)X N .现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)? 解 由题意知 2 ~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立 统计原假设 0010:,:H H μμμμ=≠ 拒 绝 域 为 {} 00K x c μ=->,临界值 1/2 1.960.108/0.0947c u α-==?=, 由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性 变化. 设立统计原假设 2 2 2 2 0010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时 2 222 0.0250.9751 1()0.03694,(5)0.83,(5)12.83,n i i S X n μχχ==-===∑ 22 10.02520.975(5)/50.166,(5)/5 2.567c c χχ==== 拒绝域为 {} 2222 00201//K s c s c σσ=><或 由于22 0/ 3.167 2.567S σ=>,所以拒绝0H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为 x =950h .已知该种元件寿命2(100,)X N σ,问这批元件是否合格(0.05α=)? 解 由题意知 2 (100,)X N σ,设立统计原假设 0010:,:,100.0.05.H H μμμμσα≥<== 拒绝域为 {} 00K x c μ=-> 临界值为 0.050.0532.9c u u =?=?=- 由于 050x c μ-=-<,所以拒绝0H ,元件不合格.

应用数理统计试题

山东科技大学2016—2017学年第一学期硕士研究生 《应用统计》考试试卷 2017.06 班级 姓名 学号 一、填空题(每空3分,共36分) 1.当样本观测值12345(,,,,)(1,4,6,4,3)x x x x x =--时,对应次序统计量的观测值为 ;秩统计量的观测值为 . 2.设128,,,(0,4)X X X iid N L ,8118i i X X ==∑,则4814i i i i E X X ==?? ????=?? ????????? ∑∑ ; 821()i i E X X =??-=????∑ ;421()i i E X X =??-=???? ∑ . 3.设129,,,(1,1)X X X iid N L ,则() 9 2 11 1i i Y X == -∑服从 分布; () ()4 8 2 2 21 5 11i i i i Y X X ===--∑∑服从 分布;( 311Y X =-服从 分布. 4.设总体2(,)X N μσ:,样本1,n X X L ,2 σ已知, X 样本均值,2 S 为样本方差, 若 )~(0,1)X N μσ-,则μ的一个双侧1α-置信区间为 ;μ的一个单侧 1α-置信上限为 。 5.在样本量41n =、水平数5a =的单因子方差分析模型中,若总离差平方和200SS =,误 差平方和120e SS =,则因素平方和A SS = ;F 检验统计量的值= . 二、计算与证明(1、4小题每题20分,2、3小题每题12分,共64分) 1.设总体的分布密度函数为1 ,02()20,x f x θθ?≤≤? =???其他 ,1,n X X L 是从中抽取的样本,

应用数理统计作业题及参考答案(第一章 )

第一章 数理统计的基本概念 P26 1.2 设总体X 的分布函数为()F x ,密度函数为()f x ,1X ,2X ,…,n X 为X 的子样,求最大顺序统计量()n X 与最小顺序统计量()1X 的分布函数与密度函数。 解:(){}{}()12n n i n F x P X x P X x X x X x F x =≤=≤≤≤=???? ,,,. ()()()()1n n n f x F x n F x f x -'=??=??????. (){}{}1121i n F x P X x P X x X x X x =≤=->>> ,,,. {}{}{}121n P X x P X x P X x =->>> {}{}{}121111n P X x P X x P X x =-?-≤??-≤??-≤??????? ()11n F x =-?-??? ()()()()1111n f x F x n F x f x -'=??=?-???? ?. 1.3 设总体X 服从正态分布()124N , ,今抽取容量为5的子样1X ,2X ,…,5X ,试问: (i )子样的平均值X 大于13的概率为多少? (ii )子样的极小值(最小顺序统计量)小于10的概率为多少? (iii )子样的极大值(最大顺序统计量)大于15的概率为多少? 解:()~124X N , ,5n =,4 ~125 X N ?? ∴ ?? ?,. (i ) {}{ } ()13113111 1.1210.86860.1314P X P X P φφ???? ???>=-≤=-=-=-=-=. (ii )令{}min 12345min X X X X X X =,,,,,{}max 12345max X X X X X X =,,,,. {}{}{}min min 125101*********P X P X P X X X <=->=->>> ,,, {}{}{}55 5 1 1 11011101110i i i i P X P X P X ===->=-?-

应用数理统计试题

应用数理统计试题 一、填空(3分×10=30分) 1.设X为一个连续型随机变量,分布函数为F,若有1 P, X (m ) 则m是F的()点。 2.参数估计中的矩估计法是用()矩近似()矩的方法。 3.歌唱比赛中选手的最后成绩是在去掉最高分和最低分后的平均成 绩,这是根据估计量的()准则而设定的。 4.在极大似然估计中,我们是把被估计量视为()变量,而在Bayes估计中,我们是把被估计量视为()变量。 5.假设检验中可能存在的两类错误是()和()。其中,()的概率因不同问题而不确定,()的概率等于显著性水平。 二、选择(4分×5=20分) 1. 正确描述假设检验中原假设与备选假设的地位的是() A相等的B原假设受到保护 C备选假设受到保护D具有不确定性 2.设X为一个连续型随机变量,其密度为) (x f,则X的k阶中心矩为()。 A) f k)) ( ( (k x )( x E B dx X X E C) ( x k) ) ( E ( ) (k X EX E D dx x f X

3.两个事件A 与B ,若有P (A )>0,P (B )>0,且两个事件是互不相容的,则这两个事件是()的。 A 一定互相独立 B 不一定相互独立C 不相关的 D 一定不相互独立 4.一元线性回归模型相互独立 为有限, ,i i i i i E n i x y 2 1 ) (0,, 2,1,其中参数的最 小二乘估计是根据()最小的原则计算得到的。 A 回归平方和 B 总的离差平方和C 残差平方和 D 观测点到回归直线的距离 5.设),(~n t T 则~)1( 2 T ( )。 A ) ,1(n F B ) 1,(n F C )(2 n D ) 1(2 n 三、(15分) 设总体X 服从正态分布,数学期望为 12,方差为4,若,12X Y 现 抽取容量为5的Y 的样本54321,,,,Y Y Y Y Y ,计算 (1)概率)08.6( 5 1 2 i i Y P ; (2)) ( 5 1 i i Y E ; 四、(10分) 以往一台机器生产的垫圈的一组平均厚度为0.05cm ,为了检查这台 机器是否处于正常工作状态,现抽取 10个垫圈的样本,测得平均厚 度为0.053,样本方差为0.00322 ,在显著性水平 为(1)0.05,(2) 0.01下,检验机器是否处于正常工作状态,即均值是否与以往相同。

重庆大学硕士研究生2010级_应用数理统计_课程(A)试题

重庆大学硕士研究生2010级 应用数理统计 课程(A )试题 请保留小数两位: 20.950.950.9750.96410.72570.99870.950.950.95(16) 1.75, 1.95, 1.96, 1.8,0.6,3,(4)9.49, (3,8) 4.07,(1,14) 4.60, t u u u u u F F χ========= 一、 (12分)设两个独立的样本1212,,,,,n n X X X Y Y Y 是来自总体21(,) N u σ和22(,)N u σ,2111 111,,(),1n n n i i i i i i X X Y Y S X X n n n ======--∑∑∑ ,1 1()()1n X Y i i i S X X Y Y n ==---∑。 (1)当n=17时,求常数k 使得12(0.95P X Y μμ->-+=; (2)求概率22{1}X Y S P S >。 二、 (15分)设总体X 的密度函数为:1,0(;),10,(0,1) x f x x θθ>=>???。(1)求参数θ的矩估计量?θ;(2 )求参数()g θ=的的最大似然估计?g ;(3)试分析?g 的无偏性、有效性、相合性。 三、 (10分) (1)某生产商关心PC 机用的电源和输出电压。假设输出电压服从标准差为0.25V 的正态分布2(,)N u σ ,问样本容量n 为多大时,才能是平均输出电压的置信度为0.95的置信区间长度不超过0.2V 。 (2)设12,,n X X X 是来自总体~(0,)X U θ的样本,()1max n i i n X X ≤≤=。统计假设 01:3,:3H H θθ≥<的拒绝域为(){ 2.5}n K x =<。求假设检验犯第Ⅰ类错误的最大概率max α。 四、 (10分)一药厂生产一种新的止痛片,长方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一片,因此厂方提出检验假设:012:2H μμ=,112:2H μμ>。此处12,μμ分别是服用原有止痛片和新服用

《应用数理统计》期末考试-2012

中国农业大学《应用数理统计》期末考试试题(2012.12.06) (说明:把答案写在答题册上,可以使用简易计算器,考试时间120分钟) 一、(20分)(1)设)2(,,,21≥n X X X n 是来自正态分布总体),(2σμN 的简单随机样本,其中2,σμ均未知,X 和2S 分别为样本均值和样本方差, (1)设μ的水平为α-1的置信区间长度为L ,试求EL 2 及DL 2; (2)设1+n X 是又一独立的观测值,试确定统计量 S X X n n n -++111-的分布并说明理由。 二、(25分)设总体X 的概率密度为?????≤>=-, ,,,0001);(x x e x f x θ θθ,θ为未知参数,n X X X ,,,21 为取自总体X 的简单随机样本, (1) 求θ的最大似然估计θ ?,并判断θ?是否为θ的无偏估计; (2) 求},,,min{21)1(n X X X X =的概率密度; (3) 判断)1(nX 是否为θ的无偏估计。 三、(20分)正常人的脉博平均为72次/分,某医生测得10例慢性四乙基铅中毒患者的脉搏(次/分)均值为67.4,方差为36,已知脉搏服从正态分布, (1) 求总体方差σ 2 的置信区间 (α=0.1) ; (2) 在显著性水平α = 0.05下, 四乙基铅中毒患者和正常人的脉搏有无显著差异? 参考数据:t 0.95(10)=1.8125, t 0.95(9)=1.8331, t 0.975(9)=2.2622, t 0.975(10)=2.2281, χ20.95(10)=18.307, χ20.95(9)=16.919, χ20.9(9)=14.684, χ20.05(9)=3.325, χ20.1(9)=4.168, χ20.05(10)=3.94. 四、(20分)粮食加工厂用四种不同的方法储藏粮食,储藏一段时间后分别抽样化验,得到粮食含水率(%)如下:

《应用数理统计》吴翊李永乐第一章数理统计的基本概念课后习题

第一章 数理统计的基本概念 课后习题参考答案 设对总体X 得到一个容量为10的子样值:,,,,,,,,,,试分别计算子样均值X - 和子样方差 2S 的值。 解:12,n X X X 为总体X 的样本, 根据 121 ()n X X X X n = +++ 求得X =; 根据2 21 1()n i i S X X n ==-∑ 求得2 S =。 设总体X 的分布函数为()x F ,密度函数为()x f ,n X X X ,,,21 为X 的子样,求最大顺序统计量()n X 与最小顺序统计量()1X 的分布函数与密度函数。 解: 将总体X 中的样本按照从小到大的顺序排列成()()()n X X X ≤≤≤ 21 ()()()()()()[]n n n n x F x x P x x P x x P x x P x F =<<<=<= 21 ()()[]()()x f x nF x F x f n n n 1' -== ()()()()() ()[]()[]()[]()[] n n n x F x x P x x P x x P x x P x x P x x P x x P x F --=<-<-<--=≥≥≥-=<=1111111212111 ()()[]()[] ()x f x F n x F x f n 1 111'--== 设总体X 服从正态分布N(12,4),今抽取容量为5的子样521,,,X X X ,试问: (1)子样的平均值X 大于13的概率为多少 (2)子样的极小值(最小顺序统计量)小于10的概率为多少 (3) 子样的极大值(最大顺序统计量)大于15的概率为多少 解:

应用数理统计习题

考试方式: 《应用数理统计》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到 zhang-hh@https://www.sodocs.net/doc/5c3085237.html, ,占30%;(2)结合自己的专业,写一篇统计方法的应用,或介绍一些新的统计方法等小论文,篇幅不限,论文要标注参考文献,占70%。 《数据统计分析》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到zhang-hh@https://www.sodocs.net/doc/5c3085237.html, ,占30%;(2)闭卷或开卷考试,占70%。 参考教材:《实用统计方法》 西安交通大学 梅长林等 科学出版社 2002。 部分习题 第一章 多元回归分析 1.4某种化工产品的得率Y 与反应温度1X ,反应时间2X 及某反应温度3X 有关。设对于给 定的1X ,2X ,3X ,得率Y 服从正态分布且方差为常数。近得实验结果如下,其中1X ,2X ,3X 均为两水平变量且编码形式表达。

(1)对Y ,拟合以1X ,2X ,3X 为自变量的线性回归模型,求出回归参数估计值及残差。 (2)给定显著水平05.0=α,检验回归系数的显著性。 (3)对05.0=α,检验各自变量对Y 的影响的显著性。 1.7为了研究人们对某种品牌食品的喜爱程度Y 和该食品的水分含量1X ,甜度2X 的关系,, 进行了一个完全随机化设计的小规模试验,得到下列数据: (1) 拟合回归模型 i i i i X X Y εβββ+++=22110, 写出回归方程,问其中的 ∧ 1 β如何解释。 (2) 求出残差向量,分别作出残差关于拟合值∧ Y , 1X , 2X 及1X 2X 的残差图及残差 的正态概率图。分析这些残差图并给出你的评述。 (3) 设误差项()16,2,1 =i i ε独立同分布于()2 ,0σ N , 在01.0=α的水平上检验回归 关系的显著性。写出假设、检验准则及结论并求检验的p-值。 (4) 在(3)中关于i ε的假定下,对自变量一组新的观察值 ()4,5=T new X ,给出Y 的 预报值的99%置信区间。 (5) 拟合Y 关于1X 的一元线性回归模型,写出回归方程。将1X 的回归系数与(1)中 所求得的1X 的回归系数作比较,你有什么结论。 (6) ()1X SSR 和()21X X SSR 是否相等?二者的意义有何不同? 1.8 某科学基金会的管理人员希望估价从事数学研究工作的中等或较高水平的数学家的 年工资额Y 与他们的研究成果(论文、著作等)的质量指标1X ,从事研究工作的时间2X 以及能成功获得资助的指标3X 之间的关系。为此按一定的试验设计方法调查了24位此类型的数学家,得到下列数据:

相关主题