当前位置：搜档网 › 应用数理统计试题库

应用数理统计试题库

应用数理统计复习题（2010）

一填空题 1

设

21,,,X X X 是总体

)

1,0(~N X 的一个样本，

26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时，CY 服从2χ分布。 2 设统计量)(~n t X ，则~2

F(1,n) ，

F(n,1) 。 3 设n X X X ,,,21 是总体),(~2σu N X 的一个样本，当常数C = 1/2（n-1）时，

∑-=+-=1

212

)(n i i i X X C S 为2σ的无偏估计。

4 设)),0(~(2σεε

βαN x y ++=，),,2,1)(,(n i y x i i =为观测数据。

对于固定的0x ，则0x βα+~ ()

0201,x x N x n Lxx αβσ??

?- ???++ ??? ??????

。 5．设总体X 服从参数为λ的泊松分布，1.9，2，2，2.1， 2.5为样本，则λ的矩估计值为?λ

＝ 2.1 。

6．设总体212~(,),,,...,n X N X X X μσ为样本，μ、σ2 未知，则σ2的置信度为1－α的

置信区间为 ()()()()22

212211,11n S

n S n n ααχχ-??--????--????

。 7．设X 服从二维正态),(2∑μN 分布，其中???

??=∑????

??=8221,

10μ

令Y ＝X Y Y ???? ??=?

???

??202121，则Y 的分布为 ()

12,02T

N A A A A μ??= ???

∑ 。 8．某试验的极差分析结果如下表（设指标越大越好）：

表2 极差分析数据表

则（1）较好工艺条件应为22121A B C D E 。

（2）方差分析中总离差平方和的自由度为 7 。（3）上表中的第三列表示 A B ?交互作用。

9．为了估计山上积雪溶化后对河流下游灌溉的影响，在山上建立观测站，测得连续10年的观测数据如下表（见表3）。

表3 最大积雪深度与灌溉面积的10年观测数据

则y 关于x 的线性回归模型为 ()? 2.356 1.813~0,1.611y

x N εε=++ 10设总体12~(,1),,,...,n X U X X X θθ+为样本，则θ的矩估计量为 1

x - ，极大似然估计量为 max{X 1,X 2,…,X n } 。

12设总体X 在区间]1,[+θθ上服从均匀分布，则θ的矩估计=θ

? 12

x - ；=)?(θ

D 1/12n 。

13设n X X ,,1 是来自正态总体),(2σμN 的样本，2,σμ均未知，05.0=α. 则μ的置信度为α-1的置信区间为

(

)()221,1x n x n αα??--????

；若μ为已知常数，则检验假设,::20212020σσσσ

σ已知），的拒绝域为 221(n-1)X αχ-≤ 。

14设X 服从p 维正态),(∑μp N 分布，是来自n X X X ,,,21 X 的样本，则∑的最小方差

无偏估计量=∑? ()2

i i 1

1x n μ=-∑ ；μ-X 服从 ()p 0,/N n ∑ 分布。

15设（X 1，…，X n ）为来自正态总体),(~∑μp N X 的一个样本,∑已知。对给定的检

验水平为α，检验假设0100::μμμμ≠?=H H ，（0μ已知）

，

拒绝域为2u u α???

≥?????

。二计算及证明题

1 设21,X X 是来自总体),(~2

σu N X 的一个样本。（1）证明21X X +，21X X - 相互独立

（2）假设0=u ，求2

212

21)()(X X X X -+的分布 ()()()()

()()()()()

21212

12122

12212

121,,0,10,120,20,22,20,20,2x x x

N x x N N x x x x N N x x N x x N x x N μσμμσσ

μμμσσσμσσσ

----+-??

???

+--证明：因为：均服从所以：，，即：，

()()()12

200,0,x x N x x N μσσ=+-，，

即()2

212~1X X X σ+?? ??? ()2

212~2X X X σ-?? ???

()()2

1221121222

12122

/~(,)(1,1)~(1,1)/X X n X X F F n n F F X X X X n σσ+??

?+??∴===--??

???

2 设

n X X X ,,,21 是总体)1,0(~N X 的一个样本，求统计量

1)(1)(1∑∑+==-+=n

m i i m i i X m n X m Y 的抽样分布。

(

)2222

__111122

11~(0,1)

11i m n i i i i m X N Y X X m X n m Y m n m ==+????????=+=+-

? ? ? ?-????????

??????=+=+????∑∑

(

)(

)()()

__222

~0,10,11/~1~1~2N N m X X Y X ????∴

∴ 3 设总体)(~λE X （指数分布），n X X X ,,,21 是总体的一个样本，证明

)2(~221

n X n

i i χλ∑=

4 设总体)(~λP X （泊淞分布），n X X X ,,,21 是总体的一个样本，2

S X 和为样本均值和样本方差，试求

（1）n X X X ,,,21 的联合分布律

（2）)(),(),(2S E X D X E

()}{}

11221

1,,,!

i n

n n i i i X x

n i i

i P X X X X X X P X X e

e X X λ

λλ

==--====???===∑==

∏∏

∏

()()

()()()

()

()()

()

111222211

21,2,,111,11211i i i n n

i i i i i i n

n i i i i i X i n E X D X E X E X E X D X D X n n n n

E S E X X E X X X X n n λλ

λ======???∴==??????=====

? ? ?????????=-=-+ ?

--??∑∑∑∑∑

()()

()

()()

()()()22

1122122

1222

12112111n n

i i i i n

i i n

i i i i i E X X n E X E XnX E nX n E X E nX n E X D X E X λλ====??=-+ ?-????=

-+ ?-????=- ?-??

=+=+∑∑∑∑ ()

()()

()()2

22211

(1)11E nX

D X

E X

E S n n n n n λ

λλλλλλλ=+=

+??∴=

+--=

-=?

?--

5设n X X X ,,,21 是总体X 的一个样本，试求下列总体的矩估计量和极大似然估计量。（1）总体X 的分布律是),3,2,1()

1()(1

=-==-k k X P k θθ，其中10<<θ未知参数。

（2）X 的密度函数为??

?<<=-其他

0)(1

x x x f θθ（0>θ为待估计参数）

6 设总体),(~2

σu N X （方差已知），问需抽取容量n 多大时，才能使得总体均值μ的置信度为α-1的置信区间的长度不大于L ？解：

(

2~,~(0,1)X N N μσ

21P U U αα??

∴<=-????

U U αα<

/42/X U U X U U Ln U L α

ααασσσσ-<<+≤≥

2/U L ασ 222

24n U L ασ≥

7 为了检验某种自来水消毒设备的效果，现从消毒后的水中随机取50L ，化验每升水中大肠

杆菌的个数（一升水中大肠杆菌的个数服从Poisson 分布），化验结果如下：

试问平均每升水中大肠杆菌个数为多少时才能使得上述情况发生的概率最大？

8 某系中喜欢参加体育运动的60名男生平均身高为172.6cm ，标准差为6.04cm ，而对运动不感兴趣的55名男生的平均身高为171.1cm ，标准差为7.10cm 。试检验该系中喜欢参加运动的男生平均身高是否比其他男生高些。（05.0=α）

9 设有线性模型???

??++=+-=+=3213

22121

1122ε

ββy εββy εβy ，其中)3,2,1)(,0(~2=i N i σε且相互独立，试求

（1）21ββ和的最小二乘估计

（2）给出21ββ和的分布并证明他们的独立性（3）导出检验210:ββ=H 的检验统计量 (1)

根

据

线

性最小二乘

法定义

：设函数

()()()(

1211

312

,22Q y y y

βββ

ββββ=-+-++--只需要是此函数最小

()()()()

()()121121*********,22222222601Q y y y y y y βββββββββ?∴=---?-+---?=++-=??? ()

()()()()

122123122232,222222502Q y y y y ββββββββ?∴

=-+---?=-+=???

解（1）（2）得，估计值：

12332

1122,65

y y y y y ββ++-=-

10 若总体X 服从正态分布(

)

2.1,1N ，样本n X X X ,,,21 来自总体X ，要使样本均值X 满足不等式{}

95.01.19.0≥≤≤X P ，求样本容量n 最少应取多少？

(

)()}

{(

x 1,1.2N 0,10.9 1.10.95:10.95

0.975 1.961.96553.2n N

x n ≤≤≥?Φ-Φ-≥ ?????∴Φ≥=Φ?

≥∴≥解：则：由p 得即样品容量最少应取554

11有一种新安眠剂，据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时，为了

检验新安眠剂的这种说法是否正确，收集到一组使用新安眠剂的睡眠时间(单位：小时):

26.7， 22.0， 24.1， 21.0， 27.2， 25.0， 23.4.

根据资料用某种旧安眠剂时平均睡眠时间为20.8小时，假设用安眠剂后睡眠时间服从正态分布，试问这组数据能否说明新安眠剂的疗效？()0.05.α=

()()

(

)

i 1

H0u 23.8H1u 23.8H01

x 26.72224.121.027.22523.424.2

71x 4.52, 2.13n 0,1 1.i x N u u u ασσ=-

=≠=?++++++==-===<=∑解：由问题提出假设：，：在成立的前提下：

而96

∴0接受假设H ,即这组数据能说明新安眠药的疗效

11.设总体X 的概率密度为1,0

(,)00x x e x f x x αλαλλ--?>=?≤?

，其中λ>0是未知参数，α>0

是已知常数，12,,...,n X X X 为样本，求λ的矩估计和极大似然估计。（1）矩估计：根据矩估计的定义E （X ）=X

()()()1

1x E X x

xdx x d e ααλαλα∞

∞

--==-?????

根据分部积分法：

()1

x x x x d e

dx e x dx α

λλαλαλααα∞

∞∞

∞

------=-=-???

带入（1）式，得：

()()()22

110

E X x e dx x d e αλαλααλ∞

∞----==-?????

而()()()1

1220

11x

x x

d e

dx x e dx αλλααλαλαα∞

∞

--------=--=--?

代入（2）得()()()()2222200

11x x

E X x e dx x d e αλαλααααλλ∞∞-------==?? 以此类推，最后可得

()()()(

)22

2011!x E X d e x λααααααλλλ∞

--???--?????=-==?=?

（2）极大似然估计：似然函数()()1

1,n

i n

x n

i i i L f x x e

αλ

λλαλ=--==∑??

= ?

∏

()()()11ln ln ln 1ln n n

i i i i L n n x x λαλαλ==??

=++-+- ???

∑∏

()1

ln 1n

i i L n x λλλ=?=-?∑

()1ln 11

0n i i L n x nx x

λλλλ=?=?==?=?∑

12. 设总体X 的概率密度为22()

,0(,)0x x f x θθθθ-?<

=???

其它，其中θ>0是未知参数，

12,,...,n X X X 为样本，求1）θ极大似然估计，2）总体均值μ的极大似然估计。

（1）已知密度函数：()()

22,0,0,x x f x θθθθ-?<

=???

其它

则构造似然函数()()()

2,0,,0,n i n

i i x x L x f x θθθθθ==-?<

=???

∏∏

其它取对数()()

()

122

2222ln ,ln

i n i x x x x L x θθθθθθθθθ=----==++???+∏

而

()

()()()

()()()222

2222ln

222222i i i i i i i x x x x x x x θθθθθθθθθθθ

θθθθθθ-?-----=?==?--- 则()()()()1122ln ,0n

i i i i i i x x n L x x x θθθθθθθθ==--?===?--∑∑ 1

222n

i i x n nx n x θθθ=?=?=?=∑

13. 设总体X 的概率密度为2

33,0(,)0x x f x θθθ?<

=???

其它，其中θ>0是未知参数， 12

,X X 为样本。

1）证明：11221227

(),(,)36

T X X T max X X =

+=都是θ的无偏估计。 2）比较12,T T 的有效性。

()()()()()()()()()()()}

{()}{}{}{}

{}{}{()()()11121212

121300

121221212365

1233660

224

1T E T E x x E x E x E x 3

33343

E x E x x ,x E T 434E T T max ,36x 0x f x dx dx u x x

F u P U u P x u P x u P x u x u u u P x u P x u f x dx dx F u F u u θθθθ

θθθθ

θθθθθθ

=+=

+=????????====?=?===≤=≤?≤=≤≤=≤===?=?=<

{2120

E T max ,76U uf u du x x θ

θθ∴===?而

()()()()()()()()()()()()()()()2211222

212130022

2432233002

2122067

E T ,E T 764

2D T D x D x 933D x =D x x-E x x-4333393x-x x -x x 42168043D T 2980304949D T D U x-E U 3636x

f x dx dx

dx dx f x θθθθθθθθθθθθθθθθθ

θ?===+??????==?? ?????????==+= ? ?????

=??=

==????????则也是的无偏估计

而则()()222

301224963x-36748D T >D T T x dx dx θ

θθθ??== ?????故更有效

()()()2

D x x-

E x f x dx +∞

-∞

?????

离散方差公式：

14. 设总体X 服从参数为λ的泊松分布,对于假设01:0.5,

:2H H λλ==，0H 的拒绝域

为12{3}D X X =+≥，试求此检验问题犯第一类错误（弃真）及犯第二类错误（取伪）的

概率。

}{}{}

{

}{}{}

{()()()}{

}{}{

}{}{}{}{00120

212120*********

12P P H H P x x 30.5P P H H P x

x 32x x 214P P x x 30.51P u<30.51P u=0P u=1P u=2111151110!1!2!22

P P x x 3u e e e e e e e λλπλππλλλ-------==+≥===+<==+=+≥==-==---=---=---=-=+<=弃真拒绝成立取伪接受成立由于泊松分布具有可加性，令则弃真时，取伪时弃真取伪}{

}{}{}{012444

4444

2P u=0+P u=1+P u=244448130!1!2!

e e e e e e e -------==++=++= }{()k

P x k e k 0,1,2k λλπλ-==

=???泊松分布：，，记为！

15.考虑一元线性回归模型： 01,1,2,..i i i Y X i n ββε=++=，其中i ε相互独立且服从

2(0,)N σ分布，求参数01,ββ的极大似然估计，并证明它们是无偏估计。

()(

)()(

)()

(

)(

)

(

)

()

22i 01i 12

20101i

2012

1i 1

Y ~x ,,L ,,,x ln L ,,ln ln 2x 2i i n

i i x y n

y i n

y n

i n

i N f x f e

y e

n y n μσμσμσβββσββσ

μββμββσσβ

βσ==--

--=--==+===+∑-=+=---

--=--

∏

∑∑正态分布密度函数构造似然函数：其中则

()()()()()

()

()()()()

()()21

0101i 0

1i 2

01i

01i i 0

1i 22

01i 0111

201i i 01i 1ln L ,,1

2x 1x 12ln L ,,x 1

2x x x 22x 0n x x x x 0n

i i

i i n

i i

i i n i i n i i y y y y y nx n y nx y ββσβββ

ββσσ

ββσβββ

ββσσββββββββ======?=-

---=

--?????=----=

--?????--=+=?

???+?--=??∑∑∑∑∑∑则有()()

()

i i 11i

1012

x x

n n i i i n

i n

i y x

y y y x

βββ====???=??--=

=--∑∑∑∑解得

()

()()

(

)()()()

()

()(

)()()()

(

)()i 11i i i 2

111i 1i i 01i 0i 1i i 111101i 1x 11x x x x 111x x x x x x 10x n i n

n n i i i n i i i i n n n n i i i i i n i i y E E E x y x y E x y lxx lxx x E y lxx lxx lxx x x x lxx βββββββ==========??

--??????

??==---=- ?????????-????

??=-?=-+=-+-????

=?+--∑∑∑∑∑∑∑∑∑∑证明：()

()()

21i 11

0110110

x n i x lxx E E y x E y E x x x βββββββββ=??=-=????=-=-=+-=∑

16. 考虑一元线性回归模型：01,1,2,..i i i Y X i n ββε=++=，其中i ε相互独立且服从

2(0,)N σ分布，记11122121

??{...,,...,}/

n n

n A c Y c Y c Y c c c E βββ==+++=为常数，且，求A 中使得1?()D β最小的1

?β 17. 某种产品在生产时产生的有害物质的重量（单位：克）Y 与它的燃料消耗量（单位：千

克）x 之间存在某种相关关系.由以往的生产记录得到如下数据.

① 求经验线性回归方程；

② 试进行线性回归的显著性检验（01.0=α）； ③ 试求x 0=340时Y 0的预测区间（05.0=α）. ④若要求有害物质的重量在250～280um 之间，问燃料消耗量应如何控制？（05.0=α）

112111n n

i i i i n

n n

i i i i i i i na x b y x a x b x y

=====???

+=?

??????????+= ? ????

???∑∑∑∑∑解：设y=a+bx ，公式

()()

()

i n

i x x y y b x x ==--=

-∑∑

a y bx =-

0.0072b =-得出 ()

i i

i y a bx n δ==--∑ 42.1096a = 2

5.591929

δ= ()()

2t HO b 0H1b 0,1N

=≠检验法：

：，：0；

H0b 0=若成立即则有

()

T t n 2=

()()2

22n

~n 2n 2T t αδχδ???

-≥-=??????

那么有于是P

()0.0056 3.7074T t T ≥≥那么拒绝域即

()()()()()

()()

()

000.0050000002

339.66166 2.4469

y y ,y n 2230.8687,48.4545t n t n αδδδ==-+=--由x =340，根据得到经验回归值y 根据公式查表得：的置信区间为x x x 计算得出置信区间为

()()()()

0000431.5167,49.102531.3007,48.886531.5167,48.8865αα根据第三问可知：

当x =250时，在=0.05时的y 的区间为当x =280时，在=0.05时的y 的区间为所以燃料控制区间为

18在某锌矿的南北两支矿脉中，各抽取样本容量分别为10与9的样本分析后，

算得其样本含锌（%）平均值及方差如下：南支：1x =0.252，21S =0.140，1n =10

北支：2x =0.281，2

2S =0.182，2n =9

若南北两支锌含量均服从正态分布，且两样本相互独立，在α=0.05的条件下，问南北两支矿脉含锌量的平均值是否有显著差异？

已知：2439.0)8,9(975.0=F ，3572.4)8,9(025.0=F ，1098.2)17(025.0=t

()()()()()()120.0252

120.97512

1110.97520.02522F 1,1F 9,8 4.3572

1,1F 9,80.2439

u x x 1

0.95F 9,8u F 9,8x x 1n n n n αα-

--==--==?? ? ???那么有的置信水平为的置信区间为，以为不在该区间内，故南北平均只有显著差异。

19 X 设总体X 的密度函数为 ?????<<=其他

,00,5)(5

θθx x x f ，

θ的先验分布为???<<=其他

,01

0,4)(3θθθπ， n X X ,,1 为来自总体X 的样本。

在平方损失下求θ的贝叶斯估计。

()()()

()()()()()()()()()()()

()()1

00n

i i i n

i i f x f x f x k k k d k d f x d f x d θπθπθπθθπθθθπθθθπθθπθθπθθ

===Θ

======

∏∏∏??∏∏??解：的后验分布为

p p p p

()43355351

13543

00544554n

n n i n

n i i x n d x d θθθθθθθθθ--=-=?? ???==-?? ???∏∏?? ()()()

551

3510

4545455555n n

BE n n k d n d n

θθθθθθθθ

θ--Θ

--==?-=

--??于是平方损失下的贝叶斯估计为：

p 20设有三台机器A 、B 、C 制造同一种产品。对每台机器观察5天的日

产量。记录如下（单位：件） A ： 41，48， 41， 57， 49 B ： 65，57， 54 ，72， 64 C ： 45，51， 48， 56， 48 试问：在日产量上各台机器之间是否有显著差异？（05.0=α），已知：79.3)12,2(05.0=F

()ij i ij

123

12j x H0H1i j a=3n 5i 1,2,34,5n 15A 4148415749B 6557547264C 4551485648

μεμμμμμ=+==≠===解：设日产量为原假设：对立假设：至少有一对，这里，，，， 223

2222

T 113

11796S 4148451114.93

15114

x ij

i j ij

i j x x n n x =====-=++???+-=-==∑∑∑∑总变差其自由度为注：这里

()2223

222

A 1n

i ij j 1

E T A A 1796A S 236312248667.73

515x x a 12

S S S 1114.93667.73447.2

n a 12

S 333.8667

i i i

A A x x n n α===-=++-=-==-=-=-===-∑∑因数效应平方和这里为自由度为误差平方和自由度为S

的均方：MS

()E

E E E 0.050.05S 37.2667n a 333.8667

F 8.958937.2667

2,12 3.798.9589 3.79

H1A i j F F F F ααμμ=

=-=====>=≠S 的均方：MS MS 比：MS 由于但故拒绝原假设H0,接受：说明在日产量上各台机器之间是有显著差异的。 21设),(i i x Y 满足线性模型 i i i x x Y εββ+-+=)(10， ),0(~2σεN i ，

n i ,2,1=，∑==n

i i X n x 1

1，诸i ε相互独立。

试求（1）参数T ),(10βββ=的最小二乘估计T )?,?(?1

0βββ=；（2）1

0?,?ββ的方差；（3）2

σ的无偏估计。

()()

()

()()

()

012

011011

010*********

101n

1Q ,Q ,min Q ,2020

1,n i i i

i i i i i n

i i i n

i i i i i

i i i i

i Y x x Q Y x x Q Y x x Q Y x x x x Y x x Lxy Y Y Lxx

x x ββεββεββββββββββββββ========+-+??

===---??=??

??=----=?????

?????=-----=?????-===

-∑∑∑∑∑∑∑解记要使则使

得：

()()()

()()

()()()()()T

012n 22

2212

2,,112n

3E 2E 22

i i e e e

Lxy Y Lxx Lxy D D D Lxy x x Lxx L xx

L xx L xx D D Y Q Q n n Q n ββββσβσσ

βσσσ=??

∴= ?

??===-= ???==

??-

?-??

-∑参数=的最小二乘估计由定理：=得=即的无偏估计为

22单因素方差分析的数学模型为

i j i j i i j i n j r i N X ,...,2,1;,...,2,1),,0(~,2

==+=σεεμ，

n n i n

i =∑

。诸j i ε相互

独立。（1）试导出检验假设r r H H μμμμμμ,...,,::211210?=== 中至少由两个不相等的统计量。

（2）求2

σ的一个无偏估计量。（3）设μμμμ====r 21，∑==i n j j i i

i X n X 1

，求常数C 使统计量∑=-=r

i i X C 1

||?μσ

为σ的无偏估计.

23车间里有5名工人，3台不同型号的机器生产同一种产品，现在让每个工人轮流在3台机

器上操作，记录其日产量结果如下：

试问这5位工人技术之间和不同型号机器之间对产量有无显著影响？

)84.3)8,4(,46.4)8,2(,05.0(05.005.0===F F α

()()0123A1B012345B1235

22211

222A :0:0,:0:0,116132116132184.4

15118383921613515A i j T ij i j A H i

H x x ab ααααββββββ=====≠=====≠=-=++???+-?++???+==?++-?++?∑∑解：双因数试验，不考虑交互作用，记因数为机器，因数B 为工人，则a=3,b=5假设H 至少有一个H 至少有一个j 则有：S S ()()()2

2222

222110.8

11498349585916132161.07

31584.410.861.0712.53

B e T A B ??+==?++++-?++???+==--=--=S S S S S ()()()()120.050.0510.0520.05F 5.4

A 10.82 5.4 3.447

1.5662515.2675

61.07

15.26759.748

1.56625

E 12.538

1.56625T 84.414

0.05 2.8 4.46, 4.8 3.843.447 2.8 4.46,9.748 4.8 3.84

F F F F F F F F α========<==>=方差分析表：

方差来源平方和自由度均方

值因数因数误差总和对于给定，有因所0B0A 以接受H ，拒绝H ，即不同机器之间对产量无显著影响，而不同工人对产量有显著影响

24设有线性模型

11223344556677

233Y a b Y a b Y a b Y a b Y a b Y a b Y a b εεεεεεε=++=-+=-+=++=-+=++=-+ 其中7654321,,,,,,εεεεεεε相互独立且同服从正态),0(2σN 分布，

（1）试求的最小二b a ,乘估计量b a ?,?；（2）试求b a Y

?5??+=的概率分布。 ()()()()

()()()()12345677

717

7221

1,1,1,1,2,3,3,,20a ,2

17a ,172i i i i i i i i i i i i i i i i i i a bx x x x x x x x Q a b a bx Q a b a bx Q a b a bx x x y x y Lxy Y bx Y b Lxx Lxx x x ε======++==-=-==-==-=--??=---=?

?????=---=???-?=-=-==

-∑∑∑∑∑解：令Y 其中令Y 有

Y Y 由定理可知：

()()()()()()2

221a N N 5512525xx

xx x

n L b

L Y a b a b

x D Y D a D b n L σσσσ

=+=+??+ ?=+=+ ???

（a,(+)）

（b,）

E E E

25某数理统计教师随机地选取18名学生把他们分为3组，每一组各采用一种特殊的教学方

法，期末进行统考，各组成绩如下：

假设学生成绩服从正态分布，试问：在显著水平05.0=α下这三种教学方法的教学效果有无显著差异？哪种教学效果最好？注：70.2)15,2(05.0=F

211

211112222e 1380,108114,r 3n 18

1110811413802134

n 181111

5005103701380644.3

765181669.7644r

ij ij i j i j r

r s T ij ij i j i j A T A X X S X X S S S S F A ============??=-=-?= ???

=?+?+?-?==-=∑∑∑∑∑∑∑∑解：其中，方差分析表：

方差来源平方和自由度样本方差值

因素()()0.050.050322.15

.32322.15 2.894

111.311669.715111.31

2314172,15 2.72.8942,15 2.7

F E T F F F H =

===>=误差总和查表得：因故拒绝，即认为教学方法的教学效果有显著差异。乙种教学方法效果最好。

三、简述题（14分）

1.检验的显著性水平及检验的p 值。

小概率事件的值记为α ，称为显著水平。它是检验犯第一次错误的概率（即弃真错误的概率）检验的P 值是指统计量落入某个区域内的概率，这里某个区域是个拒绝域。 2.参数的点估计的类型、方法、评价方法。（1）点估计（2）区间估计

点估计法：a ，矩估计法。基本思想：由于样品来源于总体，样品矩在一定程度上反映了总体矩，而且由于大数定律可知，样品矩依概率收敛于总体矩。因此，只要总体x 的k 阶原点矩存在，就可以用样本矩作为相应总体矩的估计量，用样本矩的函数作为总体矩的函数的估计量。b ，极大似然估计法。基本思想：设总体分布的函数形式已知，但有未知参数θ,θ可以取很多值，有θ的一切可能取值中选一个使样品观测值出现概率最大的值作为θ的估计量，记作θ，并称为θ的极大似然估计值，这叫极大似然估计法。

3.假设检验的思想、推理依据及参数假设检验的步骤。先假设总体具有某种特征，然后再通过对样品的加工，即构造统计量推断出假设的结论是否合理。假设检验是带有概率性质的反证法。

推理依据：第一，假设检验采用的逻辑方法是反证法；第二，合理与否，依据是小概率事件实际不可能发生的原理。参数假设检验的步骤：（1）提出原假设和备择假设；（2）选择适当的统计量，并确定其分布形式。（3）选择显著性水平α，确定其临界值；（4）作出结论。

4.方差分析的目的及思想（结合单因素）。

目的：通过分析，判定某一因子是否显著，当因子显著时，我们可以绘出每一水平下指标均值的估计，以便找出最好的水平。方差分析是对多个总体均值是否相等这一假设进行检验。思想：检验1μ=2μ= … …γμ是通过方差的比较来确定的，即要考虑均值之间的差异，差异产生来自两个方面，一是由因数中不同水平造成的，称为系统性差异；二是由随机性产生的差异。两方面的差异用两个方差来计量，一个称水平之间的方差（既包括系统因数，又包括随机性因数）；一个称为水平内部方差（仅包括随机因数）。如果不同的水平对结果没有影响，两个方差的比值会接近于1；反之，则两个方差的比值会显著地大于1很多，认为HO 不真，可作出判断，说明不同水平之间存在着显著性差异。

如果方差分析只对一个因数进行单因数方差分析,单因数方差分析所讨论的是在一个总体标准差皆相等的条件下，解决一个总体平均数是否相等的问题。 5.简述正交实验设计中的数据分析方法方法：极差分析法和方差分析法。极差分析法步骤：（1）定指标，确定因数，选水平（2）选用适当的正交表，表头设计，确定实验方案；（3）严格按要求做实验，并记录实验结果；（4）计算i 个因数的每个水平的实验结果和极差（同一因数不同水平的差异），其反映了该因数对实验结果的影响大小；（5）按级差大小排列因数主次；（6）选取较优生产条件（7）进行实验性试验，做进一步分析。方差分析法：思想：将数据的总偏差平方和分解为因数的偏差平方和与随机误差的平方和之和，用各因数的偏差平方和与误差平方和相比，做一下检验，即可判断引述的作用是否显著，这里用方差分析的思想来处理有正交表安排的多因数实验的实验结果，分析各因数是否存在显著影响。

6主成分分析的基本思想。

主成分分析是从总体的多个指标中构造出很少几个互不相关的综合指标，且使这几个综合指标尽可能充分的反映原来各个指标的信息。即主成分分析是一种把原来多个指标化为少数几个互不相关的综合指标的一种统计方法。它的目的是力求数据信息丢失最少的原则下，对高维变量空间进行降维处理。即用原来变量的少数几个线性组合（称为综合变量）来代替原变量，以达到简化数据，揭示变量之间关系和进行统计解释的目的。 7、典型相关分析

答：考虑X 的综合指标（X 的线性函数）与y 的综合指标之间的相关性程度来刻画X 与Y 的相关性，即把两组变量的相关变为两个新变量（线性函数）之间的相关来进行讨论，同时又尽量保留原来变量的信息，或者说，找X 的线性函数和Y 的线性函数，使这两个函数具有最大的相关性。称这种相关为典型相关，称形式的两个线性函数即两个新的变量为典型变量，继而还可以分别找出X 与Y 的第二对线性函数，使其与第一对典型变量不相关，而这两个线性函数之间又具有最大的相关性，如此继续进行下去，直到两组变量X 与Y 之间的相关性被提取完毕为止，这就是典型相关分析的基本思想。总之，典型相关分析是揭示两个因素“集团”之间内部联系的一种数学方法。 8、贝叶斯判别法答：贝叶斯判别是根据先验信息使得误判所造成的平均损失达到最小的判别法。假定对研究对象已有一定的认识，常用先验概率分布来描述这种认识，然后我们取得一个样本，用样本来修正已有的认识（先验概率分布）得到后验概率分布，各种统计推断通过后验概率分布来进行，将贝叶斯思想用于判别分析就得到贝叶斯分布。 9、聚类，分类

答：聚类分析是研究对样品或指标进行分类的一种多元统计方法，分类是将一个观测对象指定到某一类（组）。分类问题可分为两种：一是将一些未知类别的个体正确地归属于另外一些已知类中的某一类，另一种是事先不知道研究的问题应该分为几类，而是根据统计分析建立一种分类方法，并按接近程度对观测对象给出合理的分类，这一类问题即是聚类分析所要解决的问题。

聚类分析根据分类对象的不同分为R型和Q型两大类。R型是对变量（指标）进行分类，Q 型是对样品进行分类；R型聚类分析的目的是（1）可以了解变量间及变量组合间的亲疏关系。（2）对变量进行分类。（3）根据分类结果及它们之间的关系，在每一类中选择有代表性的变量作为重要变量，利用少数几个重要变量进一步作分析计算；Q型聚类分析的目的主要是对样品进行分类。

10、线性回归分析的主要内容及应用中应注意的问题

答：线性回归分析根据预报变量的多少可分为一元线性回归、多元线性回归。主要研究内容包括如何确定响应变量和预报变量之间的回归模型，如何根据样本观测值进行参数估计并检验回归方程和回归系数的显著性；从众多的预报变量中，判断哪些变量对响应变量的影响时显著的，哪些变量的影响是不显著的；根据预报变量的已知值或给定值来估计和预测响应变量的平均值并给出预测精度。

怎样选择自变量，即能使回归方程有高的精确性，又不含非显著因子，这是线性回归分析在应用中应注意的问题。

（1）要从全部因子的所有可能的组合组成的回归方程中，挑选平均残差平方和小，负相关系数大，自变量个数较少的方程，作为方程。

（2）采用逐步回归法。

11、系统聚类法的算法思想及步骤

答：算法思想：（1）首先将每个样品各视为一类，定义类与类之间的距离，将距离最短的两类合并为一个新类（2）再计算新类与其他类之间的距离，将距离最短的两类再合并为一个新类。如此进行下去，直到所有样品全部合并为一个大类为止，最后再根据事先给定的分类临界值，确定分类，一般步骤为：（1）计算样品两两之间的距离；（2）将每个样品各作为一类；（3）将距离最近的两类合并为一个新类；（4）若类的个数等于1，则转向步骤5，否则转向步骤3；（5）记录下全部合并过程，画类聚图；（6）根据给定的分类临界值，确定最终分类结果。

12、如何看待多元统计分析方法在实际数据处理中的作用和地位

答：多元统计分析方法在实际数据处理中有着重要的作用。它不仅可以通过观察值对总体进行参数估计和假设检验，还可以通过相应的方法达到数据化简，分类和研究变量间依赖关系的目的，并能预测变量间关系，提出检验假设等目的。目前在医学、教育学、社会学、地质学、考古学、环境保护等各个领域有极其广泛的作用。

应用数理统计复习题

《应用数理统计》复习题第一章概率知识一、一袋中有5个球，编号1、2、3、4、5. 现从中任取3个，以X 表示所取球的号码的最大值，求X 的概率分布律. 解：X 的可能取值为3、4、5， 1.010 1 }3{35 33== ==C C X P ， 3.0103 }4{352311====C C C X P ， 6.010 6 }5{35 2411== = =C C C X P ，故X 的概率分布律为 6 .03.01.05 43k p X . 二、设连续型随机变量X 的密度函数为?? ?<≤=., 0, 10,)(其它x Ax x f （1）求常数A ；（2）求X 的分布函数)(x F . 解：（1）由完备性：? ∞+∞ -=1)(dx x f ，有 11 =?Ax , 解得2=A . （2）t d t f x F x ?∞ -=)()( 当0≤x 时， 0)(}{)(?∞ -==≤=x dt t f x X P x F ，当10≤x 时，1)(=x F . 所以 .1,10,0,1,,0)(2 >≤<≤?? ???=x x x x x F 三、设X 的概率密度为 ????? ≤ ≤-=其它, 022,cos )(ππx x C x f ， 1、求常数C ； 2、均值EX 和方差DX . 解：1、由完备性，C xdx C dx x f 2cos )(122 ?? -∞ ∞ -=== π π， 2 1 = ∴C ；

2、0cos 21 )(22 ??∞ ∞--===π πxdx x dx x xf EX ； ???∞ ∞---====22202 2 22 2 14cos cos 21)(πππ πxdx x xdx x dx x f x EX ; 14 )(2 2 2-= -=∴πEX EX DX . 四、若随机(X ,Y )在以原点为中心的单位圆上服从均匀分布，证明X ,Y 不相互独立. 解：依题意有(X ,Y )的概率密度为221/, 1; (,)0, x y f x y π?+≤=??其它. . 故 11, 11()(,)0, 0, X x x f x f x y dy +∞ -∞ ?-≤≤-≤≤?===????? ? 其它其它; 同理 11()0, Y y f y -≤≤=??其它 . 于是(,)()()X Y f x y f x f y ≠, X 与Y 不相互独立. 五、设X 的概率密度为? ? ?≤≤+=.,0,10,)(其它x bx a x f ，且已知EX =127求DX . 解：由概率密度的完备性有： 1= ?? += ∞+∞ -1 d )(d )(x bx a x x f =b a 5.0+, 且有12 7 =EX = ? ? += ∞+∞ -10 d )(d )(x bx a x x x xf = 3 2b a +, 联立上述两式解得: 1,5.0== b a 又= )(2X E 12 5 d )5.0(1 02= +? x x x , 于是 =DX =-22)()(EX X E 2)12 7(125-14411=. 六、1．设随机变量)3,2(~2 N X ，)()(C X P C X P >=<，则=C （ A ）. A . 2 B . 3 C . 9 D . 0 2. 设随机变量),(~2 σμN X ，则随σ增大，}|{|σμ<-X P ( C ). (A) 单调增大； (B) 单调减小； (C) 保持不变； (D) 增减不定

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析（第一次作业）学院：机械工程及自动化学院姓名：学号： 2014年12月

逐步回归法在AMHS物流仿真结果中的应用摘要：本文针对自动化物料搬运系统 (Automatic Material Handling System，AMHS)的仿真结果，根据逐步回归法，使用软件IBM SPSS Statistics 20，对仿真数据进行分析处理，得到多元线性回归方程，建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型，并对影响年产量箱数的显著性因素进行了分析，介绍了基本假设检验的情况。关键词：逐步回归；残差；SPSS；AMHS；物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入／移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言回归被用于研究可以测量的变量之间的关系，线性回归则被用于研究一类特殊的关系，即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域，包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下，计算各个自变量x与因变量y之间的相关性，并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一，目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution，意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能，而且用它处理正交试验设计中的数据程序简单，分析结果明了。基于以上优点，SPSS已经广泛应用于自然科学、社会科学中，其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”，在庆安集团新建的320厂房建立自动化物料搬运系统（AMHS），使用生产仿真软件EM-Plant对该系统建模并仿真，设计实验因子及各水平如表1-1，则共有3*4*6=72组实验结果，如表所示。为方便描述，将各因子定义为：X1表示AGC物料交换服务水平，X2表示周转箱交换周期，X3表示EMS数量，Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

应用数理统计试题库

一填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本， 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时，CY 服从2χ分布。 2 设统计量)(~n t X ，则~2X F(1,n) ， ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本，当常数C = 1/2（n-1）时， ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=，),,2,1)(,(n i y x i i =为观测数据。对于固定的0x ，则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5．设总体X 服从参数为λ的泊松分布，，2，2，，为样本，则λ的矩估计值为?λ ＝。 6．设总体2 12~(,),,,...,n X N X X X μσ为样本，μ、σ2 未知，则σ2的置信度为1－α的置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7．设X 服从二维正态),(2∑μN 分布，其中??? ? ??=∑??? ? ??=8221, 10μ 令Y ＝X Y Y ???? ??=???? ??202121，则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8．某试验的极差分析结果如下表（设指标越大越好）：表2 极差分析数据表

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析（第一次作业）学院：机械工程及自动化学院姓名：学号： 2014年12月

逐步回归法在AMHS物流仿真结果中的应用摘要：本文针对自动化物料搬运系统(Automatic Material Handling System，AMHS)的仿真结果，根据逐步回归法，使用软件IBM SPSS Statistics 20，对仿真数据进行分析处理，得到多元线性回归方程，建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型，并对影响年产量箱数的显著性因素进行了分析，介绍了基本假设检验的情况。关键词：逐步回归；残差；SPSS；AMHS；物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入／移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

应用数理统计试题

应用数理统计复习题 1.设总体~(20,3)X N ，有容量分别为10，15的两个独立样本，求它们的样本均值之差的绝对值小于0.3的概率. 解：设两样本均值分别为,X Y ，则1~(0,)2 X Y N - (||0.3)(0.424)(0.424)0.328P X Y -<=Φ-Φ-= 其中(01)θθ<<为未知参数，已知取得了样本值1231,2,1x x x ===，求θ的矩估计和最大似然估计. 解：（1）矩估计：2 2 22(1)3(1)23EX θθθθθ=+?-+-=-+ 14 (121)33 X =++= 令EX X =，得5?6 θ=. （2）最大似然估计： 2 2 5 6 ()2(1)22L θθθθθθθ=??-=- 45ln() 10120d d θθθθ=-= 得5?6 θ= 3. 设某厂产品的重量服从正态分布，但它的数学期望μ和方差2 σ均未知，抽查10件，测得重量为i X 斤10,,2,1Λ=i 。算出 10 11 5.410i i X X ===∑ 10 21 () 3.6i i X X =-=∑ 给定检验水平0.05 α=，能否认为该厂产品的平均重量为5.0斤？附：t 1-0.025(9)=2.2622 t 1-0.025(10)=2.2281 t 1-0.05(9)=1.8331 t 1-0.05(10)=1.8125 解: 检验统计量为0 | |/X T S n m -=

将已知数据代入，得2t = = 1/2 0.975(1)(9) 2.26222t n t a - -==> 所以接受0H 。 4. 在单因素方差分析中，因素A 有3个水平，每个水平各做4次重复实验，完成下列方差分析表，在显著水平0.05α=下对因素A 是否显著做检验。解： 0.95(2,9) 4.26F =，7.5 4.26F =>，认为因素A 是显著的. 5. 现收集了16组合金钢中的碳含量x 及强度y 的数据，求得 0.125,45.7886,0.3024,25.5218xx xy x y L L ====，2432.4566yy L =. （1）建立y 关于x 的一元线性回归方程01 ???y x ββ=+；（2）对回归系数1β做显著性检验（0.05α=）. 解：（1）1 25.5218 ?84.39750.3024 xy xx l l β== = 01 ??35.2389y x ββ=-= 所以，?35.238984.3975y x =+ （2）1?2432.456684.397525.5218278.4805e yy xy Q l l β=-=-?= 2 278.4805 ?19.8915214 e Q n σ ===- ? 4.46σ ==

应用数理统计大作业1——逐步回归法分析终

应用数理统计大作业1——逐步回归法分析终 -标准化文件发布号：（9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

应用数理统计多元线性回归分析（第一次作业）学院：机械工程及自动化学院姓名：学号： 2014年12月

逐步回归法在AMHS物流仿真结果中的应用摘要：本文针对自动化物料搬运系统 (Automatic Material Handling System，AMHS)的仿真结果，根据逐步回归法，使用软件IBM SPSS Statistics 20，对仿真数据进行分析处理，得到多元线性回归方程，建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型，并对影响年产量箱数的显著性因素进行了分析，介绍了基本假设检验的情况。关键词：逐步回归；残差；SPSS；AMHS；物流仿真

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009－2010年度上学期研究生公共课《应用数理统计》期末考试试题（每题25分，共计100分）（请将答案写在答题纸上） 1设X 服从),0(θ上的均匀分布，其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本，（1）求θ的矩估计量1?θ和最大似然估计量2 ?θ；（2）讨论1?θ、2?θ的无偏性，1?θ、2?θ是否为θ的无偏估计量？若不是，求使得i c ?i i c θ为θ的无偏估计量，； 1,2i =（3）讨论1?θ、2 ?θ的相合性；（4）比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家，为考查产品性能的差异，现从甲乙两厂产品中分别抽取了8件和9件产品，测其性能指标X 得到两组数据，经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=，（1）．在显著性水平0.10α=下，能否认为2212σσ=？（2）．求12μμ?的置信度为90%的置信区间，并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知，样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

（1）求2211 (n i i X )μσ=?∑的分布；（2）若0μ=，求212212()() X X X X +?的分布；（3）方差的置信度为12σα?的置信区间的长度记为L ，求()E L ；（4）1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位：粒)与温度x （单位：）的关系, 得到资料如下： C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算：26.43x =，ln 3.612y =，，， 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑（1）求Y 对x 的曲线回归方程； x b e a y ???=（2）求的无偏估计； 2σ2?σ （3）对回归方程的显著性进行检验（05.0=α）；（4）求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据： 0.02282z =，()()0.050.057,8 3.50,8,7 3.73F F ==，()0.0515 1.7531t =，，，，0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =，0.05(1,5) 6.61F =， 0.05(1,7) 5.59F =

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析摘要篮球运动中，球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握，若能得到某位球员的上场时间与场上得分的数据关系，将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究，对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归，得到得分与出场时间的一元线性回归直线，并对显著性进行评估和进行区间预测。正文一、问题描述随着2002年姚明加入NBA，越来越多的中国人开始关注篮球这一项体育运动，并使得篮球运动大范围的普及开来，尤其是青年学生。本着学以致用的原则，希望将所学理论知识与现实生活与个人兴趣相结合，若能通过建立相应的数理统计模型来做相应的分析，并且从另外一个角度解析篮球，并用以指导篮球这一项运动的更好发展，这也将是一项不同寻常的探索。篮球运动中，得分是取胜的决定因素，若要赢得比赛，必须将得分超出对手，而影响一位球员的得分的因素是多样的，例如：情绪，状态，体力，伤病，上场时间，防守队员等诸多因素，而上场时间作为最直接最关键的因素，其对球员总得分的影响方式有着重要的研究意义。倘若知道了其分布规律，则可从数量上掌握得分与上场时间复杂关系的大趋势，就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。因此，本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析，并对显著性进行评估，以巩固所学知识，并发现自己的不足。二、数据描述抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录（原始数据见附录），剔除掉其中没有上场的部分数据，得到有参考实用价值的数据如表2.1所示：

北航2010应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题（每小题3分，共15分） 1，设总体X 服从正态分布(0,4)N ，而12 15(,,)X X X 是来自X 的样本，则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解：(10,5)F ． 2，?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解：??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==． 3，分布拟合检验方法有_______ 与____ ___. 解：2 χ检验、柯尔莫哥洛夫检验． 4，方差分析的目的是_______ . 解：推断各因素对试验结果影响是否显著． 5，多元线性回归模型=+Y βX ε中，β的最小二乘估计?β的协方差矩阵?βCov()=_______ . 解：1?σ-'2Cov(β) =()X X ．二、单项选择题（每小题3分，共15分） 1，设总体~(1,9)X N ，129(,, ,)X X X 是X 的样本，则___B___ . （A ） 1~(0,1)3X N -；（B ）1 ~(0,1)1X N -；（C ） 1 ~(0,1) 9X N -；（D ~(0,1)N ． 2，若总体2(,)X N μσ，其中2σ已知，当样本容量n 保持不变时，如果置信度1α-减小，则μ的置信区间____B___ . （A ）长度变大；（B ）长度变小；（C ）长度不变；（D ）前述都有可能. 3，在假设检验中，就检验结果而言，以下说法正确的是____B___ . （A ）拒绝和接受原假设的理由都是充分的；（B ）拒绝原假设的理由是充分的，接受原假设的理由是不充分的；（C ）拒绝原假设的理由是不充分的，接受原假设的理由是充分的；（D ）拒绝和接受原假设的理由都是不充分的. 4，对于单因素试验方差分析的数学模型，设T S 为总离差平方和，e S 为误差平方和，A S 为效应平方和，则总有___A___ .

应用数理统计复习题Word版

应用数理统计复习题一、填空题 1.设总体2 12~(,),,,...,n X N X X X μσ为样本，样本均值及样本方差分别为， 2 211 11,()n n i i i i X X S X X n n ====-∑∑，设112,,...n n X X X X +与独立同分布，则统计量 ~Y = 。 2.设2 1 ~(),~T t n T 则。 3.设总体X 的均值为μ，12,,...,n X X X 为样本，当a = 时，E 21 ()n i i X a =-∑达到最小值。 4. 设总体2 12~(,),,,...,n X N X X X μσ为样本，1 ||,()n i i D X E D μ== -=∑则 5.设总体X 的均值和方差分别为a , b , 样本均值及样本方差分别为 2 211 11,()n n i i i i X X S X X n n ====-∑∑，则 E (S 2 )= 。 6.在总体~(5,16)X N 中随机地抽取一个容量为36的样本，则均值 X 落在4与6 之间的概率 = 6. 设总体X 服从参数为λ的泊松分布，1.9，2，2，2.1， 2.5为样本，则λ的矩估计值为?λ ＝。 7. 设总体2 12~(,),,,...,n X N X X X μσ为样本，1 2 21 1 ?()n i i i c X X σ -+==-∑，若2?σ 为2σ的无偏估计，则 c = 。 8. 设总体12~(,1),,,...,n X U X X X θθ+为样本，则θ的矩估计量为，极大似然估计量为。

9. 设总体2 12~(,),,,...,n X N X X X μσ为样本，μ未知，σ2 已知，为使μ的置信度为1 －α的置信区间长度不超过L ，则需抽取的样本的容量n 至少为。 10. 设总体2 12~(,),,,...,n X N X X X μσ为样本，μ、σ2 未知，则σ2 的置信度为1－α的置信区间为。 11设X 服从二维正态),(2∑μN 分布，其中??? ? ??=∑???? ??=8221,10μ 令Y ＝X Y Y ??? ? ??=? ??? ??202121，则Y 的分布为 (要求写出分布的参数) 12. 设总体X 在区间]1,[+θθ上服从均匀分布，则θ的矩估计 =θ? ；=)?(θD 。 13. 设n X X ,,1 是来自正态总体),(2σμN 的样本，2 ,σμ均未知，05.0=α. 则μ的置信度为α-1的置信区间为；若μ为已知常数，则检验假设 ,::2 0212020σσσσ

北航数理统计期末考试题

材料学院研究生会学术部 2011 年12 月 2007-2008学年第一学期期末试卷一、(6 分，A 班不做)设x1，x2，?，x n是来自正态总体N( , 2) 的样本，令 2(x1 x2) T (x3 x4)2 (x5 x6)2 ，试证明T 服从t-分布t(2) 二、( 6 分， B 班不做 ) 统计量F-F(n,m) 分布，证明 1的 (0< <1)的分位点x 是1。 F F1 (n,m) 。三、(8分)设总体X 的密度函数为其中1，是位置参数。x1，x2，?，x n是来自总体X 的简单样本，试求参数的矩估计和极大似然估计。四、(12分)设总体X 的密度函数为 1x exp ，x p(x; ) 0 , 其它其中, 已知，0, 是未知参数。x1，x2，?，x n 是来自总体X 的简单样本。

1)试求参数的一致最小方差无偏估计； 2) 是否为的有效估计？证明你的结论。五、(6分，A 班不做)设x1，x2，?，x n是来自正态总体N( 1, 12) 的简单样本，y1，y2，?，y n 是来自正态总体N( 2, 22) 的简单样本，且两样本相互独立，其中1, 12, 2, 22是未知参数，1222。为检验假设H0 : 可令z i x i y i, i 1,2,..., n ,1 2 , 1 2, H1 : 1 2, 则上述假设检验问题等价于H0 : 1 0, H1: 1 0,这样双样本检验问题就变为单检验问题。基于变换后样本z1，z2，?，z n，在显著性水平下，试构造检验上述问题的t-检验统计量及相应的拒绝域。六、(6 分，B 班不做)设x1，x2，?，x n是来自正态总体N( 0, 2) 的简单样本，0 已知，2未知，试求假设检验问题 H0: 202, H1: 202的水平为的UMPT。七、(6 分)根据大作业情况，试简述你在应用线性回归分析解决实际问题时应该注意哪些方面？八、(6 分)设方差分析模型为总离差平方和试求E(S A ) ，并根据直观分析给出检验假设H0 : 1 2 ... P 0的拒绝域形式。九、(8分)某个四因素二水平试验，除考察因子A、B、C、D 外，还需考察 A B ，B C 。今选用表L8(27 ) ，表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

北航应用数理统计大作业多元线性回归

多元线性回归分析摘要：本文查找2011年《中国统计年鉴》，取我国31个省市自治区直辖市2010年的数据，利用SPSS软件对影响居民消费的因素进行讨论构造线性回归模型。并对模型的回归显著性、拟合度、正态分布等分别进行检验，最终得到最优线性回归模型，寻找影响居民消费的各个因素。关键字：回归分析；线性；相关系数；正态分布 1. 引言变量与变量之间的关系分为确定性关系和非确定性关系，函数表达确定性关系。研究变量间的非确定性关系，构造变量间经验公式的数理统计方法称为回归分析。回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程，这一数学表达式通常称为经验公式。一方面，研究者可以利用概率统计知识，对这个经验公式的有效性进行判定；另一方面，研究者可以利用经验公式，根据自变量的取值预测因变量的取值。如果是多个因素作为自变量的时候，还可以通过因素分析，找出哪些自变量对因变量的影响是显著的，哪些是不显著的。回归分析目前在生物统计、医学统计、经济分析、数据挖掘中得到了广泛的应用。通过对训练数据进行回归分析得出经验公式，利用经验公式就可以在已知自变量的情况下预测因变量的取值。实际问题的控制中往往是根据预测结果来进行的，如在商品流通领域，通常用回归分析商品价和与商品需求之间的关系，以便对商品的价格和需求量进行控制。本文查找2011年《中国统计年鉴》，取我国31个省市自治区直辖市2010年的数据，利用SPSS软件对影响居民消费的因素进行讨论构造多元线性线性回归模型。以探求影响居民消费水平的各个因素，得到最优线性回归模型。随后，我们对模型的回归显著性、拟合度、正态分布等分别进行检验，以考察线性回归模型的可信度。本文将分为5章进行论述。在第2章，我们介绍多元线性回归模型的概念。第3章，我们进行模型的建立与数据的收集和整理。我们在第4章对数据进行处理，得出多元线性回归模型，并对其进行检验。在第5章，我们进行总结。2.预备知识 2.1 回归分析回归分析研究的主要对象是客观事物变量间的统计关系，它是建立在对客观事物进行大量试验和观察的基础上，用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的统计方法。回归分析方法是通过建立统计模型研究变量间相互关系的密切程度、结构状态及进行模型预测的一种有效的工具。

应用数理统计试题

应用数理统计复习题 1.设总体，有容量分别为10，15的两个独立样本，求它们的样本均值之差的绝对值小于0.3的概率. 解：设两样本均值分别为，则 2. 设总体具有分布律 1 2 3 其中为未知参数，已知取得了样本值，求的矩估计和最大似然估计. 解：（1）矩估计：令，得. （2）最大似然估计：得 3. 设某厂产品的重量服从正态分布，但它的数学期望和方差均未知，抽查10件，测得重量为斤。算出给定检验水平，能否认为该厂产品的平均重量为5.0斤？附：t1-0.025(9)=2.2622 t1-0.025(10)=2.2281 t1- 0.05(9)=1.8331 t1-0.05(10)=1.8125 解: 检验统计量为

将已知数据代入，得所以接受。 4. 在单因素方差分析中，因素有3个水平，每个水平各做4次重复实验，完成下列方差分析表，在显著水平下对因素是否显著做检验。来源平方和自由度均方和F比因素 4.2 误差 2.5 总和 6.7 解：来源平方和自由度均方和F比因素 4.2 2 2.1 7.5 误差 2.5 9 0.28 总和 6.7 11 ，，认为因素是显著的. 5. 现收集了16组合金钢中的碳含量及强度的数据，求得，. （1）建立关于的一元线性回归方程；（2）对回归系数做显著性检验（）. 解：（1）所以，（2）

拒绝原假设，故回归效果显著. 6.某正交试验结果如下列号试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 （1）找出对结果影响最大的因素；（2）找出“算一算”的较优生产条件；（指标越大越好）（3）写出第4号实验的数据结构模型。解：列号试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 ⅠⅡR 29.79 25.36 32.0 30.86 35.29 28.65 1.07 9.9 3.35 （1）对结果影响最大的因素是B；（2）“算一算”的较优生产条件为（3） 4号实验的数据结构模型为，

北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判别分析应用数理统计第二次大作业学院名称学号学生姓名摘要我国幅员辽阔，由于人才、地理位置、自然资源等条件的不同，各地区的财政收入类型各自呈现出不一样的发展趋势，通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文以中国各地财政收入情况为研究对象，从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因

变量，选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源（资产）有偿使用收入11个可能影响中国各地财政收入的因素为自变量，利用统计软件SPSS，对27个地区的财政收入进行了聚类分析，并对另外4个地区的财政收入进行了判别分析，并最终确定了中国各地区根据财政收入类型的分类情况。关键词：聚类分析，判别分析，SPSS，中国各地财政收入类型 1、引言财政收入，是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内（一般为一个财政年度）所取得的货币收入。财政收入是衡量一国政府财力的重要指标，政府在社会经济活动中提供公共物品和服务的范围和数量，在很大程度上决定于财政收入的充裕状况。通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文利用统计软件SPSS，根据各地区的财政收入情况，对北京、天津、河北等27个地区进行聚类分析，并对青海、重庆、四川、贵州4个省市进行判别分析，判断属于聚类分析结果中的哪种财政收入类型。 1.1 聚类分析聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称，它直接比较各事物之间的性质，将性质相近的归为一类，将性质差别较大的归入不同的类。本文采用的是系统聚类分析，它又称集群分析，是聚类分析中应用最广的一种方法，其基本思想是：首先将每个聚类对象看作一类，然后根据对象间的相似程度，将相似程度最高的两类进行合并，并计算合并后的类与其他类之间的距离，再选择相近者进行合并，每合并一次减少一类，直至所有的对象都并为一类为止。系统聚类分为Q型聚类和R型聚类两种：Q型聚类是对样本进行聚类，它使具有相似特征的样本聚集在一起，使差异性大的样本分离开来；R型聚类是对变量进行聚类，它使差异性大的变量分离开来，相似的变量聚集在一起，这样就

数理统计大作业

数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学 2014年12月

目录 (2) 前言 (3) 一、采集样本数据整理及SPSS统计软件的实现 (4) 1.1、数据的收集方法及说明 (4) 1.2、数据整理：给出频数、频率分布表及偏度和峰度 (4) 1.3、画出直方图和折线图 (6) 1.4、经验分布函数和图形 (6) 1.5、各种概率分布 (7) 二、给出总体分布的参数估计 (12) 2.1、矩估计法 (12) 2.2、最大似然估计 (12) 2.3、参数区间估计 (13) 三、参数的假设检验 (16) 3.1. 样本统计数据的t检验 (16) 3.2样本统计数据的2χ检验 (17) 四、非参数假设检验（ 2 χ拟合优度检验） (18) 4.1、2χ拟合优度检验 (18) 五、结论 (20) 参考文献 (21)

数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等，对科技前沿和国民经济重大问题和复杂问题，以及社会和政府中的大量问题，如何对数据进行推理，以便对问题进行推断或预测，从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展，数理统计的作用在国民生活中越来越重要，特别是现在随着大数据的时代来临，迫切的需要我们对大量数据的处理能力，当然这些大量的数据不可能用人工计算，有很多可以实际应用的数理统计软件，这次大作业我使用的是SPSS软件。由于数理统计是一门实用性极强的学科，在学习中要紧扣它的实际背景，理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据，并根据处理的结果作出合理的统计推断，该结论的可靠性有多少要有一个总体的思维框架，这样，学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望，就要考虑到：1.如何寻求合适的估计量的途径，2.如何比较多个估计量的优劣。这样，针对1按不同的统计思想可推出矩估计和极大似然估计，而针对2又可分为无偏估计、有效估计、相合估计，因为不同的估计名称有着不同的含义，一个具体估计量可以满足上面的每一个，也可能不满足。掌握了寻求估计的统计思想，具体寻求估计的步骤往往是“套路子”的，并不困难，然而如果没有从根本上理解，仅死背套路子往往会出现各种错误.

应用数理统计复习题(2014)

应用数理统计复习题（2014）一填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本， 26542321)()(X X X X X X Y +++++=。当常数C = 时，CY 服从2χ分布。 2 设统计量)(~n t X ，则~2 X ， ~1 2X 。 3 设n X X X ,,,21 是总体),(~2σu N X 的一个样本，当常数C = 时， ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=，),,2,1)(,(n i y x i i =为观测数据。对于固定的0x ，则0x βα+~ 。 5．设总体X 服从参数为λ的泊松分布，1.9，2，2，2.1， 2.5为样本，则λ的矩估计值为?λ ＝。 6．设总体212~(,),,,...,n X N X X X μσ为样本，μ、σ2 未知，则σ2的置信度为1－α的置信区间为。 7．设X 服从二维正态),(2∑μN 分布，其中??? ? ??=∑???? ??=8221,10μ 令Y ＝X Y Y ???? ? ?=???? ??202121，则Y 的分布为 (要求写出分布的参数) 8．某试验的极差分析结果如下表（设指标越大越好）：表1 因素水平表表2 极差分析数据表

则（1）较好工艺条件应为。（2）方差分析中总离差平方和的自由度为。（3）上表中的第三列表示。 9．为了估计山上积雪溶化后对河流下游灌溉的影响，在山上建立观测站，测得连续10年的观测数据如下表（见表3）。表3 最大积雪深度与灌溉面积的10年观测数据则y 关于x 的线性回归模型为 x y 813.1356.2?+= 10设总体12~(,1),,,...,n X U X X X θθ+为样本，则θ的矩估计量为，极大似然估计量为。 11设总体2 12~(,),,,...,n X N X X X μσ为样本，μ、σ2 未知，则σ2的置信度为1－α的置信区间为。

应用数理统计试题库

应用数理统计复习题

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计试题库

应用数理统计大作业1——逐步回归法分析终

应用数理统计试题

应用数理统计大作业1——逐步回归法分析终

应用数理统计(武汉大学研究生)2009-2010试题

重庆大学研究生数理统计大作业

北航2010应用数理统计考试题及参考解答

最新北航数理统计大作业-多元线性回归

应用数理统计复习题Word版

北航数理统计期末考试题

北航应用数理统计大作业多元线性回归

应用数理统计试题

北航-数理统计大作业

数理统计大作业

应用数理统计复习题(2014)

相关文档

最新文档