22121212121
~(,),(,),(,),,
1X N X x x x x x x ρμμμμσρ
??
∑==∑=
???
+-1、设其中则Cov(,)=____.
10
31
2~(,),1,,10,()()_________i i i i X N i W X X μμμ='
∑=--∑、设则=服从。
()1
2
34
433,4
92,
3216___________________
X x x x R -?? ?'==-- ?
?-?
?
=∑、设随机向量且协方差矩阵则它的相关矩阵
4、
__________, __________,
________________。
215,1,
,16(,),(,)
15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,
2142X x x x N x x x x x μμ-??
?'=∑=-∑=-- ? ?-??
-??
+ ???
、设其中试判断与是否独立?
(),
1
2
3设X=x x x 的相关系数矩阵通过因子分析分解为
211X h =
的共性方差111X σ=
的方差21X g =
1公因子f 对的贡献1213
30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320
13
R ?
?
- ?????
?
-?? ? ?
?=-=-+ ? ? ? ??? ? ? ????? ?
???
11262(90,58,16),82.0 4.3107
14.62108.946460.2,(5)( 115.6924)14.6210 3.172
37.14.5X S μ--'=-?? ?==-- ? ???0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
其中0.010.010.0137608.946437.376035.5936(0.01,(3,2)99.2,(3,3)29.5,(3,4)16.7)
F F F α?? ?
?
?-?
?
====
12124122411362190.5,(21),(12)35q q C e C e Bayes X μμ??????
==∑=∑=∑= ? ? ?
??????
====??
= ???12、设已知有两正态总体G 与G ,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?
1234411(,,,)~(0,),01
11T
X X X X X N ρρρρ
ρρρρρρρ
ρρ?? ?
?=∑∑=<≤ ? ???
4、设,协方差阵
(1) 试从Σ出发求X 的第一总体主成分;
(2) 试问当 取多大时才能使第一主成分的贡献率达95%以上。
1212111221225(,),(,),100
000010.950()00.95
100
00100T T X X X X Y Y X Z Y Z ??
=== ???
?? ?
∑∑?? ?=∑==?? ?∑∑?? ?
??、设为标准化向量,令且其协方差阵
V ,求其第一对典型相关变量和它们的典型相关系数?
1,
()X E XX μμμ∑''=∑+、设随机向量的均值向量、协方差矩阵分别为、试证:。
ρ
'2~(,),,~(,)P r X N N A b A A μμ??∑+∑r p r 1、设随机向量又设Y=A X+b 试证:Y 。
1、0
2、W 3(10,∑)
3、2113
4211361114
6
R ??-
? ? ?=-
- ? ? ?- ???
4、0.872 1 1.743
5、T 2(15,p )或(15p/(16-p))F (p ,n-p )
2312131231112213312121,2,100210212100011
022*********
02x x y y x x x x x x y x x y x x x y E y y V y -??
==+ ???
-???????? ? ? ?== ? ? ? ??? ? ? ?
+?????????????? ??? ?
== ? ??? ?
?? ??? ?-??????
-???? ?=- ? ??? ??
?、令则
01-10
1-101-11234411002141021061661620162040210616(1,61620)
3162040y y N ???? ???
- ??? ???-????
--?? ?=- ? ?-??
--????
? ?- ? ? ? ?--????
01-1故,的联合分布为故不独立。
010
01121000.02::8.02.2,
1.54.310714.62108.9464(23.13848)14.6210 3.17237.37608.946437.376035.5936()()
670.0741420.445
H H X S T n X S X F μμμμμμμ---=≠-??
?-= ? ?-??
-??
?
=-- ? ?-??'=--=?=0、假设检验问题:,经计算可得:构造检验统计量:由题目已知1001
0.01(3,3)29.535
(3,3)147.5
3
0.012T F H α=?===2.0
,由是
所以在显著性水平下,拒绝原设即认为农村和城市的周岁男婴上述三个指标的均值有显著性差异
11121221121233
21()
()exp[()()]exp(424)
()3912421
1?(),,()411624283(1|2)
,()exp(2)5(2|1)35T Bayes f x W x x x x f x q C d e W x d e q C X μμμμμμμμ--==-∑-≈++--??????????=
+=∑=-=-= ? ? ? ? ?-??????????
??====<=????
??
?=??3、由判别知其中,2
G ∈??
121341123114013,
11
11101111112222111222x x x x Z X X X λρρρρλρρ
λρρρλρρρρλλλλρ
λρ
ρρρλρρλρ
ρλρρρρλλ--------==+--------===-----???? ?
?---- ?
?= ?---- ? ?
?----????'
?? ?
??
=++1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分4
111
2
1395%
40.95410.933
3
X λρ
λλλλρ++=≥+++?-≥≈234(2)第一个主成分的贡献率为
得
1
12
2
11221112
2
111222
2111
22120.1010,0100.10.100
01000.950.1000010.95000.01000100.90250
00.902500.90250.9025,T
T TT TT λλλ
λλλ-????∑∑ ? ?????
=∑∑∑∑∑????????????= ????????? ?????????????
-==--?=-
--
-
5、由题得===求的特征值,得2111121111111122211
1211
1100.950
00.9025,00.90250.100001111000.9501100.100100.95,0.54,0.95T TT e e e V X W Y V W λαβλαρ---=?=??= ???
??????=∑== ??? ???????
=∑∑????????== ????? ?????????===的单位正交化特征向量为第一典型相关变量,且()为一对典型相关系数。
1()[()()]
()()()()()V X E X EX X EX E XX EX EX E XX E XX μμμμ'∑=--''
=-''=-''
=∑+、证明:=故
'
'2()()()()()()~(,)r Y E Y E AX b AE X b A b
V Y V AX b AV X A A A Y N A b A A μμ=+=+=+'=+==∑+∑、证明:由题可知服从正态分布,
故。
一、填空题:
1、多元统计分析是运用 数理统计 方法来研究解决 多指标 问题的理论和方法.
2、回归参数显著性检验是检验 解释变量 对 被解释变量 的影响是否著.
3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q 型 聚类和 R 型 聚类。
4、相应分析的主要目的是寻求列联表 行因素A 和 列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为 公共因子 ,另一部分为 特殊因子 。
6、若()
(,),P x N αμα∑=1,2,3….n 且相互独立,则样本均值向量x 服从的分布为
_x ~N(μ,Σ/n)_。 二、简答
1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A 和B ,其中因素A 包含r 个水平,因素B 包含c 个水平。对这两组因素作随机抽样调查,得到一个rc 的二维列联表,记为 。要寻求列联表列因素A 和行因素B 的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。
3、简述费希尔判别法的基本思想。
从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数:
确定的原则是使得总体之间区别最大,而使每个总体部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ
0p H =ΣI : /2
/21exp 2np n e tr n λ????
=-?? ?
????
S S
00p H =≠ΣΣI : /2
/2**1exp 2np n e tr n λ????
=-?? ?
????
S S
检验12k ===ΣΣΣ012k H ===ΣΣΣ:
统计量/2/2
/2
/2
1
1
i i k
k
n n pn np k i
i
i i n
n
λ===∏∏S
S
6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。 设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。
(1). 最短距离法
,min
i k j r
kr ij X G X G D d ∈∈=
min{,}kp kq D D =
(2)最长距离法
,max
i p j q
pq ij X G X G D d ∈∈=
,max
i k j r
kr ij X G X G D d ∈∈=
max{,}kp kq D D =
(3)中间距离法
其中