搜档网
当前位置:搜档网 › SPSS因子聚类案例分析报告

SPSS因子聚类案例分析报告

SPSS因子聚类案例分析报告
SPSS因子聚类案例分析报告

S P S S因子聚类案例分析

报告

GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

喀什大学实验报告

《多元统计分析SPSS》

实验报告

实验课程:基于SPSS的数据分析

实验地点:现代商贸实训中心实验室名称:经济统计实验室

学院: xxx学院年级专业班: xxx班

学生姓名: xxx 学号: 20131808015 完成时间: 2016年x月x日

开课时间: 2016 至 2017 学年第 1 学期

实验项目:中国上市银行竞争力分析

(一)实验目的

本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。

(二)实验资料

通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。

具体数据如下所示:

十家同类型上市商业银行2012年指标

(三)实验步骤

1、选择菜单

2、选择参与因子分析的变量到(变量V)框中

3、选择因子分析的样本

4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图形等

5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:主成分分析法

6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法

7、在所示窗口中点击(得分S)按钮选择计算因子得分的方法

8、在所示窗口中点击(选项)按钮

(四)实验结果及分析 分析结果如下表所示。

通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t 假设。相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。

KMO 和巴特利特检验

KMO 取样适切性量数。 .518 巴特利特球形度检验

近似卡方 50.188

自由度 28 显著性

.006

相关性矩阵

每股收益增长率

贷款增长率

存款增长率

总资产增长率

相关性

资产利润率 .383 -.144 -.404 -.359 不良贷款率 -.207 -.025 -.009 -.086 资产负债率 .563 -.166 .105 .494 资本充足率 -.479 .357 .044 -.392 每股收益增长率 1.000 -.366 -.345 .159 贷款增长率 -.366 1.000 .922 .551 存款增长率 -.345 .922 1.000 .738 总资产增长率

.159 .551 .738 1.000 显著性 (单尾)

资产利润率 .137 .346 .124 .154 不良贷款率 .283 .472 .490 .407 资产负债率 .045 .323 .386 .073 资本充足率 .081

.155 .452 .131 每股收益增长率

.149

.164 .330 贷款增长率 .149 .000

.049 存款增长率 .164 .000 .007

总资产增长率

.330

.049

.007

同时,KMO级Bartlett检验是否适合做因子分析。以上是KMO级Bartlett

检验结果,由表可知:KMO值为0.518,说明该数据适合做因子分析。上表中的

巴特利特球体检验的X统计值的显著性概率是O.000,小于1%,因此拒绝原

假设,说明数据具有相关性,适宜做因子分析。

反映像矩阵

每股收益增长率贷款增长率存款增长率总资产增长率反映像协方差矩阵资产利润率-.075 -.025 .025 -.005 不良贷款率.038 .031 -.012 -.031

资产负债率-.064 -.001 -.007 .027

资本充足率-.002 -.021 .011 .015

每股收益增长率.207 -.026 .034 -.107

贷款增长率-.026 .025 -.021 .018

存款增长率.034 -.021 .020 -.032

总资产增长率-.107 .018 -.032 .175 反映像相关性矩阵资产利润率-.277 -.273 .306 -.019 不良贷款率.113 .266 -.114 -.101

资产负债率-.464 -.031 -.158 .214

资本充足率-.018 -.524 .307 .146

每股收益增长率.496a-.358 .533 -.560

贷款增长率-.358 .496a-.932 .269

存款增长率.533 -.932 .503a-.542

总资产增长率-.560 .269 -.542 .651a a. 取样适切性量数 (MSA)

反映像矩阵在其对角线上的数字若大于0.05(出口合同为0.406)则适合因子

分析,小于0.05则不适合因子分析。从表中得知,适合做因子分析。

公因子方差

初始提取

资产利润率 1.000 .818

不良贷款率 1.000 .519

资产负债率 1.000 .912

资本充足率 1.000 .928

每股收益增长率 1.000 .786

贷款增长率 1.000 .953

存款增长率 1.000 .979

总资产增长率 1.000 .865

提取方法:主成分分析法。

变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此,2h i是i X方差的重要组成部分。

检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示

综合因子F,,F2,F3的特征值大于1,且对原始数据的累积贡献率达到了84.485%,其中F1的贡献率最强,达到了34.998%,F2的贡献率达到了

33.383%,F3的贡献率也达到了16.104%。这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1,F2,F3是决定商业银行竞争力强弱的关键因子。

从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;第5个因子之后的特征值都小,对解释原有变量的贡献较小;因此我们可以取3个或4个因子较为合适。

成分矩阵a

成分

1 2 3

总资产增长率.897 -.157 .187

存款增长率.892 .400 .150

贷款增长率.685 .607 .339

资本充足率-.367 .873 .175

资产负债率.475 -.822 -.104

每股收益增长率-.107 -.789 .391

资产利润率-.596 -.006 .680

不良贷款率-.040 .239 -.678

提取方法:主成分分析法。a

a. 提取了 3 个成分。

表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上的载荷没有明显的差别,3个因子的实际含义比较模糊。为了避免初始因子综合性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能向正负0或1的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。下面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反映的信息量尽量最大。

旋转后的成分矩阵a

成分

1 2 3

资本充足率-.962 .051 .020

资产负债率.951 .084 .011

每股收益增长率.602 -.267 .593

存款增长率-.001 .977 -.153

贷款增长率-.302 .928 .016

总资产增长率.493 .788 .023

资产利润率-.347 -.322 .771

不良贷款率-.131 -.151 -.692

提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。a

a. 旋转在 4 次迭代后已收敛。

表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已经明显的两极分化了。第一个公共因子在指标X2每股收益增长率、X3 资产负债率、X4 资本充足率上有较大载荷,说明这3个指标有较强的关联性,可以归为一类,因此可以把第一个因子命名为“流动因子”;第二个公共因子在指标X6 贷款增长率、X7 存款增长率、X8总资产增长率上有较大载荷,同样可以归

为一类,第二个因子可以命名为“发展因子”;同理,X1资产利润率、X5不良贷款率归到第3 类,将其命名为“安全和盈利因子”。

在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是‘旋转后的成分矩阵’的成分几。

成分得分系数矩阵

成分

1 2 3

资产利润率-.165 -.029 .544

不良贷款率-.009 -.138 -.516

资产负债率.359 .012 -.034

资本充足率-.368 .046 .072

每股收益增长率.203 -.051 .370

贷款增长率-.138 .378 .137

存款增长率-.016 .371 .003

总资产增长率.167 .304 .083

提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。

组件得分。

表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准化值就可以计算出每个观测值的各因子的得分。旋转后的因子得分表达式可以写成: F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-

0.016x7+0.167x8

F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.304x8 F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8五、结论

本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞争力,对上市银行及非上市银行具有一定的指导作用。

实验项目:商厦评分

(一)实验目的:

本实验目的利用SPSS层次聚类对商厦评分进行分类分析,以了解了解各商厦之间的相互关系。

(二)实验资料:

(三)实验步骤:

表一

聚类成员

个案 3 个聚类 2 个聚类

1:A商厦

1 1

2:B商厦

1 1

3:C商厦

2 2

4:D商厦

3 2

5:E商厦

3 2

表一可知,当聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E 两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类,SPSS的层次聚类能够产生任意类数的分类结果。

图一

图一,可知,D商厦与E商厦的距离最近,首先合并成一类,其次,合并的是A,B俩个商厦它们的距离比D商厦与E商厦大,最后是合并C商厦。最后聚城一体。

图二:

图二,可知,当聚成4类时,D,E两个商厦为一类;其他各商厦自成一类,聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类。

表二

初始聚类中心

聚类

1 2 3

购物环境94.00 66.00 84.00

服务质量90.00 64.00 82.00

表二,可知,3个初始类中心点的数据,分别为(94,90)(66,64)(84,82)可见第一类最优,第三类次之,第二类最差。

表三

迭代历史记录a

迭代

聚类中心中的变动

1 2 3

1 1.803 4.031 .000

2 .000 .000 .000

a. 由于聚类中心中不存在变动或者仅有小幅变

动,因此实现了收敛。任何中心的最大绝对坐

标变动为 .000。当前迭代为 2。初始中心之间的

最小距离为 12.806。

表三,可知,第一次迭代后,3个类中心点分别偏移了

1.803,4.013.0.000,第2类中心点的偏移最大,在第3类和第二次迭代时中心点偏移均小于判定标准(0.02),聚类分析结束。

表四

表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)仍然可见第一类为最优,第三类第二,第二类效果最差。

表五

ANOVA

聚类误差

均方自由度均方自由度

F 显著性

购物环境268.100 2 14.500 2 18.490 .051

服务质量272.600 2 5.000 2 54.520 .018

由于已选择聚类以使不同聚类中个案之间的差异最大化,因此 F 检验只应该用于描述目

的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设

的检验。

由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间均方、组间自由度、组内均方、组内自由度、F统计量的观察值以及对应的概率P-值。仍然看出第二类的差异最大。

(三)实验结论:

因此,在总数为五,有效数值为五的情况下的聚类分析可得,E商厦属最优类;C,D商厦属良好类;A,B商厦属合格类。

相关主题