搜档网
当前位置:搜档网 › spss数据分析教程之SPSS信度分析和效度分析

spss数据分析教程之SPSS信度分析和效度分析

spss数据分析教程之SPSS信度分析和效度分析
spss数据分析教程之SPSS信度分析和效度分析

s p s s数据分析教程之S P S S信度分析和效度

分析

集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]

信度分析和效度分析

数据计分方法说明

1 信度分析

这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到以上,该问卷调查的信度就较好;信度系数在以上,是不错的;一般认为试卷信度在至以内是合理的,如果信度系数低于,则此问卷的调查结果就不可信了。

将以上63份问卷的数据用先进行标准化处理,再进行信度分析,其结果如表一所示:

表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。

2 效度分析

具备信度的问题不一定具备效度,因此做完信度分析,再用对其进行效度分析。

因子模型适应性分析

效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示:

表二 KMO 和 Bartlett 的检验

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。.657

Bartlett 的球形度检验近似卡方

df465 Sig..000

由上表的数据可知,问卷数据的KMO值为,并且通过了显着性水平为的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。

因子分析结果

在进行了适应性检验之后,接下来就进行因子分析,其结果如下:

表三方差贡献率

解释的总方差

成份

初始特征值提取平方和载入旋转平方和载入

合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %

1

2

3

4

5

6

7

8

9.958

10.880

11.762

12.714

13.684

14.623

15.580

16.509

17.449

18.394

19.342

20.289.934

21.276.892

22.258.833

23.204.659

24.184.592

25.171.552

26.148.478

27.121.391

28.101.325

29.079.254

30.058.186

31.039.127

提取方法:主成份分析。

根据表三方差贡献率分析表可以知道,具备信度的31个问题一共可以提取8个主成分,这8个主因子解释的方差占到了将近%,由此我们可以认为,这次提取的8个公因子在充分提取和解释原变量的信息方面比较理想。

表四旋转后的因子载荷矩阵

旋转成份矩阵a

成份

12345678职业倦怠1

职业倦怠2

职业倦怠3

职业倦怠4

职业倦怠5

职业倦怠6

职业倦怠7

职业倦怠8

职业倦怠9

职业倦怠10

心理资本1

心理资本2

心理资本3

心理资本4

心理资本5

心理资本60601

心理资本7

心理资本8

组织氛围1

组织氛围2

组织氛围3

组织氛围4

组织氛围5

组织氛围6

组织氛围7

组织氛围8

总体幸福感1

总体幸福感2

总体幸福感3

总体幸福感4

总体幸福感5

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

a. 旋转在 14 次迭代后收敛。

根据以上旋转后的因子载荷表可以知道:

主成分一:包含职业倦怠1、职业倦怠2、职业倦怠3、职业倦怠4、职业倦怠5、职业倦怠6这6个题项,说明主成分一是反映情感枯竭和去个性化的维度。其方差贡献率是%,是8个主成分中贡献最大的一个,说明这一主成分对整体问卷的的影响最大。

主成分二:包含组织氛围4、组织氛围5、组织氛围6、组织氛围7、组织氛围8这5个题项,说明主成分二是反映组织氛围维度中学校氛围的主因素。其方差贡献率是%,是8个主成分中贡献第二大的,说明这一主成分对整体问卷的的影响第二大。

主成分三:包含职业倦怠7、职业倦怠8、职业倦怠9、职业倦怠10这4个题项,说明主成分三是反映个人成就感的主因素。其方差贡献率是%,是8个主成分中贡献第三大的,说明这一主成分对整体问卷的的影响第三大。

主成分四:包含心理资本1、心理资本2、心理资本3、心理资本4、心理资本5这5个题项,说明主成分四是反映心理资本维度中工作情绪方面的主因素。其方差贡献率是%,是8个主成分中贡献第四大的,说明这一主成分对整体问卷的的影响第四大。

主成分五:包含心理资本6、心理资本7、心理资本8这3个题项,说明主成分五是反映心理资本维度中工作状态方面的主因素。其方差贡献率是%,是8个主成分中贡献第五大的,说明这一主成分对整体问卷的的影响第五大。

主成分六:包含总体幸福感3、总体幸福感4、总体幸福感5这5个题项,说明主成分六是总体幸福感维度中生活压力方面的主因素。其方差贡献率是%,是8个主成分中贡献第六大的,说明这一主成分对整体问卷的的影响第六大。

主成分七:包含总体幸福感1、总体幸福感2这2个题项,说明主成分七是总体幸福感维度中生活信心面的的主因素。其方差贡献率是%,是8个主成分中贡献第七大的,说明这一主成分对整体问卷的的影响第六大。

主成分八:包含组织氛围1、组织氛围2、组织氛围3这3个题项,说明主成分八是组织氛围维度中同事关系氛围方面的主因素。其方差贡献率是%,是8个主成分中贡献最小的,说明这一主成分对整体问卷的的影响最小。

此外,观察表四旋转后的因子载荷矩阵,31个题项都仅仅只在某一个主成分上的载荷比

较大,由此可以知道,职业倦怠的每一个题项是具有效度的。

差异性分析

1、不同性别在各个维度中的差异分析

表17

组统计量

性别N均值标准差均值的标准误

职业倦怠男8

女55.76008

心理资本男8

女55.53814

组织气氛男8.89959女55.60979

总体幸福感男8.73307女55.31452

表18

性别男女t值P值

职业倦怠±±

心理资本±±

组织气氛±±

总体幸福感±±

我们可以从上表中看出,男女性别不同,在职业倦怠、心里资本、组织气氛上是没有明显差异的。但是不同性别在总体幸福感上存在显着差异。具体差异情况见下图:

女性在总体幸福感上的均分显着高于男性在总体幸福感上的均分,说明女性的总体幸福感普遍高于男性。

2 不同年龄在各个维度上的差异分析

表19

描述

N均值标准差极小值极大值

职业倦怠

20-25岁14 26-30岁24 31-35岁9 36-45岁11 46岁及以上5总数63

心理资本

20-25岁14 26-30岁24 31-35岁9 36-45岁11 46岁及以上5总数63

组织气氛

20-25岁14 26-30岁24 31-35岁9 36-45岁11 46岁及以上5总数63

总体幸福

20-25岁14 26-30岁24 31-35岁9 36-45岁11 46岁及以上5

单因素方差分析

平方和df均方F显着性

职业倦怠组间4.161组内58

总数62

心理资本组间4.556.695组内58

总数62

组织气氛组间4.803.528组内58

总数62

总体幸福

感组间4.773.130.971组内58

总数62

根据表19、20,我们可以看出年龄的不同在职业倦怠、心里资本、组织气氛、总体幸福感上是没有明显差异的。

,3、不同学历在各个维度上的差异分析

表21

描述

N均值标准差极小值极大值

职业倦怠A.高中(中专)及以下8

大专18

本科35研究生及以上2

总数63

心理资本A.高中(中专)及以下8

大专18

本科35研究生及以上2

总数63

组织气氛A.高中(中专)及以下8

大专18

本科35研究生及以上2

总数63

总体幸福感A.高中(中专)及以下8

大专18

本科35

研究生及以上2

总数63

表22

单因素方差分析

平方和df均方F显着性

职业倦怠组间3.355组内59

总数62

心理资本组间3.491.690组内59

总数62

组织气氛组间3.036组内59

总数62

总体幸福感组间3.372组内59

总数62

由表21、22可知,学历的不同的被调查人群在职业倦怠、心理资本、总体幸福感上是无明显差异的。不同学历的被调查人群在组织气氛维度上存在显着差异,具体差异情况见下图:

学历越高组织气氛得分越低,说明学历高的人群需要加强沟通。

4、不同党派在各个维度上的差异分析

表23

描述

N均值标准差标准误均值的 95% 置信区间

极小值极大值下限上限

职业倦怠

共青团员24.86691中共党员9

民主党派成员3

群众27

总数63.69732

心理资本

共青团员24.79014中共党员9

民主党派成员3

群众27.85067总数63.51212

组织气氛

共青团员24

中共党员9.70849民主党派成员3

群众27.80416总数63.55315

总体幸福感

共青团员24.46971

中共党员9.98230

民主党派成员3.96385

群众27.43474

总数63.29855

表24

单因素方差分析

平方和df均方F显着性职业倦怠

组间3.167

组内59

总数62

心理资本

组间3.822.487

组内59

总数62

组织气氛

组间3.328

组内59

总数62

总体幸福感

组间3.352

组内59

总数62

有表23、24可以看出,党派的不同,被调查人群在职业倦怠、心理资本、组织气氛、总体幸福感上是无明显差异的。

5、不同婚姻状况在各个维度上的差异分析

表25

描述

N均值标准差标准误均值的 95% 置信区间

极小值极大值下限上限

职业倦怠未婚23

已婚40.92479总数63.69732

心理资本未婚23.76988已婚40.67699总数63.51212

组织气氛未婚23.95181已婚40.67934总数63.55315

总体幸福感未婚23.37046已婚40.41636

总数

63

.29855

表26

单因素方差分析

平方和

df 均方 F 显着性 职业倦怠

组间

1

.176

组内 61

总数 62

心理资本

组间

1 .572

.452

组内 61

总数 62

组织气氛

组间

1 .869

.355

组内 61

总数 62

总体幸福感

组间

1

.228

组内 61

总数

62

从表25和26可以看出,不同婚姻状况的人在各个维度上不存在显着差异。 6、不同子女数量在各个维度上的差异分析

表27

描述

N 均值 标准差

标准误 均值的 95% 置信区间 极小值

极大值

下限 上限 职业倦怠

0个

31 .89659

1个 30 2个及以上 2 .97500 总数 63 .69732 心理资本

0个

31 .69665 1个 30 .72791

2个及以上 2 总数 63 .51212 组织气氛

0个

31 .78991 1个 30 .77088

2个及以上 2 总数 63 .55315 总体幸福感

0个

31 .33691 1个 30 .47904 2个及以上 2 .75000 总数

63

.29855

职业倦怠组间2.056组内60

总数62

心理资本组间2.047组内60

总数62

组织气氛组间2.186组内60

总数62

总体幸福感组间2.022组内60

总数62

由表27和28可以看出,子女数量不同,在心理资本和总体幸福感上有明显差异的。具体差异情况为:

有一个子女的被调查者在心里资本维度和总体幸福感维度上的均分最低,有两个及以上子女的被调查者在心里资本维度和总体幸福感维度上的均分最高。说明孩子较多的被调查者的心里状况是最好的。

7、不同工作时间人群在各个维度上的差异分析

表29

描述

N均值标准差标准误均值的 95% 置信区

间极小值极大值下限上限

职业倦怠

3年以下24.77568 3-5年12

5-10年12

10年以上15

总数63.69732

心理资本

3年以下24.71975 3-5年12

5-10年12

10年以上15

总数63.51212

组织气氛

3年以下24

3-5年12

5-10年12.95564 10年以上15.77547总数63.55315

总体幸福感

3年以下24.46596 3-5年12.65270 5-10年12.80063 10年以上15.60190总数63.29855

表30

单因素方差分析

平方和df均方F显着性

职业倦怠组间3.025组内59

总数62

心理资本组间3.207组内59

总数62

组织气氛组间3.053组内59

总数62

总体幸福感组间3.664.578组内59

总数62

由表29和表30可以看出,工作年限的不同的被调查者在心理资本、组织气氛、总体幸福感是无明显差异的。在职业倦怠维度上存在显着差异,具体差异情况为:

工作时间在5-10年的被调查者在职业倦怠维度上的均分最高。但是,超过10年之后,职业倦怠感反而减弱了。

8、不同的平均月收入被调查者在各个维度上的差异分析

表31

描述

N均值标准差标准误均值的 95% 置信区

间极小值极大值下限上限

职业倦怠1500元以下3

1500-1999元4

2000-2999元26.71257 3000-3999元17

4000-4999元7

5000元及以

6

总数63.69732

心理资本1500元以下3

1500-1999元4

2000-2999元26.78386 3000-3999元17.99088 4000-4999元7

5000元及以

6

总数63.51212

组织气氛1500元以下3

1500-1999元4

2000-2999元26

3000-3999元17.57011 4000-4999元7

5000元及以

6

总数63.55315

总体幸福感1500元以下3

1500-1999元4

2000-2999元26.43415

3000-3999元17.37574

4000-4999元7

5000元及以

6.97478

总数63.29855

表32

单因素方差分析

平方和df均方F显着性职业倦怠

组间5.000

组内57

总数62

心理资本

组间5.097

组内57

总数62

组织气氛

组间5.059

组内57

总数62

总体幸福感

组间5.094

组内57

总数62

由表31和32 可以看出,平均月收入不同在职业倦怠和其他组之间是有明显差异的,其余维度在不同的收入水平上不存在显着差异。具体差异情况见下图:

从上图可以看出,收入在4000-4999元之间的被调查者的职业倦怠维度上的得分最高。收入在5000元以上的人群在职业倦怠维度上的得分最低。此外,收入在1500到4999元之间时,随着收入的增加,职业倦怠维度的得分越高。由此可以知道,4999元是一个过渡点,低于这个店的时候,收入越高,职业倦怠感就越强,当收入突破4999元时,职业倦怠感反而会突然减弱。

相关分析

各个维度的相关分析结果如下:

相关性

职业倦怠心理资本组织气氛总体幸福感

职业倦怠Pearson 相关性1******显着性(双侧).000.001.000 N63636363

心理资本Pearson 相关性**1.449**.424**显着性(双侧).000.000.001 N63636363

组织气氛Pearson 相关性**.449**1.486**显着性(双侧).001.000.000 N63636363

总体幸福感Pearson 相关性**.424**.486**1显着性(双侧).000.001.000

N63636363

**. 在 .01 水平(双侧)上显着相关。

从上面的相关分析可以看出:

1、职业倦怠和心理资本这2个维度之间存在显着的相关关系,因为二者的相关系数通过显着性水平为的T检验。二者之间的相关系数<0,说明二者之间是显着的负线性关系,当心理资本越好,职业倦怠感就越弱。

2、职业倦怠和组织气氛之间存在显着的相关关系,二者之间的相关系数为,且通过了显着性水平为0,05的T检验。<0,说明二者之间存在显着的负线性相关的关系。即二者之间的变化方向是相反的,组织气氛越好,职业倦怠感就越弱。

3、职业倦怠和总体幸福感之间存在显着的相关关系,二者之间的相关系数为<0,且通过了显着性水平为的T检验。由此可以知道,二者之间存在的负线性相关的关系。即二者的变化方向是相关的,总体幸福感越强。职业倦怠感就越弱。

4、心理资本和组织气氛、总体幸福感呈现出显着的正线性相关,相关系数分别为和。由此可以知道,心理资本越高,组织气氛就越好;心里资本越高,总体幸福感就越强。

5、组织气氛和总体幸福感也是显着的正线性相关,相关系数为,且通过显着性水平为的T检验,说明组织氛围越高,总体幸福感就越强。

回归分析

问卷一共包含4个维度,为了研究心理资本、组织气氛和总体幸福感维度及主要人口学因素对职业倦怠维度的影响,因此建立多元回归模型,其中职业倦怠维度为因变量Y。

心理资本为自变量X

1、组织气氛为自变量X

2

、总体幸福感为自变量X

3

,性别X

4

、年龄

X

5、婚姻状况X

6

、子女个数X

7

回归分析的结果如下:

上表是模型汇总表,从模型汇总表可以看出,模型的拟合度调整R2为,说明模型的拟合度一般。DW值为接近于2,说明模型不存在一阶序列相关,通常不存在一阶序列相关也不会存在高阶序列相关。

Anova a

模型平方和df均方F Sig.

1回归7.000b 残差55

总计62

a. 因变量: 职业倦怠

b. 预测变量: (常量), Q6, Q1, 心理资本, 总体幸福感, 组织气氛, Q2, Q5。

上表是方差分析表,F值为,显着性水平为,通过了显着性水平为的F检验,说明该回归模型的自变量对因变量有显着影响。

系数a

模型非标准化系数标准系数

t Sig. B标准误差试用版

1

(常量).000心理资本.160.008组织气氛.153.436总体幸福感.286.004 Q1(性别).324 Q2(年龄).371.613.083.606.547 Q5(婚姻状况).277.084 Q6(子女个数).049

a. 因变量: 职业倦怠

上表是系数表,从上表可以得出,组织气氛维度、性别、年龄、婚姻状况没有通过显着性水平为的T检验,说明这个为对职业倦怠没有显着影响。心理资本、总体幸福感的回

归系数通过了显着性水平为的T检验,说明总体幸福感、心理资本、政治面貌、子女个人数对职业倦怠有着显着影响。具体的回归方程为:

Y=:职业倦怠 X

1:心理资本 X

3

:总体幸福感 X

6

:婚姻状况 X

7

:子女个数

根据以上的回归方程可以知道,心理资本和总体幸福感对职业倦怠有着显着负向影响,总体幸福感每增加一个单位,职业倦怠感就减少个单位。心理资本每增加一个单位,职业倦怠就减少个单位。婚姻状况对职业倦怠有着正向影响,已婚的职业倦怠感高于未婚,离异的职业倦怠感高于已婚,其他婚姻状况的职业倦怠感最强。子女个数最职业倦怠感有着负向影响,子女个数越多,职业倦怠感就越弱。

结论

从以上的信度分析、效度分析可以得出以下结论:问卷的设计是比较成功的,每一个维度都具有信度和效度,问卷调查的结果具有很好的研究价值。

在差异分析中,不同性别的被调查人群在总体幸福感上存在显着;不同学历在组织氛围维度上存在显着差异;不同子女数量在心理资本和总体幸福感维度上存在显着差异;不同从业时间在职业倦怠维度上存在显着差异;不同月收入在职业倦怠感上存在显着差异;其余的人口学类别在各个维度上不存在显着差异。然而不同子女个数的被调查者在心理资本这个维度上的差异很显着,没有子女和有2个以上子女的被调查者的心理资本状况都比较好吗,相反,只有一个子女的被调查者的心理资本状况是最不好的,显着低于没有子女和2个以上子女的被调查者。由此可以推断,独生子女给父母带来的精神压力很大。不同收入的被调查者在职业倦怠维度上存在非常显着的差异,收入为4999元时一个分界点,当收入低于这个水平时,随着收入的不断增加,被调查者的职业倦怠感就越严重,当收入突破4999元时,收入越高,职业倦怠感反而越弱。由此可以推断,4999元以上收入的群体对自己薪酬比较满意,职业倦怠感也越弱。相关分析和回归分析得出的结论是相似的,相关分析中,得出心理资本、组织氛围和总体幸福感与职业倦怠是呈显着的负线性相关的,进一步进行回归分析,得出总体幸福感和心理资本对职业倦怠有着显着的负向影响。表明,被调查者的总体幸福感越高、心理资本越好,职业倦怠感就越弱,这意味着,生活比较幸福和满足的被调查者,比较不容易产生职业倦怠感。性别和年龄对职业倦怠感没有显着影响。婚姻状况和子女个数对职业倦怠感有着显

着影响,子女个数越多的人群越不容易产生职业倦怠感。已婚的职业倦怠感高于未婚,离异的职业倦怠感高于已婚,其他婚姻状况的职业倦怠感最强。

spss统计分析报告期末考精彩试题

《统计分析软件》试(题)卷 班级xxx班xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

spss 期末题库

课程名称:《SPSS分析方法与应用》 课程号: 2007422 一、单项选择题(共112小题) 1、试题编号:1000110,答案:RetEncryption(D)。 SPSS的安装类型有() A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号:1000310,答案:RetEncryption(D)。 数据编辑窗口的主要功能有() A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出 和B 3、试题编号:1000410,答案:RetEncryption(A)。 ()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。 4、试题编号:1000510,答案:RetEncryption(D)。 ()是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号:1000810,答案:RetEncryption(D)。 ()是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号:1000910,答案:RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号:1001010,答案:RetEncryption(B)。 数据编辑窗口中的一行称为一个() A.变量 B.个案 C.属性 D.元组 8、试题编号:1001110,答案:RetEncryption(C)。

变量的起名规则一般:变量名的字符个数不多于() A. 6 B. 7 C. 8 D. 9 9、试题编号:1001210,答案:RetEncryption(A)。 统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号:1001310,答案:RetEncryption(A)。 在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号:1001810,答案:RetEncryption(A)。 SPSS算术表达式中,字符型()应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号:1001910,答案:RetEncryption(A)。 复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 B AND C OR D都不是 13、试题编号:1002010,答案:RetEncryption(A)。 数据选取的方法中,()是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号:1002110,答案:RetEncryption(B)。 通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号:1002210,答案:RetEncryption(A)。 SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号:1002310,答案:RetEncryption(B)。 SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号:1002710,答案:RetEncryption(D)。 SPSS中进行参数检验应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号:1002810,答案:RetEncryption(A)。 SPSS中进行输出结果的保存应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号:1002910,答案:RetEncryption(C)。 SPSS中进行数据的排序应选择()主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

spss 信度分析

第九章第九章信度分信度分析析?6?1一再测信度·用同一个测验对同一组被试前后两次施测两次测验分数所得的相关系数为再测信度·因为它能反映两次测验结果有无变动也就是测验分数的稳定程度故又称稳定性系数·计算再测信度应满足一下几个假设①所测量的特质必须是稳定的②遗忘与练习的效果相同③两次施测期间被试的学习效果没有差别···。·根据一组被试在两个平行等值测验上的得分计算的相关数。因为它反映的是两个测验之间的等值程度因此又叫等值性系数。·采用此法一定要注意①两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似②两次测验的时间间隔要适当·复本信度的局限①复本法只能减少而不能完全排除练习和记忆的影响②对于许多测验来说建立复本是相对困难的?6?1按正常的程序实施测验然后将全部项目分成相等的两半根据各人在这两半测验的分数计算其相关系数?6?1斯皮尔曼—布朗校正公式弗朗那根估计信度公式。?6?1使用奇偶分半法一定要注意两个问题①如遇到有牵连的项目或一组解决同一问题的项目时这些项目应放在同一半否则将会高估信度的值②当试卷中存在任选题或试卷为速度测试时不宜采用分半法·同质性也称内部一致性指的是测验内部所有题目间的一致性。1、测量同质性的基本公式2、库德—理查逊公式估计测验的信度估计同质性信度·适用于答对一题得分答错无分3、克伦巴赫系数·适

用于项目多重记分的测验·评分者之间的变异是产生误差的重要原因之一·考察评分者信度的方法是随机抽取部分试卷由两个或多个评分者独立按评分标准打分然后求其间的相关。如果是两个评分者则采用积差相关或等级相关的方法一般认为结果训练的成对评分者之间的一致性达到0.90以上评分才是客观的。如果是多个评分者则采用和谐系数来估计信度。一评价测验·信度系数是衡量测验好坏的一个重要技术指标·一般能力与成就测验的信度系数常在0.90以上·性格、兴趣、态度等人格测验的信度系数通常在0.80-0.85之间二解释分数1、个人测验分数的误差·个人在两次测验中分数的差异就是测量误差据此可得出一个误差分数的分布这个分布 的标准差就是测量的标准差它是测量误差大小的指标。2、两种测验分数的比较·来自不同测验的原始分数是无法直接比较的只有参照同一团体的平均分数将它们转换成相同尺 度的标准分数才能进行比较。一被试的样本·团体的异质程度与分类的分布有关一个团体越是异质其分数分布的范围也 就越大信度系数就越高。·信度系数不仅受样本团体的异质程度的影响也受样本团体平均水平的影响。因为对于不同水平的团体项目具有不同的难度每个项目在难度上的变化累积 起来便会影响信度。这种影响不能用统计公式来推估只能从经验中发现。二测验的长度·一般来说测验越长信度值越高。因为①测验加长可能改进项目取样的代表性从而能更好地

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

spss统计软件期末课程考试题

《SPSS统计软件》课程作业 要求:数据计算题要求注明选用的统计分析模块和输出结果;并解释结果的意义。完成后将作业电子稿发送至 1. 某单位对100名女生测定血清总蛋白含量,数据如下: 计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。 解: 描述 统计量标准误 血清总蛋白含量均值.39389 均值的 95% 置信区间下限 上限

5% 修整均值 中值 方差 标准差 极小值 极大值 范围 四分位距 偏度.054.241 峰度.037.478 样本均值为:;中位数为:;方差为:;标准差为:;最大值为:;最小值为:;极差为:;偏度为:;峰度为:;均值的置信水平为95%的置信区间为:【,】。 2. 绘出习题1所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。解:

正态性检验 Kolmogorov-Smirnov a Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 血清总蛋白含量 .073 100 .200* .990 100 .671 a. Lilliefors 显著水平修正 *. 这是真实显著水平的下限。 表中显示了正态性检验结果,包括统计量、自由度及显著性水平,以K-S 方法的自由度sig.=,明显大于,故应接受原假设,认为数据服从正态分布。 3. 正常男子血小板计数均值为9 22510/L , 今测得20名男性油漆工作者的血小板计数值(单位:9 10/L )如下: 220 188 162 230 145 160 238 188 247 113

SPSS数据分析报告

SPSS期末报告 关于员工受教育程度对其工资水平的影响 统计分析报告 课程名称:SPSS统计分析方法 姓名:汤重阳 学号:1402030108 所在专业:人力资源管理 所在班级:三班

目录 一、数据样本描述 (1) 二、要解决的问题描述 (1) 1 数据管理与软件入门部分 (1) 1.1 分类汇总 (1) 1.2 个案排秩 (1) 1.3 连续变量变分组变量 (1) 2 统计描述与统计图表部分 (1) 2.1 频数分析 (1) 2.2 描述统计分析 (1) 3 假设检验方法部分 (1) 3.1 分布类型检验 (2) 3.1.1 正态分布 (2) 3.1.2 二项分布 (2) 3.1.3 游程检验 (2) 3.2 单因素方差分析 (2) 3.3 卡方检验 (2) 3.4 相关与线性回归的分析方法 (2) 3.4.1 相关分析(双变量相关分析&偏相关分析) (2) 3.4.2 线性回归模型 (2) 4 高级阶段方法部分 (2) 三、具体步骤描述 (3) 1 数据管理与软件入门部分 (3) 1.1 分类汇总 (3) 1.2 个案排秩 (4) 1.3 连续变量变分组变量 (4) 2 统计描述与统计图表部分 (5) 2.1 频数分析 (5) 2.2 描述统计分析 (7) 3 假设检验方法部分 (8) 3.1 分布类型检验 (8) 3.1.1 正态分布 (8) 3.1.2 二项分布 (10) 3.1.3 游程检验 (10) 3.2 单因素方差分析 (12) 3.3 卡方检验 (13) 3.4 相关与线性回归的分析方法 (14) 3.4.1 相关分析 (14) 3.4.2 线性回归模型 (15) 4 高级阶段方法部分 (17) 4.1 信度 (18) 4.2 效度 (18)

SPSS期末数据分析

1.为研究某合作游戏对幼儿合作意愿的影响,将18名幼儿随机分到甲、乙、丙3个组,每组6人,分别参加不同的合作游戏,12周后测量他们的合作意愿,数据见表,问不同合作游戏是否对幼儿的合作意愿产生显著影响? 单因素分析单因素方差分析:因变量—合作意愿得分;自变量—不同合作游戏(3种不同的水平) 显著性水平为0.541,大于0.05,说明这三组数据总体方差相等,适合方差齐性检验 从上表可以看出组间离差平方和为2.528,组内离差平方和为4.035,组间方差检验F=4.698,对应的显著性水平0.026,小于显著性水平0.05,说明3组中至少有一组与另外一组存在显著性差异。

由上表可以看出甲组与乙组的显著性为0.184 大于0.05,说明这两组的合作意愿得分没有显著差异,,但是甲组和乙组的相伴概率为0.008,说明这两组的合作意愿得分有显著性差异。

2.现有10名男生进行观察能力的训练,训练前后各进行一次测验,结果如下表所示。 解答:两配对样本T检验 从上表可以看出样本有10个,训练前10个男生的观察能力的样本均值是71,标准差是10.477,训练后观察能力的均值是79.50,标准差是9.823 由上表可以得出训练前后的相伴概率为0.028小于显著性水平0.05,说明训练前后能力的相关性较高 由上表可以得出t统计量为-3.341,相伴概率为0.009,小于0.05,说明训练能够是10个男生的观察能力有显著性的变化 3.某教师为考察复习方法对学生记忆单词效果的影响,将20名学生随机分成4组,每组5人采用一种复习方法,学生学完一定数量单词之后,在规定时间内进行复习,然后进行测试。结果见表。问各种方法的效果是否有差异?并将各种复习方法按效果好坏排序

统计分析与SPSS应用_期末作业

统计分析与SPSS的应用 摘要:为对统计分析与spss应用分析所学知识进行巩固和检验,特运用所学知识进行简单的统计分析应用,下文以某校学生学期成绩进行模拟分析。 一:原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

spss统计分析方法应用期末作业

1.作业1(基本统计+参数检验+方差分析1) 利用城际出行行为数据,从中随机选取90%的样本,实现以下分析目标: (1)分析出行时间的分布,需做直方图。 (2)分析不同性别的出行方式是否一致。 (3)检验老年人(≥60)与其他人的出行时间是否有显著差异。 (4)检验是否老年人和出行目的两因素对其它时间的影响(考虑交互作用)。 1.1 分析出行时间的分布,需做直方图 1.1.1 解题思路 首先,根据题目要求在城际出行行为数据中随机选择90%的样本;由于出行时间分布数据是定距变量,且出行时间数据数量较多,不宜使用频数进行分析。因此在分析之前先对出行时间进行分组,再进行频数分布。根据公式(1- (1-1)中n为数据个数,对结果四舍五入取整后为理论分组数目。 原样本数为235,随机选择之后剩余样本是n为213个,根据公式(1-1)计算得到分组数目为9。选中的数据中出行时间的最大值为150,出行时间的最 1.1.2操作步骤 数据选择:【数据→选择个案】,选择【随机个案样本】→【样本】→在【大约】中填入“90%”→选择【删除未选定的个案】,点击确认。剩下的即为随机选择之后的数据。 数据分组:【转换】→【重新编码为不同变量】→将“出行时间”加入到有边框中,输出变量名称改为“城市出行时间分组”,点击【更改】,在点击【旧值和新值】,按照60-70、70-80、80-90、90-100、100-110、110-120、120-130、

130-140、140-150,分别对应1,2,3,4,5,6,7,8,9。点击【完成】。 频数分析:【分析】→【描述统计】→【频率】,将“城市出行时间分组”加入到【变量】中。点击【图表】→【直方图】→选中【在直方图上显示正态曲线】→【确定】。 1.1.3输出结果与分析 总计213 100.0 100.0 图1-1城市出行时间分布直方图 从表1-1中可以看出,出行时间分布中,出行时间在60-70分钟的比较少,占比为4.7%,出行时间在120-130分钟、130-140分钟和140-150分钟的都比较少,三组总和占比仅为6.1%。出行时间在70-120分钟之间的人数最多,

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析 数据计分方法说明 类别 小分类 对应题项 每题计分方法 维度计分方法 题项 职业倦怠 情感枯竭 1-3题 正向计分 全部题项直接加总 3 去个性化 4-6题 正向计分 全部题项直接加总 3 个人成就感 7-10题 逆向计分 全部题项取倒数后加 总 4 心理资本 11-18题 正向计分 全部题项直接加总 8 组织气氛 19-26题 21题为逆向计分,其余题项正向计分 21题取倒数后与其余 题项加总 8 总体幸福感 27-31题 27题和31题为逆向计分,其余题项为正 向计分 27和31题取到术后与 其余题项加总 5 整体问卷 以上各个维度的总分 直接加总 31 讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到0.9以上,该问卷调查的信度就较好;信度系数在0.8以上,是不错的;一般认为试卷信度在0.5至0.9以内是合理的,如果信度系数低于0.5,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用SPSS21.0先进行标准化处理,再进行信度分析,其结果如表一所示: 表一 信度分析表

类别Cronbach's Alpha项数 整体问卷.61731 职业倦怠.82210 心理资本.8018 组织气氛.8378 总体幸福感.6795 表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df 465 Sig. .000 由上表的数据可知,问卷数据的KMO值为0.657,并且通过了显著性水平为0.05的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果 在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份初始特征值提取平方和载入旋转平方和载入

SPSS分析报告实例

SPSS与数据统计分析期末论文影响学生对学校服务满意程度的因素分析

一、数据来源 本次数据主要来源自本校同学,调查了同学们年级、性别、助学金申请情况、生源所在地、学院、毕业学校、游历情况、家庭情况、升高、体重、近视程度、学习时间、经济条件、兴趣、对学校各方面的评价、与对学校总评价以及建议等共41条信息,共收集数据样本724条。我们将运用SPSS,对变量进行频数分析、样本T检验、相关分析等手段,旨在了解同学们对学校提供的满意程度与什么因素有关。 二、频数分析 可靠性统计 克隆巴赫 Alpha 项数 .985 62 对全体数值进行可信度分析

本次数据共计724条,首先从可靠性统计来看,alpha值为0.985,即全体数据绝大部分是可靠的,我们可以在原始数据的基础上进行分析与处理。 其中,按年级来看,绝大多数为大二学生填写(占了总人数的67.13%),之后分别依次为大二(23.76%)、大四(4.14%)、大一(4.97%)。而从专业来看,占据了数据绝大多数样本所在的学院为机械、材料、经管、计通。 三、数据预处理 拿到这份诸多同学填写的问卷之后,我们首先应对一些数据进行处理,对于数据的缺失值处理,由于我们对本份调查的分析重点方面是关于学生的经济情况的,因此对于确实的部分数据,升高、体重、近视度数、感兴趣的事等无关项我们均不需要进行缺失值的处理,而我们可能重点关注的每月家里给的钱、每月收入以及每月支出,由于其具有较强主观性,如果强行处理缺失值反而会破坏数据的完整性,因此我们筛去未填写的数据,将剩余数据当作新的样本进行分析。 而对于一些关键的数据,我们需要做一些必要的预处理,例如一些调查项,我们希望得到数值型变量,但是填写时是字符型变量,我们就应该新建一个数字型变量并将数据复制,以便后续分析。同时一些与我们分析相关的缺省值,一些明显可以看出的虚假信息,我们都需要先进行处理。而具体预处理需要怎么做,这将会在其后具体分析时具体给出。

SPSS期末复习笔记.docx

2 SPSS四种输出结果:枢轴表/轻量表、文本格式、统计图表、模型 SPSS四种窗口:语法窗口、输出窗口、数据窗口、脚本窗口 SPSS三种运行方式:命令行方式、批程序方式、菜单对话框 SPSS默认文件类型: 数据文件*.sav:此为SPSS软件默认的数据文件格式,双击可由SPSS直接读取。 命令文件*.sps:可在语法编辑程序(syntax)中先编写或贴上欲执行之分析指令,并将其存贮起来,供日后重复使用或检查之用。 输出文件*.spo: 允许直接加以编辑或转贴到其他编辑软件,SPSS 16.0版之后将输出文件的默认格式改为*.spv。 数据文件清洗——多余重复的数据筛选清楚,将确实的数据补充完整,将错误的数据纠正或删除。数据→标识重复个案标识异常个案 问题的答案被称作变量的取值。将答案转变成可用于统计分析的数据,需要经过一个被称作“编码coding”的过程。 数据阵/数据文件:n个案例、m个变量构成的阵列 SPSS对数据的处理是以变量为基础的。 所以,数据录入前一定先定义变量及其属性,包括指定名称、(存储)类型、宽度、小数、标签、值、缺失、列(宽)、对齐、度量标准和角色。这也被称作建立数据框架。 变量名必须以字母、汉字或字符@开头,数字不可以,其他字符可以是任何字母、数字或_、@、#、$等符号。变量名中不能有空白字符或其他特殊字符(如“!”、“?”、“*”等)。变量名最后一个字符不能是英文句号(.)。 在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而言,均被视为同一个变量。SPSS的保留字不能作为变量的名称,如ALL、AND、BY、EQ、GE、GT、LT、NE、NOT、OR、TO、WITH等。 SPSS中变量有3种基本类型:数值型、字符型(区分大小写)和日期型。 但根据不同的显示方式,数值型又被区分成:数值、逗号、圆点、科学计数法、美元、(用户)设定货币等6个子类型。不过,只有数值(N)最为常用。 默认状态下,所有变量的类型均为数值型,且宽度是8位、小数位是2位。 对话框界面可修改宽度和小数位,然后“确定”,但宽度必须大于小数位。 变量标签是对变量名的进一步描述,可长达120个字符 SPSS有两类缺失值:系统默认缺失值和用户定义缺失值。 对于数值型变量值,系统默认缺失值为圆点“.”,而字符型变量值的系统默认缺失值为空字符串(什么也没有)。 指定“列”实际上是设定变量的显示宽度,默认为8个字符的宽度。 统计学中,按照对事物描述的精确程度,将度量标准从低到高区分为4种类型: 定类尺度:仅能测定类别差,不能比较大小,各类之间没有顺序和等级,只能计算频数频率百分比,可以使用数值型变量,也可以是字符型变量。要符合穷尽和互斥的原则。定序尺度:可比较优劣或排序,但数值不代表绝对数量大小,可以是数值型变量,可以是字符型变量。可以计算频数、频率和累计频率、累计频数。 定距尺度:不仅能区分不同类型并排序,还能指出类别之间的差距是多少,最典型的是温度。严格来说只能加减。其0值没有物理含义,没有绝对的“0”点,故不能做乘、除运算。 定比尺度:测算两个测度值之间比值,与定距变量相比差别是有一个固定的绝对“零点”。0在定距变量中仅是一个测量值,而定比变量真正表示没有。可以加减乘除。E.g.重量、年龄

相关主题