搜档网
当前位置:搜档网 › 统计学 SPSS作业

统计学 SPSS作业

统计学  SPSS作业
统计学  SPSS作业

频率

统计量

XB 性别

MRC 月消费金额

N

有效 126 126 缺失

频率表

XB 性别

频率

百分比 有效百分比 累积百分比 有效 A 、男

65 51、6 51、6 51、6 A 、女 61

48、4 48、4 100、0

合计

126 100、0

100、0

MRC 月消费金额

频率

百分比

有效百分

比 累积百分

比 有效 A 、300元-400

1

、8

、8

、8

B 、401元-600元

9 7、1 7、1 7、9

C 、601元-1000元

77 61、1 61、1 69、

D 、1000元以上 39 31、0 31、0 100、0

合计

126 100、0

100、0

通过以上交叉表可知,男性日常用品花费在41-60元与61-100元这两个区间所占比例

从上图中可以知道图中显示性别的分割点分别为1与1、48,,SPSS计算出游程数分别共有1与8,表格中年龄所使用的分割点为均数19与19、59,而不就是原先的中位数20,导致游程增加到46与35、

低于基线水平100、样本均数抽样误差为0、13216

由上面的检验结果t=-742、635 p=0 由于p值小于检验水准0、05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差就是否为齐性方差,这里的检测结果为F=10、975,P=0、006,因此拒绝Ho,认为本例中两个样本所在总体的方

差就是不齐的。

相关性

控制变量NL年龄YY

MRC月消费金额NL年龄相关性1、000 、

显著性(双侧) 、、

df 0 15

YY 相关性、1、000

显著性(双侧) 、、

df 15 0

在控制了月消费金额之后计算出的年龄与总指数的偏相关矩阵,可见两者的偏相关系数为1。

G图

对心目中合理的消费状态与结构的调查显示,超过50%的学生希望让每个月有盈余,可供自己支配,也有20%左右的学生希望能制定出较细的消费计划。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

教育统计学与SPSS名解总结

第一章导论(阅览前必读:书上每个章节后的名解我全都列出来了,黑色字体的都是书上原文,量多,但有些不重要的名解没必要背,你挑着背不要被吓到。绿色是章节题目,红色的就是我的一些说明、补充、吐槽,一个人打字很无聊啊有木有!一直自言自语啊有木有!并非书上的名词解释,看看就好,可删。这段紫色的也删了哈。接下来……正文,走你!) 统计学(statistics):即研究统计原理与方法的科学。 教育统计学(educational statistics):是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。 描述统计(descriptiive statistics):是实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。 Or:是研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质的一种统计方法。 推断统计(inferencial statistics):又称抽样统计,它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的团体。 Or:是研究如何通过局部数据所提供的信息,运用概率的理论进行分析论证,在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。 实验设计(experimental statistics):是研究如何更加合理、有效的获得观测资料,如何更正确、更经济、更有效的达到实验目的,以揭示实验中各种变量关系的实验计划。 Or:实验者为了揭示实验中自变量与因变量的关系,在实验之前所制定的实验计划,称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。 小数永存法则:从总体中抽取的第一个样本中所表现的特性,在其他样本中也会存在。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。 有效数字:是指能影响测量准确性的数字。 随机变量(random variable):在统计学中把在取值之前不能预料到取什么值的量称为变量(随机变量)。 数据(data):如果一旦某个数值被取定了,成这个数值为随机变量的一个观察值,即数据。 总体(population):指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。 个体(individual): 构成总体的基本单位或单元,又称元素或个案。 样本(sample):从总体中抽取的一部分个体。 参数(parameter):表示总体特征的量数。 统计量(statistic):是直接从样本计算出的量数,代表样本的特征。

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 ●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 ●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 产品类型体重变化情况 明显减轻无明显变化 第一种产品2719 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing

Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度? 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开(O)】→【数据(A)】→文件类型选“Excel(*.xls,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,在“范围” 中输入“A1:Q283”→【确定】→在“变量视图”窗口,调整A1变量的宽度,输入变量名标签和变量值标签→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“居民储蓄调查数据”→【保存】. 8、现有股民投资状况调查的文本数据,文件名为“股民投资数据.txt”。其中各变量的含义和编码见文件“股民投资数据.xls”。请将该文本数据读入SPSS,并定义变量名标签和变量值标签。其中各变量取值为9的均为用户缺失值,请加以定义说明。(注:本调查问卷中涉及多选项问题,以及多选项问题的编码等,可先忽略。) 【文件(F)】→【打开文本数据(D)】→【数据(A)】→文件类型选“Text(*.txt,…)”,文件名选“股民投资数据.txt”,【打开】→在“您的文本文件与预定义的格式匹配吗?”中选“否”,【下一步】→在“变量名称是否包括在文件的顶部”中选“是”,【下一步】→在“第一个数据个案从哪个行号开始”中输入“2”,其他默认,【下一步】→【下一步】→在“数据格式”中输入“字符串”,接着在弹出的窗口输入“4”,【下一步】→默认各选项,【完成】→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“股民投资数据”→【保存】.

统计学 SPSS作业

频率 统计量 XB性别MRC月消费金额 N 有效126 126 缺失0 0 频率表 XB性别 频率百分比有效百分比累积百分比 有效 A.男65 51.6 51.6 51.6 A.女61 48.4 48.4 100.0 合计126 100.0 100.0 MRC月消费金额 频率百分比有效百分比累积百分比 有效 A.300元-400元 1 .8 .8 .8 B.401元-600元9 7.1 7.1 7.9 C.601元-1000元77 61.1 61.1 69.0 D.1000元以上39 31.0 31.0 100.0 合计126 100.0 100.0

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 游程检验 2 XB性别NL年龄 检验值a 1.48 19.59 案例 < 检验值65 70 案例 >= 检验值61 56 案例总数126 126 Runs 数8 35 Z -10.017 -5.112 渐近显著性(双侧) .000 .000 a. 均值 从上图中可以知道图中显示性别的分割点分别为1和1.48,,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和19.59,而不是原先的中位数20,导致游程增加到46和35.

可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0 由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975,P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性 1.000 . 显著性(双侧). . df 0 15 YY 相关性. 1.000 显著性(双侧). . df 15 0 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图

教育统计学 SPSS练习题

1.某学校初中一年级80名学生的数学考试成绩如下,制作频数分布表和图形并作频数分布分析。 某校初一年级80名学生的数学考试成绩 88,89,90,72,89,88,84,83,92,86 90,86,76,87,91,90,90,74,85,84 90,85,89,76,77,85,93,91,81,84 91,83,80,85,87,86,87,84,89,91 84,89,88,84,83,95,85,89,89,89 80,95,83,91,86,87,92,93,89,73 95,82,87,89,80,70,85,85,68,83 82,89,88,85,90,89,80,90,77,72 2.将第1题中的80名学生的数学考试成绩分成0-60,60-70,70-80,80-90,90-100五段,进行分段频数统计,并绘制频数分布条形图 3.某班学生政治面貌分布情况为:党员21人,团员35人,群众43人,请绘制统计图。 4.某班学生政治面貌分布情况为:党员21人(其中男生11人,女生10人),团员35人(其中男生15人,女生20人),群众43人(其中男生23人,女生20人),请绘制统计图。 5.某职业技术学院2000年对其240名学生家长的职业调查结果如下:公务员58人,医生26人,军人15人,工人90人,个体工商业主45人,教师6人,请据此绘制一个圆形图。 6.对15名初三学生用一套初中数学水平测验试卷进行测试,其测验得分如下,另以这些学生的校内数学期末考试成绩为效标,试计算初中数学水平测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 水平测验得分56 73 65 78 64 77 90 61 54 75 45 72 88 95 61 期末成绩63 65 70 74 68 85 92 64 59 70 50 79 90 91 65 7.某大学一年级12名学生的英语阅读理解能力测验成绩与其平时阅读作业成绩如下表所列,试计算阅读理解能力测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 测验得分32 33 34 34 36 37 38 39 40 41 43 45 作业成绩(等级)6 4 2 7 5 9 1 3 11 12 10 8 8. 从某班学生中随机抽取15名,测得他们的数学成绩如下: 65,77,80,78,89,90,74,73,89,95,83,56,68,92,82 (1)试对该班学生的数学平均成绩和成绩的离散程度作出估计。 (2)试求该班成绩均值的95%和99%的置信区间。 9.已知某年级学生的语文成绩服从正态分布,其中总体平均数为76.9,标准差未知。现从该年级某班随机抽取16名学生的语文成绩,数据如下: 75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,问该班学生的平均语文成绩是否也是76.9?(α=0.01)

统计分析与SPSS的应用(第五版)课后练习答案(第6章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第6章SPSS的方差分析 1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示: 1)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。 2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。 (1)分析→比较均值→单因素ANOV A→因变量:销售额;因子:组别→确定。 ANOVA 销售额 平方和df 均方 F 显著性 组之间405.534 4 101.384 11.276 .000 组内269.737 30 8.991 总计675.271 34 概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。

可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有显著差异。 2、从两个总体中分别抽取n 1 =7 和和n 2 =6 的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格“A”和单元格“B”内的计算结果。 答:已知组内均方=组内偏差平方和/自由度,所以A=26.4/11=2.4 F 统计量=组间均方/组内均方所以B=7.5/2.4=3.125 3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。 1)请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么? 2)请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。 3)如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者?(1)因F检验的概率P值小于显著性水平(0.05),拒绝原假设,方差不齐,不满足方差分析的前提假设。 (2)4*276.032=1104.128;1104.128+1524.990=2629.118;4+63=67;1524.990/63=24.206 (3)各组均值存在显著差异。更适合第三组 4、 1)选择恰当的数据组织方式建立关于上述数据的SPSS数据文件

统计学模拟实验spss 实验报告

(此文档为word格式,下载后您可任意编辑修改!) 目录 第一章数据介绍 (3) 1.1研究问题的提出 (3) 1.2数据的来源 (3) 第二章基本统计分析 (4) 2.1 基本统计分析 (4) 2.1.1 全部变量的频数分析 (4) 2.1.3变量的交差分析 (9) 2.1.5 异常值的检验 (12) 2.2 参数检验 (13) 2.2.1 单样本T检验 (13) 2.2.2 两独立样本T检验 (14) 2.3 相关分析 (14) 2.4 多元线性回归分析 (15) 第三章总结和建议 (21) 3.1 存在的问题 (21) 3.2 如何改进这些不足 (21) 附录A22 附录B22

摘要 当前的消费市场中,大学生作为一个特殊的消费群体正受到越来越大的关注。由于大学生年纪较轻,群体较特别,有着不同于社会其他消费群体的消费心理和行为。一方面,他们有着旺盛的消费需求,另一方面,他们尚未获得经济上的独立,消费受到很大的制约。消费观念的超前和消费实力的滞后,都对他们的消费有很大影响。社会大众对大学生的消费存在种种争议,认为他们出手阔绰。本文从我校大学生消费状况,消费的行为、消费结构、消费倾向和消费观念等方面来分析大学生的消费特征以及怎样提高他们的消费观念和理财能力,引导在校大学生树立正确的消费观。 关键词:大学生消费观;理性;问题;改进;数据分析

第一章数据介绍 1.1研究问题的提出 大学生消费问题日渐成为一个社会广为关注的问题,大学生作为一个特殊的群体,处于校园与社会交界处,脱离了父母,开始经济独立,独自生活。大学是一个精彩的世界,社会生活又是充满诱惑的,对大学生的消费都存在着很大的影响。同时也不免回存在一些非理性的消费问题,导致社会群众对大学生消费状况的批评。为了弄清大学生的消费问题的真实问题本小组成员进行了该项调查主要想弄清楚大学生们平时把钱花在哪里,花多少,影响他们消费的因素有哪些,以及他们在消费中有那些问题,应该怎样的去改造这些问题。 1.2数据的来源 本次分析的数据来源于我校90名不同专业和年级的同学消费情况调查。Spss数据中共包含十一变量,分别是:性别,户口状况,家庭年总收入,月生活费,伙食费占生活费的比例,娱乐占生活费的比列,生活费的来源,消费习惯,消费倾向,消费商品是注重,生活费盈余的处理,消费状况是否满意。通过运用spss统计软件,对变量进行基本统计分析、参数检验、相关分析、回归分析,以了解我校同学在上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 第二章基本统计分析 2.1 基本统计分析 2.1.1 全部变量的频数分析 户口情况频数分析(表一) 频率百分比有效百分比累积百分比 有效城镇17 18.9 18.9 18.9 农村73 81.1 81.1 100.0 合计90 100.0 100.0 从表一中可知被调查的同学中有73人来自农村占总人数的81%,只有17个同学来自城镇占总人数的19%。说明我校学生户口大多数分布在农村,生活水平较低。 性别状况的频数分析(表二) 频率百分比有效百分比累积百分比

统计分析与SPSS应用_期末作业

统计分析与SPSS的应用 摘要:为对统计分析与spss应用分析所学知识进行巩固和检验,特运用所学知识进行简单的统计分析应用,下文以某校学生学期成绩进行模拟分析。 一:原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

统计分析与SPSS应用 期末作业

统计分析与SPSS的应用 原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

社会统计学与spss应用练习题[1]

一、单项选择题 1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量 2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B) A. B. C.

D. 3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这说明新生婴儿性别状况属于(D)。 A.非统计现象 B.统计现象 C.非随机现象 D.随机现象 4.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这体现新生婴儿性别状况具有(D)。 A.确定性 B.因果性 C.必然性 D.随机性 5.为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。(B) A.完备 B.互斥 C.整体 D.差异 6.下列哪类变量能用折线图表示其分布状况?(C) A.定类变量 B.定序变量 C.定距变量 D.虚拟变量 7.下列某变量取值状况的累积图,其中正确的表现形式是(B)。

8.下两图是正态分布密度曲线,两图的σ2相同,图1较之图2的密度曲线向左移了一些,这说明(C)。 A.μ1>μ2 B.μ1=μ2 C.μ1<μ2 D.μ1≥μ2 9.在SPSS软件中, 对于多选项分析而 言,如下所示首先应 该操作步骤的是(C) A.B. C.D. 图1 图2

《统计分析与SPSS的应用(第五版)》课后练习

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

统计学SPSS作业

频率 频率表 XB生别 交叉表

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 例较大;女性则较集中在41-60元这一区间。 游程检验 a. 中值 b. 所有值都大于或小于分界值。无法执行 Runs检验。 c. 仅有一次运行。无法执行Runs检验 从上图中可以知道图中显示性别的分割点分别为1和1.48, ,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和佃.59,而不是原先的中位数20,导致游程增加到46和35.

T检验 可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。 T检验

分析结果的第一部分为Levene'方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975, P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。

a L Lift: CF消费结构 对心目中合理的消费状态和结构的调查显示,超过50%的学生希望让每个月有盈余, 可供自己支配,也有20%左右的学生希望能制定出较细的消费计划。

均缎=5J5 惋准爾基=5.47 N=126 最终生成的图如上 图,可见现在大学生存在的消费弊端的分布不接近正太曲线,左侧几个较高的极端值存在,图形右侧还自动给出了样本的均值,标准差和样本量。 根据上图,可以知道在大一和大二学生当中,生活费来源于父母和勤工俭学的学生中, 女性大于男性;在大三学生当中,生活费来源于做兼职的学生当中,男性大于女性;而在大四学生当中,生活费来源于其他的男女学生相差不大。

统计学 SPSS作业

频率 统计量 XB 性别 MRC 月消费金额 N 有效 126 126 缺失 频率表 XB 性别 频率 百分比 有效百分比 累积百分比 有效 A 、男 65 51、6 51、6 51、6 A 、女 61 48、4 48、4 100、0 合计 126 100、0 100、0 MRC 月消费金额 频率 百分比 有效百分 比 累积百分 比 有效 A 、300元-400 元 1 、8 、8 、8 B 、401元-600元 9 7、1 7、1 7、9 C 、601元-1000元 77 61、1 61、1 69、 D 、1000元以上 39 31、0 31、0 100、0 合计 126 100、0 100、0

通过以上交叉表可知,男性日常用品花费在41-60元与61-100元这两个区间所占比例 从上图中可以知道图中显示性别的分割点分别为1与1、48,,SPSS计算出游程数分别共有1与8,表格中年龄所使用的分割点为均数19与19、59,而不就是原先的中位数20,导致游程增加到46与35、

低于基线水平100、样本均数抽样误差为0、13216 由上面的检验结果t=-742、635 p=0 由于p值小于检验水准0、05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。 分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差就是否为齐性方差,这里的检测结果为F=10、975,P=0、006,因此拒绝Ho,认为本例中两个样本所在总体的方

差就是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性1、000 、 显著性(双侧) 、、 df 0 15 YY 相关性、1、000 显著性(双侧) 、、 df 15 0 在控制了月消费金额之后计算出的年龄与总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图 对心目中合理的消费状态与结构的调查显示,超过50%的学生希望让每个月有盈余,可供自己支配,也有20%左右的学生希望能制定出较细的消费计划。

SPSS管理统计学作业

洪城水业2009-2013年日收盘价与大盘走势分析研究 --以上证A股洪城水业(600461)为例 (一)个股分析 本文我们将对洪城水业2009-2013年五年每日的收盘价为样本研究对象,将大盘走势用上证综合指数来表示。剔除离群值,画出图形,并进行数据分析。本文数据来源于国泰安数据库,利用EXCEL! SPSS21.进行分析。在我们所要分析的数据中,有时会出现个别测定值与其他数据相差甚远,这些数据被称为离群值。而离群值对统计分析会造成影响,造成参数估计的偏离,统计分布的错判,以及对统计方法的选择与结果解释都会造成一定的影响,从而得出错误的统计分析结论。常用的剔除离群值的方法有:(1)可依据常识和 原理直接判断;(2)箱线图观察;(3)Z值观察。箱线图法剔除离群值相对精确,因此为提高数据的代表性我们选择此种方法去除离群值对样本的影响。如图: 图1-1 箱线图 2009 2010 2011 2012 2013 处励「I期图1-2 图中的点为疑似异常点,相应的序号为245、246、247、256、258、259、260、265、458、463、465、466、469、1177、1176代表异常点在各列对应的位置。将这些离群值去掉所得洪城水业历史五年从2009-2013年每日收盘价共1192个数据。图中横轴表示时间,纵轴表示日收盘价。从箱线图1-1中我们可以看出2010年日收盘价相对较高,而2011年全年股价的每日收盘价差异较大,并在这一年股价也达到了历史最高水平,相对前几年来说2012-2013股价变化平稳。

图1-3 交易日期 频率百分比有效百分比累积百分比 2009 241 20.2 20.2 20.2 2010 236 19.8 19.8 40.0 2011 240 20.1 20.1 60.2 有效 2012 237 19.9 19.9 80.0 2013 238 20.0 20.0 100.0 合计1192 100.0 100.0 图1-3表示洪城水业2009-2013年日收盘价的频率分析图 图1-4 N 极小 值 极大值均值标准差偏度峰度 统计量统计 量统计 量 统计量标准误统计量统计 量 标准 误 统计量标准 误 2009 241 5.61 12.07 9.1080 .09352 1.45184 -.271 .157 -.167 .312 2010 236 10.52 18.64 14.9551 .11298 1.73566 -.575 .158 .554 .316 2011 240 8.09 19.87 13.1935 .23612 3.65803 .414 .157 -1.637 .313 2012 237 6.11 9.03 7.4653 .04368 .67245 .385 .158 -.703 .315 2013 238 6.26 9.15 7.6996 .03709 .57222 .194 .158 -.283 .314 数据来源:作者手工整理 根据2009-2013年洪城水业个股收盘价描述性分析图可以看到5年历史日收盘价2009年为最低值5.61在2011年达到最大值19.87,股价波动的最大差距为14.26,反映股价5年间波动较大。2010年日收盘价均值为14.9551均高于其他年度,说明2010年洪城水业股票价格增长势头明显,可以给投资者带来更多投资回报。而2012年和2013年日收盘价的最小值分别为6.11和6.26,最大值为9.03和9.15,标准差分别为0.67245和0.57222,表明这两年股价变化平稳,相比以往年度有所下降。 图1-5 曰收陽价 N - 1 ,1DS = 10.48

统计学与spss作业

《多元统计与SPSS》作业 作业1:举例说明总体、个体、抽样、样本、样本含量、抽样误差 作业2:举例说明什么是统计量、参数 作业3、把下列表1的154个分数输入SPSS,请完成下列各项: (1)计算这154个分数的极差、最大值、最小值、中位数、百分位数(8%、15%、25%、41%、57%、64%、73.3%、82.55%、91.6%、99%)、平均数、标准差、标准误、方差。并检验这个 样本与总体(μ=58.5)是否有显著性差异。 (2)计算成绩大于等于60分的数据的极差、最大值、最小值、中位数、百分位数(10%、25%、50%、75%、90%)、平均数、标准差、标准误、方差。并检验这个样本与总体(μ=76.5) 是否有显著性差异 (3)按下列规则对全部数据重新编码:大于等于90的标为9,80分以上(含80)至89分(含89分)标为8,其它类推为7、6、5、4、3、2、1、0。然后统计各分数段的频数和频率 表1 原始数据 12 5 23 34 46 52 64 77 82 93 21 67 87 69 4 13 3 5 31 47 53 63 7 6 88 91 78 68 86 85 12 24 35 46 5 7 6 8 7 9 80 91 56 67 76 87 76 34 45 56 67 68 78 77 79 86 83 84 91 56 57 45 65 57 76 78 67 87 67 76 91 45 67 78 87 56 67 78 89 55 66 77 85 66 68 62 76 76 82 45 56 67 68 60 76 75 78 76 86 85 74 71 70 91 87 83 77 78 71 72 73 65 67 63 61 56 54 43 44 55 66 77 88 90 22 11 34 45 56 67 76 56 65 76 67 78 87 71 72 74 75 75 65 65 82 34 45 65 76 56 67 68 69 76 75 78 76 86 87 作业4、下列表2是实验组A(22人)和对照组B(21人)在实验前后的数据,实验组在音乐的伴奏下进行为期3个月的立定跳远训练,对照组进行为期3个月的传统立定跳远训练,请把数据输入SPSS,并把差异检验结果列在一个三线表格内,再对检验结果进行分析。 表2 两个组实验前后情况 A实验前 2.00 2.02 2.03 2.05 2.10 2.11 2.03 2.04 2.05 2.08 2.08 2.05 2.12 2.15 1.98 1.96 2.08 2.10 2.11 2.05 2.04 2.03 A实验后 2.23 2.25 2.28 2.34 2.35 2.36 2.34 2.38 2.39 2.27 2.33 2.36 2.39 2.38 2.35 2.33 2.41 2.42 2.43 2.35 2.33 2.29 B实验前 2.00 2.01 2.05 2.26 2.01 2.11 2.15 2.05 2.08 2.09 2.08 2.11 2.09 2.08 1.98 1.95 2.11 2.08 2.07 2.07 2.05 B实验后 2.18 2.19 2.20 2.21 2.22 2.23 2.18 2.17 2.16 2.23 2.19 2.23 2.25 2.19 2.18 2.18 2.16 2.20 2.21 2.22 2.19 作业5 (1)ABCD四组立定跳远的成绩如下,检验他们之间的显著性差异。 (2)按照下列标准重新编码:2.20以下计为1,2.21—2.30之间计为2,2.31以上计为3,则检验四组之间是否有显著性差异? (3)利用(2)的数据,把1、2、3看作是收入高、中、低标志,把ABCD看作是经济发达程度渐低的4个区域,问从四个区域抽出的样本的收入与地区发达程度的关系如何? 表3 原始数据 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A 2.34 2.41 2.17 2.17 2.31 2.44 2.33 2.43 2.16 2.40 2.44 2.30 2.14 2.20 2.24 2.16

spss统计分析作业

一分析使用长托宁和阿托品致全麻患者术后谵妄的比较。随机抽取100人,其中50人使用长托宁,50人使用阿托品。使用长托宁致术后谵妄的有23人,使用阿托品致术后谵妄的有8人。分析两者在致术后谵妄方面是否有区别。 具体过程如下: 首先打开S PS S 1的软件后,点击切换到变量输入窗口录入数据组,然后选择“人数” 建立加权变量。加权变量设置好后选择菜单栏的“分析”—“描述统计”—“交叉表”,根据所弹出的菜单设置交叉表。 WEIGHT BY 人数. CROSSTABS /TABLES=组别 BY 是否患病 /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT /COUNT ROUND CELL. 交叉表 [数据集0]

假设H0:手术后有区别 H1:手术后没有区别 读取结果:卡方值为6.550,自由度为1,双侧概率为0.015。 如果按照常用的判断临界值双侧P=0.05来看的话,由于P>0.05则拒绝原假设H0,接受备择假设H1。所以可以认为两组对导致术后谵妄方面是没有有明显区别的。 相关性 CORRELATIONS /VARIABLES=是否患病人数 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE. [数据集0]

从以上结果,可以看出“Pearson"的相关性为0.778,(可以认为是“两者的相关系数为0.778)属于“正相关关系”同时“显著性(双侧)结果为0.000,由于0.000<0.01,所以具备显著性,得出:“是否患病”和“人数”具备相关性。 二对某人外出乘坐交通工具费用(20天)进行描述性统计分析。 描述性统计分析主要是对数据进行基础的描述,通过平均值、标准差、方差、偏度等统计量,来评估原始数据的集中程度,离散程度和分布状况。 打开分析菜单——描述性,在相应的对话框进行操作。 FREQUENCIES VARIABLES=VAR00001 /NTILES=5 /PERCENTILES=20.0 40.0 60.0 80.0 /STATISTICS=STDDEV VARIANCE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SKEWNESS SESKEW /HISTOGRAM NORMAL /ORDER=ANALYSIS.

相关主题