搜档网
当前位置:搜档网 › spss实践题分析及答案(二)

spss实践题分析及答案(二)

spss实践题分析及答案(二)
spss实践题分析及答案(二)

期末实践考查

一、一家消费者调查有限公司,它为许多企业提供消费者态度和消费者行为的调查。在一项研究中,客户要求调查消费者的消费特征,此特征可以用来预测用户使用信用卡的支付金额。研究人员收集了50位消费者的年收入、家庭人口和每年使用信用卡支付的金额数据。试按照客户要求进行分析,给出分析报告(数据见附表)。

Descriptive Statistics

Mean Std. Deviation N

消费金额(元)3964.06 933.494 50

年收入(元)43480.00 14550.742 50

家庭人口(人) 3.42 1.739 50

Model Summary b

Model R R Square Adjusted R Square Std. Error of the Estimate

结果分析:由题目可知客户要求,是根据消费者年收入、家庭人口来预测其每年使用信用卡支付的金额数据,属于多元线性回归问题,其中年收入和家庭人口 看作两个自变量,每年信用卡支付金额看作因变量。 由分析得:

121304.9050.033356.296y x x =++

y :信用卡支付金额 1x :年收入 2x :家庭人口

拟合优度检验2R为0.818,回归方程能很好的代表样本数据。回归方程F检验和回归系数T检验的相伴概率都小于显著性水平,拒绝零假设即回归方程和回归系数都具显著型。

二、下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析,并给出分析报告。

Between-Subjects Factors

Value Label N

类别0 0 20

1 1 20

Tests of Between-Subjects Effects Dependent Variable:肺活量

Source Type III Sum

of Squares df

Mean

Square F Sig.

Corrected Model 6981685.13

5a

2 3490842.56

8

22.860 .000

Intercept 208064.290 1 208064.290 1.363 .251

身高1630762.63

5 1 1630762.63

5

10.679 .002

类别1407847.09

5 1 1407847.09

5

9.220 .004

Error 5649992.36

5

37 152702.496 Total 6.633E8 40

Corrected Total 12631677.5

00

39

a. R Squared = .553 (Adjusted R Squared = .529

结果分析:控制变量的相伴概率值是0.004,小于显著性水平0.05,因此拒绝零假设,故在剔除身高对肺活量的影响前提下,是否经常进行体育锻炼对肺活量有显著影响;另外协变量相伴概率为0.002,说明身高的不同水平对肺活量也有显著影响。

三、甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?试就此问题进行分析并给出分析报告。

结果分析:

由方差齐次性检验表可知,甲乙丙三个地区的的身高、体重和胸围的方差检验相伴概率都大于显著性水平,因此接受零假设,即三个地区的身高、体重和胸围方差相同没有显著性差异,即不同地区,身高、体总和胸围各总体均值服从方

差相同的正态分布,因此可以用下面的单因素方差检验。

身高:(2,87)12.164

F=相伴概率为0.000小于显著性水平,则各地区身高有显著性差异。

体重:(2,87)10.044

F=相伴概率为0.000小于显著性水平,则各地区体重有显著性差异。

胸围:(2,87)7.499

F=相伴概率为0.001小于显著性水平,则各地区胸围有显著性差异。

再由LSD,S-N-K和图表分析可知,甲地区(城市)8岁男孩身高和胸围与乙(县城)、丙(农村)地区有显著性差异,乙地区(县城)8岁男孩体重与甲(城市)、丙(农村)地区有显著性差异。

四、某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析,并给出分析报告。

Descriptive Statistics

结果分析:由分析可知,要进行发硒和血硒两个定距变量的相关分析。由上图表可得发硒和血硒的pearson相关系数为0.872,为高度相关。假设检验得出的相伴概率0.001小于显著水平0.01,因此拒绝零假设,即可以用它们的样本相关系数r代替总体相关系数ρ。

五、某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表, 试对该资料作控制体重影响作用的身高与肺活量相关分析,并给出分析报告。

结果分析:由上表分析可知,体重和肺活量的相关系数为0.613,身高和体重的相关系数为0.719,身高和肺活量的相关系数为0.588,三者之间为中度相关。

身高对体重和肺活量都有影响,剔除它的影响,采用偏相关分析,体重和肺

活量相关系数为0.337,为低度相关,相伴概率值为0.079,大于显著性水平0.05,因此接受原假设,即不可以用样本相关系数代替总体相关系数。

六、某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试分析“体表面积”可能满足的数学模型,并给出分析报告。

结果分析:由题目要求可知,这是一个多元线性回归问题。 上述图表知,体表面积与身高体重的关系为

122.8560.0690.184y x x =-++

其中 y :体表面积 1x :身高 2x :体重

拟合优度检验2R 为0.874,回归方程能很好的代表样本数据。回归方程F 检验和回归系数T 检验的相伴概率都小于显著性水平,拒绝零假设即回归方程和回归系数都具显著型。

七、某地1963年调查得儿童年龄(岁)X 与锡克试验阴性率(%)Y 的资料如下,试分析锡克试验阴性率,并给出分析报告。

结果分析:首先由散点图可知,锡克试验阴性率与年龄为非线性关系,因此采用曲线拟合。由表格可知,最佳拟合曲线为三次曲线(cubic),拟合优度2R为0.994,最佳拟合曲线方程为:

23

=+-+

y x x x

25.57137.428 6.5700.381

y::锡克试验阴性率(%)x:年龄

八、某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对,共8对,并将每对中的两头白鼠随机分到正常饲料组和维生素E缺乏组,过一定时期,测得其肝中维生素A含量。试分析不同饲料的大白鼠肝中维生素A含量有无差别,给出分析报告(数据见附表)

结果分析:同种属的大白鼠按性别相同,年龄、体重相近者配成对,该问题属于两配对样本t检验。由分析得两配对样本t检验的相伴概率值为:0.004,小于显著性水平0.05,因此拒绝零假设,即大白鼠食物中维生素E的不同含量与肝中维生素A的含量有显著性差异。

九、测得西北某城市1971~2007年1月份平均气温数据(见附表)。分析该城市

90年代前后的温度有无显著差异,给出分析报告。

结果分析:由于90年代前后1月份平均气温之间相互独立,属于两独立样本t 检验的问题。由分析可得,方差齐次性性F检验的相伴概率是0.438,大于显著性水平0.05,因此接受零假设,即90年代前后方差相同。t检验相伴概率值为0.002,小于显著性水平0.05,因此拒绝零假设,即该城市90年代前后的温度有显著差异。

SPSS实验报告_线性回归_曲线估计

《数据分析实务与案例实验报告》 曲线估计 学号:2013111104000614 班级:2013 应用统计 姓名: 日期: 2 0 1 4 – 12 – 7 数学与统计学学院

一、实验目的 1. 准确理解曲线回归分析的方法原理。 2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。 3. 熟练掌握曲线估计的SPSS 操作。 4. 掌握建立合适曲线模型的判断依据。 5. 掌握如何利用曲线回归方程进行预测。 6. 培养运用多曲线估计解决身边实际问题的能力。 二、准备知识 1. 非线性模型的基本内容 变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。 下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。 乘法模型: 123y x x x βγδαε= 其中α,β,γ,δ 都是未知参数,ε是乘积随机误差。对上式两边取自然对数得到 123ln ln ln ln ln ln y x x x αβγδε=++++

上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是2ln (0,)n N I εδ: , 而不是2n N I εδ:(0,) ,因此检验之前,要先检验ln ε 是否满足这个假设。 三、实验内容 已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D 生产函数验证了劳动和资本对经济增长的影响机理。所有这些研究都极少将劳动、资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。 现从我国能源消费、全社会固定资产投资和就业人员的实际出发,假定生产技术水平在短期能不会发生较大变化,经济增长、全社会固定资产投资、就业人员、能源消费可以分别采用国内生产总值、全社会固定资产投资总量、就业总人数、能源消费总量进行衡量,并假定经济增长与能源消费、资本和劳动力的关系均满足C-D 生产函数。 问题中的C-D 生产函数为: Y AK L E αβγ= 式中:Y 为GDP ,衡量总产出;K 为全社会固定资产投资,衡量资本投入量;L 为就业人数,衡量劳动投入量;E 为能源消费总量,衡量能源投入量;A,α,β, γ 为未知参数。根据C-D 函数的假定,一般情形α,β,γ均在0和1之间,但当α,β,γ中有负数时,说明这种投入量的增长,反而会引起GDP 的下降,当α,β,γ中出现大于1的值时,说明这种投入量的增加会引起GDP 成倍增加,这在经济学现象中都是存在的。 以我国1985—2004年的有关数据建立了SPSS 数据集,参见

spss实践题分析及答案

SPSS实践题 习题1 分析此班级不同性别的学生的物理和数学成绩的均值、最高分和最低分。

Std. Deviation Minimum Maximum 结论:男生数学成绩最高分: 95 最低分: 72 平均分: 物理成绩最高分: 87 最低分: 69 平均分: 女生数学成绩最高分: 99 最低分: 70 平均分: 物理成绩最高分: 91 最低分: 65 平均分: 习题2 分析此班级的数学成绩是否和全国平均成绩85存在显著差异。 One-Sample Statistics N Mean Std. Deviation Std. Error Mean 数学26 结论:由分析可知相伴概率为,小于显著性水平,因此拒绝零假设,即此班级数学成绩和全国平均水平85分有显著性差异 习题3 分析兰州市2月份的平均气温在90年代前后有无明显变化。

Group Statistics 分组N Mean Std. Deviation Std. Error Mean 二月份气温011.3628400 118.3065729 结论:由分析可知, 方差相同检验相伴概率为,大于显著性水平,因此接受零假设,90年代前后2月份温度方差相同。双侧检验相伴概率为, 小于显著性水平,拒绝零假设,即2月份平均气温在90年代前后有显著性差异 习题4 分析15个居民进行体育锻炼3个月后的体质变化。 Paired Samples Statistics Mean N Std. Deviation Std. Error Mean

Paired Samples Correlations N Correlation Sig. Pair 1锻炼前 & 锻炼后15.277 结论:由分析可知,锻炼前后差值与零比较,相伴概率小于显著性水平, 拒绝零假设,即锻炼前后有显著性差异 习题5 为了农民增收,某地区推广豌豆番茄青菜的套种生产方式。为了寻找该 种方式下最优豌豆品种,进行如下试验:选取5种不同的豌豆品种,每 一品种在4块条件完全相同的田地上试种,其它施肥等田间管理措施完 全一样。根据表中数据分析不同豌豆品种对平均亩产的影响是否显著。 ANOVA 产量 Sum of Squares df Mean Square F Sig.

多元线性回归SPSS实验报告

回归分析基本分析: 将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图 注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。 第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。 第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。 第五列:回归方程的估计标准误差=9.822 回归方程的显著性检验-回归分析的方差分析表 F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。 注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。 第四列:标准化偏回归系数。 第五列:偏回归系数T检验的t统计量。 第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。 于是,多元线性回归方程为: y=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6 回归分析的进一步分析: 1.多重共线性检验 从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

spss软件分析异常值检验实验报告

实验五:残差分析 【实验目的】 (1)通过残差检验,掌握残差分析的方法 (2)异常值检验 【仪器设备】 计算机、spss软件、何晓群《实用回归分析》表和表的数据 【实验内容、步骤和结果】 对何晓群《实用回归分析》表的数据进行残差分析 原始数据如表1,其中y表示货运总量(亿吨)x1表示工业总产值(亿元)x2表示农业总产值(亿元)x3表示居民非商业支出(亿元) 表1. 对表1数据用spss软件进行分析得以下各表

由上表可知复相关系数R=,决定系数R方=,由决定系数看出回归方程的显著性不高,接下来看方差分析表3 由表3知F值为较小,说明x1、x2、x3整体上对y的影响不太显著。 表4系数 模型非标准化系数标准系数 t Sig. B标准误差试用版 1(常量).096 x1.385.100 x2.535.049 x3.277.284

表4系数 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .096 x1 .385 .100 x2 .535 .049 x3 .277 .284 回归方程为 123348.280 3.7547.10112.447y x x x =-+++

图1.学生化残差

差 残差: 对数据用spss进行分析得 表6异常值的诊断分析

数据不存在异常值.绝对值最大的删除学生化残差为SDR=,因而根据学生化删除残差诊断认为第6个数据为异常值.其中中心化杠杆值,cook距离为位于第一大.因此第6个数据为异常值. 对何晓群《实用回归分析》表的数据进行残差分析 原始数据为 : 表个啤酒品牌的广告费用和销售量

spss 期末题库

课程名称:《SPSS分析方法与应用》 课程号: 2007422 一、单项选择题(共112小题) 1、试题编号:1000110,答案:RetEncryption(D)。 SPSS的安装类型有() A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号:1000310,答案:RetEncryption(D)。 数据编辑窗口的主要功能有() A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出 和B 3、试题编号:1000410,答案:RetEncryption(A)。 ()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。 4、试题编号:1000510,答案:RetEncryption(D)。 ()是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号:1000810,答案:RetEncryption(D)。 ()是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号:1000910,答案:RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号:1001010,答案:RetEncryption(B)。 数据编辑窗口中的一行称为一个() A.变量 B.个案 C.属性 D.元组 8、试题编号:1001110,答案:RetEncryption(C)。

变量的起名规则一般:变量名的字符个数不多于() A. 6 B. 7 C. 8 D. 9 9、试题编号:1001210,答案:RetEncryption(A)。 统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号:1001310,答案:RetEncryption(A)。 在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号:1001810,答案:RetEncryption(A)。 SPSS算术表达式中,字符型()应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号:1001910,答案:RetEncryption(A)。 复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 B AND C OR D都不是 13、试题编号:1002010,答案:RetEncryption(A)。 数据选取的方法中,()是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号:1002110,答案:RetEncryption(B)。 通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号:1002210,答案:RetEncryption(A)。 SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号:1002310,答案:RetEncryption(B)。 SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号:1002710,答案:RetEncryption(D)。 SPSS中进行参数检验应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号:1002810,答案:RetEncryption(A)。 SPSS中进行输出结果的保存应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号:1002910,答案:RetEncryption(C)。 SPSS中进行数据的排序应选择()主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

回归分析实验报告

实验报告 实验课程:[信息分析] 专业:[信息管理与信息系统] 班级:[ ] 学生姓名:[ ] 指导教师:[请输入姓名] 完成时间:2013年6月28日

一.实验目的 多元线性回归简单地说是涉及多个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。本实验要求掌握附带残差分析的多元线性回归理论与方法。 二.实验环境 实验室308教室 三.实验步骤与内容 1打开应用统计学实验指导书,新建excel表 2.打开SPSS,将数据输入。 3.调用SPSS主菜单的分析——>回归——>线性命令,打开线性回归对话框,指定因变量(工业GDP比重)和自变量(工业劳动者比重、固定资产比重、定额资金流动比重),以及回归方式;逐步回归(图1)

图1 线性对话框 4.在统计栏中,选择估计以输出回归系数B的估计值、t统计量等,选择Duribin-watson以进行DW检验;选择模型拟合度输出拟合优度统计量值,如R^2、F统计量值等(图2)。 图2 统计量栏

5.在线性回归栏中选择直方图和正态概率图以绘制标准化残差的直方图和残差分析与正态概率比较图,以标准化预测值为纵坐标,标准化残差值为横坐标,绘制残差与Y的预测值的散点图,检验误差变量的方差是否为常数(图3)。 图3 绘制栏 6.提交分析,并在输出窗口中查看结果,以及对结果进行分析。 系统在进行逐步分析的过程中产生了两个回归模型,模型1先将与因变量(销售收入)线性关系的自变量地区人口引入模型,建立他们之间的一元线性关系。而后逐步引入其他变量,表1中模型2表明将自变量人均收入引入,建立二元线性回归模型,可见地区人口和人均收入对销售收入的影响同等重要。

SPSS习题1 答案

习题一(与第三章内容配套) 1.数据文件:《公司职工》 1)按照以下标准,给指定的变量观察值分组: (1)变量:educ(受教育年限) 中学:educ≤12;大学: 12<educ≤16;研究生:educ≥17 (2)变量:age(年龄) 青年:age<40;中年:40≤age<60;老年:age≥60 (3)变量:salary(当前薪金) 低收入:salary≤20000;中收入:20000<salary≤40000;高收入:salary>40000 2)统计老、中、青年各组的人数及占全体职工的比率。 3)统计不同性别的职工中,高、中、低收入的人数,及占全体职工人数的比率。 4)在不同的受教育组中,按性别(gender)统计的不同职务(jobcat)的人数及占全体职工人数的比率。 5)同3),但还要统计每一组的平均当前薪金(salary)、最大当前薪金和最小当前薪金。 2.数据文件:《学生考试成绩》 1)按以下要求,将成绩score分为五等:优:score≥90;良:80≤score<90;中:70≤score<80;及格:60≤score<70;不及格:score<60。 2)按照以上五个等级,统计每一个等级的人数及占总体的比率: (1)总体取全体参加考试的学生; (2)总体取每一个班级; (3)总体取男生及女生。 3)求全体参加考试学生的总平均成绩、每一班的平均成绩以及男、女生的平均成绩。 4)全体学生成绩的中位数是多少?男、女生成绩的中位数分别是多少?成绩在60分(含)以上的学生占全体学生的比率是多少?80%的学生成绩不低于多少分?每一班的最高分与最低分分别是多少? 5)在每一个班级中,分男、女生统计不同成绩等级的学生人数及每一等级的平均分、最高分与最低分。 答案: 1. 1)

spss实践题分析及答案(二)

期末实践考查 一、一家消费者调查有限公司,它为许多企业提供消费者态度和消费者行为的调查。在一项研究中,客户要求调查消费者的消费特征,此特征可以用来预测用户使用信用卡的支付金额。研究人员收集了50位消费者的年收入、家庭人口和每年使用信用卡支付的金额数据。试按照客户要求进行分析,给出分析报告(数据见附表)。 Descriptive Statistics Mean Std. Deviation N 消费金额(元)3964.06933.49450 年收入(元)43480.0014550.74250 家庭人口(人) 3.42 1.73950 Correlations 消费金额(元)年收入(元)家庭人口(人)Pearson Correlation消费金额(元) 1.000.631.753 年收入(元).631 1.000.173 家庭人口(人).753.173 1.000 Sig. (1-tailed)消费金额(元)..000.000 年收入(元).000..115 家庭人口(人).000.115. N消费金额(元)505050 年收入(元)505050 家庭人口(人)505050 Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate

1 .909a .826 .818 398.091 ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 35250755.672 2 17625377.836 111.218 .000a Residual 7448393.148 47 158476.450 Total 42699148.820 49 Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 1304.905 197.655 6.602 .000 年收入(元) .033 .004 .516 8.350 .000 家庭人口(人) 356.296 33.201 .664 10.732 .000 结果分析:由题目可知客户要求,是根据消费者年收入、家庭人口来预测其每年使用信用卡支付的金额数据,属于多元线性回归问题,其中年收入和家庭人口 看作两个自变量,每年信用卡支付金额看作因变量。 由分析得: 121304.9050.033356.296y x x =++ y :信用卡支付金额 1x :年收入 2x :家庭人口

SPSS机试考题答案

第一部分 数据整理考试题 1建立以下数据的数据文件: 对所建立的数据文件进行以下处理: ⑴计算每个学生的总成绩、平均成绩,并按照总成绩的大小进行排序(转换-计算变量,数据-排序个案) ⑵设Z Y X 、、分别表示语文、数学、化学,对称其进行以下处理: ①X X =' ②5+='Y Y (x1=sqrt(x)) ③对化学成绩,若是男生,5+='Z Z (转换-计算变量) 若是女生:10+= 'Z Z ④把数学成绩分成优、良、中三个等级,规则为优(X ≥85),良(75≤X ≤ 84),中(X ≤74),并进行汇总统计。(转换-重新编码为不同变量,频数分析) 2 在一次智力测验中,共有10个选择题,每题有A,B,C,D 四个答案,8个被测对象的答卷如下表。已知第1、6、10题的正确答案为A ,第4、5、7、8题的正确答案为B, 第2、9题的正确答案为C, 第3题的正确答案为D,请建立合适的数据文件,统计每个被测对象的总成绩(满分100)。(转换-对个案内的值计数,选择题号,再定义值 A or B C D 然后添加,转换-计算变量,Q+W+E+R 再乘以10就是总成绩) 3某个汽车收费站在每10分钟内统计到达车辆的数量,共取得20次观察数据,分别是:27、30、3l 、33、16、20、34、24、19、27、21、28、32、22、15、33、26、26、38、24,现要求以5为组距,对上述资料进行分组整理。(再重新转换-重新编码为不同变量) 4 练习加权处理功能: ⑴练习课本案例3-8(p84).(加权销售量,再分析-描述统计-描述,只添加单价,均值即是当天平均价格)

最新spss统计练习题及答案

SPSS统计练习题及答案 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data 14、指定数据按某个变量进行排序需要用到哪个菜单?

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data

教育统计基础与spss复习题及答案1

《教育统计基础与spss》复习题及答案一、填空题 1 2 3 4. 5 6.“65、66、72、83、89 7.6位学生的身高分别为: 145、135、128、145、140、130厘米,他们的众数 8. 9. 10 11 12 13. 从数量关系的特点看,事物或者现象之间的关系可以分为两种类型:其一 14. 15. 16. 二、判断题 1、教育统计学属于应用统计学。(√) 2、正态分布、t分布与F分布都是对称分布。(×) 3、统计数据的真实性是统计工作的生命(√) 4、汉族是一个品质标志。(×) 5、描述一组数据波动情况的量数称为差异量数。(√) 6、集中量数反映的是一组数据的集中趋势。(√) 7、在一个总体中,算术平均数、众数、中位数可能相等。(√) 8、同一总体各组的结构相对指标数值之和不一定等于100%。(×) 9、不重复抽样误差一定大于重复抽样误差。(×) 10. 一致性是用样本统计量估计统计参数时最基本的要求。(×) 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( A )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是(B )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( C )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( D )。 1

A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是(D )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( D )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量7.下列统计指标中,属于数量指标的有(A) A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数 变为( B )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 9. 当标准差是下面哪一个数值时,该组数据平均数的代表性最好?( A) A.2.8 B.5.5 C.5.2 D.9.8 10.当一组数据中有某个奇异值时,应该用下面哪一种统计量反映该组数据的集中趋势?( D ) A.算术平均数 B. 几何平均数 C.加权平均数 D.中位数 11.某班期末语文、数学、外语考试的平均成绩分别为80,72,60,标准差分别为7,6.5,5。问哪科成绩相对整齐些?(C) A.语文 B.数学 C.外语 D.无法比较 12. 在正态分布中,如果平均数增大,正态分布曲线会(D ) A.上移 B.下移 C.左移 D.右移 13.在正态分布中如果标准差增大,正态分布曲线会(D) A.左移 B.右移 C.变陡峭 D.变平缓 14.某学生凭猜测回答两道选择题,答对第一题的概率为51,答对第二题 的概率为41,那么他至少答错一道题的概率为(B) A.0.35 B.0.95 C.0.75 D.0.8 15.在统计假设检验中,若某样本在总体中出现的概率在0.01——0.05之 间,则说明(A) A.样本与总体之间无显著差异 B.样本与总体之间有显著差异 C.样本与总体之间差异非常显 D.无法判断 16.非参数检验法与参数检验法相比较,最大的缺点是(D) A.计算量大 B.检验方法意义不明确 C.限制条件较宽 D.样本信 息利用不充分 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 答:(1)表明同类统计事项指标的对比关系; 2

SPSS实验报告材料91487

CENTRAL SOUTH UNIVERSITY SPSS实验报告 学生王强 学号4303110516 指导教师邵留国 学院商学院 专业工商1101

实验一、数据集 实验目的:掌握基本的统计学理论,学会使用SPSS录入数据,建立SPSS数据集。 实验容: 1.3:三十名儿童身高、体重样本数据如下表所示。建立SPSS数据集。 三十名儿童身高、体重样本数据

13 14 15 男 男 男 14 14 14 168.0 164.5 153.0 50.0 44.0 58.0 28 29 30 女 女 女 15 15 15 158.0 158.6 169.0 44.3 42.8 51.1 实验步骤: 步骤一:启动SPSS。 步骤二:选择文件,新建,数据,如图。 步骤三:切换到变量视图,定义变量。其中,性别变量需要设置值标签。如图所 示。 步骤四:切换到数据视图,按照次序依次输入数据。 步骤五:保存数据。

实验结果:

实验二:统计量描述 实验目的: (1)结合图表描述掌握各种描述性统计量的构造原理及其应用。 (2)熟练掌握运用SPSS进行统计描述的基本技能。 实验容:大学生在校期间的各门课程考试成绩,尽管在学生与学生之间、院系之间、男女生之间以及不同的课程之间,都存在着各种各样的差异,但整体上的分布状况还是有规律可循的。今有两个学院共1040名男女生的统计学和经济学期末考试成绩数据,储存在SPSS数据文件中,文件名:lytjcj.sav。试运用图表描述与统计量描述的方法,对此数据展开尽可能全面和深入的描述与分析。 实验步骤: 步骤一:打开SPSS数据,文件名:lytjcj.sav。如图。

SPSS相关分析实验报告.doc

SPSS相关分析实验报告 篇一:spss对数据进行相关性分析实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R 值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。

(1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。 b.在spssd的菜单栏中选择点击,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.000<0.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.8665<0.921,说明它们之间的显著性关系稍有减弱。通过相关关系与偏相关关系的比较可以得知:在粮价的影响下,人均收入对人均食品支出的影响更大。 三、实验总结 1、熟悉了用spss软件对数据进行相关性分析,熟悉其操

SPSS练习题及解答

实习一SP SS基本操作 第2题-----会做:请把下面的频数表资料录入到SP SS数据库中,并划出直方图,同时计算均数和标准差。 身高组段频数 110~ 1 112~ 3 114~ 9 116~ 9 118~ 15 120~ 18 122~ 21 124~ 14 126~ 10 128~ 4 130~ 3 132~ 2 134~136 1 解答:1、输入中位数(小数位0):111,113,115,117,....135;和频数1,3,. (1) 2、对频数进行加权:DATA━Weigh Cases━Weigh Cases by━频数━OK 3、Analyze━Descriptive Statistics━Frequences━将组中值加入Variable框━点击Statistics按钮━选中Mean和Std.devision━Continue━点击Charts按钮━选中HIstograms ━Continue━OK 第3题—会做:某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表,并计算这81名男性血清胆固醇含量的样本均数。 219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 解答:1、输入数据:单列,81行。 2、Analyze━Descriptive Statistics━Frequences━将变量值加入Variable框━点击Statistics按钮━选中Mean━Continue━点击OK 实习二定量资料的统计分析 第1题--会做:从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(m m o l/L)的测量结果如下,试对其进行正态性检验。 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 解答:样本量大,近似于正态。 1、输入数据(1列,101行)。 2、Analyze━Descriptive Statistics━Explore━Dependent List中加入血清总胆固醇━点击Plots按钮━选中normality plots with tests━Continue━ OK 3、结果分析:T est of norminaty表中P=0.994,大于0.05,服从正态分布。 (会做)第2题:某医院分别用A、B两种血红蛋白测定仪器检测了16名健康男青年的血红蛋白含量(g/L),检测结果见下表。问:两种血红蛋白测定仪器的检测结果是否有差别。 编号仪器A仪器B (1)(2)(3) 1 113 140 2 125 150 3 126 138 4 130 120 5 150 140 6 145 145 7 135 135 8 105 115 9 128 135 10 135 130 11 100 120 12 130 133 13 110 147 14 115 125 15 120 114 16 155 165 解答:配对t检验。 1、输入两列数据:A列(113,125,…155);B列(140,125,…165); 2、Analyze━Compare Means━Paired-Samples T Test━同时将A和B均选入Paired Variabkes框━OK 3、结果分析:由Paired Samples Test表的Sig可见小于0.05,有差别。

相关主题