搜档网
当前位置:搜档网 › spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计
spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离.

5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加

最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.

个独立样本率比较的χ2检验属四格表资料χ2检验。这类资料在医学研究中较为多见。

例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下:

有效无效有效率(%)

试验组 12 1

对照组 3 8

可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。在读取统计结果时,应当注意χ2检验的适用条件,正确选择Pearson卡方检验、Yates校正卡方检验、Fisher 精确概率法(本法不属于χ2检验)。

第三节四格表资料的Fisher确切概率法

前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由年)提出的,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。

下面以例8-1介绍其基本思想与检验步骤。

例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别?

表8-3两组新生儿HBV感染率的比较

组别

阳性

阴性

合计

感染率(%)

预防注射组

4

18

22

非预防组

5

6

11

合计

9

24

33

一、基本思想

在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。

1.各组合概率的计算在四格表周边合计数不变的条件下,表内4个实际频数,,,变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有个,依次为:

(1)

(2)

(3)

(4)

(5)

22

1

21

2

20

3

19

4

18

9

8

3

7

4

6

5

5

6

ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66

(6)

(7)

(8)

(9)

(10)

5

17

6

16

7

15

8

14

13

4

7

3

8

2

9

1

10

11

ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99

各组合的概率服从超几何分布,其和为1。可按公式(8-9)计算

(8-9)

式中,,,,等符号的意义同表7-1;!为阶乘符号。

2.累计概率的计算单、双侧检验不同。

设现有样本四格表中的交叉积差,其概率为,其余情况下的组合四格表的交叉积差记为,概率记为。

(1)单侧检验若现有样本四格表中,须计算满足和条件的各种组合下四格表的累计概率。若,则计算满足和条件的各种组合下四格表的累计概率。

(2)双侧检验计算满足和条件的各种组合下四格表的累计概率。若遇到或时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,然后乘以2即得双侧累计概率。

二、检验步骤

本例,宜用四格表资料的Fisher确切概率法直接计算累计概率。检验步骤为:

(1):,即两组新生儿HBV的总体感染率相等

:,即两组新生儿HBV的总体感染率不等

(2)计算现有样本四格表的和及各组合下四格表的,见表8-4。本例、。

(3)计算满足条件的各组合下四格表的概率。

(4)计算同时满足和条件的四格表的累计概率。本例、、、、和满足条件,累计概率为

表8-4例8-1的 Fisher确切概率法计算表

四格表组合

1

22

9

2

-198

2

1

21

8

3

-165

2

20 7

4

-132

4

3

19 6

5

-99

5* 4

18 5

6

-66* *

6

5

17

7 -33

7 6 16 3 8 0

8 7 15 2 9 33

9 8 14 1 10 66

10

13

11

99

* 为现有样本

。按检验水准不拒绝H0,尚不能认为预防注射与非预防的新生儿HBV的总体感染率不等。

#include<>

#include <>

#include<> /*清屏*/

#include <> /*显示目录*/

#include<>

#define MAX 80

void input(); /*输入数据函数*/

void sort();/*排序数据函数*/

void sort1();

void sort2();

void sort3();

void display();/*显示数据函数*/

void display1();

void insert(); /*插入数据函数*/

void del(); /*删除数据函数*/

void average(); /*平均值函数*/

void find();/*查找数据函数*/

void find1();

void find2();

void save(); /*保存数据函数*/

void read(); /*读出数据函数*/

void del_file(); /*删除文件函数*/ void modify(); /*修改文件函数*/

int now_no=0;

struct student

{

int no;

char name[20];

char sex[4];

float score1;

float score2;

float score3;

float sort;

float ave;

float sum;

};

struct student stu[MAX],*p;

main()/*主函数*/

{

int as;

char ch;

do{

start: printf("\n\n\n\t\t\t欢迎使用学生成绩管理系统\n");

printf("\n\n\n\n\n\n\t\t******************按任意键继续********************");

ch=getch();

}

while(!ch);

system("cls");

/*一下为功能选择模块*/

do

{

printf("\n\t\t\t\t1.录入学员信息\n\t\t\t\t2.显示学员总成绩信息\n\t\t\t\t3.对总成绩排序\n\t\t\t\t4.显示学员单科成绩排序\n\t\t\t\t5.添加学员信息\n\t\t\t\t6.删除学员信息\n\t\t\t\t7.修改学员信息\n\t\t\t\t8.查询学员信息\n\t\t\t\t9.从文件读入学员信息\n\t\t\t\t10.删除文件中学员信息\n\t\t\t\t11.保存学员信息\n\t\t\t\t12.退出\n");

printf("\t\t\t\t选择功能选项(输入所选功能前的数字):");

fflush(stdin);

/*可用可不用,用于清除缓存防止下次用scanf输入是出现错误*/

scanf("%d",&as);

switch(as)

{

case 1:system("cls");

input();

break;

case 2:system("cls");

display();

break;

case 3:system("cls");

sort();

break;

case 4:system("cls");

display1();

break;

case 5:system("cls");

insert();

break;

case 6:system("cls");

del();

break;

case 7:system("cls");

modify();

break;

case 8:system("cls");

find();

break;

case 9:system("cls");

read();

break;

case 10:system("cls");

del_file();

break;

case 11:system("cls");

save();

break;

case 12:system("exit");

exit(0);

default:system("cls");

goto start;

}

}while(1);/*while(1),1表示真,所以while(1)表示永远循环下去,一般在while(1)的循环体内都有break 或者return 跳出循环*/

/*至此功能选择结束*/

}

void input()/*原始数据录入模块*/

{

int i=0;

char ch;

do

{

printf("\t\t\t\t1.录入学员信息\n输入第%d个学员的信息\n",i+1);

printf("\n输入学生编号:");

scanf("%d",&stu[i].no);

fflush(stdin);

printf("\n输入学员姓名:");

fflush(stdin);

gets(stu[i].name);

printf("\n输入学员性别:");

fflush(stdin);

gets(stu[i].sex);

printf("\n输入学员成绩1:");

scanf("%f",&stu[i].score1);

printf("\n输入学员成绩2:");

fflush(stdin);

scanf("%f",&stu[i].score2);

printf("\n输入学员成绩3:");

fflush(stdin);

scanf("%f",&stu[i].score3);

printf("\n\n");

i++;

now_no=i;

printf("是否继续输入(Y/N)");

fflush(stdin);

ch=getch();

system("cls");

}

while(ch!='n'&&ch!='N');

system("cls");

}

void sort()/*排序数据函数*/

{

struct student temp;

int i,j;

average();

for(i=1;i

{

for(j=1;j<=now_no-i;j++)

{

if(stu[j-1].ave

{

temp=stu[j];

stu[j]=stu[j-1];

stu[j-1]=temp;

}

}

}

printf("排序以完成进入功能2可进行显示\n");

system("pause");

system("cls");

}

void sort1()/*排序数据函数*/

{

struct student temp;

int i,j;

for(i=1;i

{

for(j=1;j<=now_no-i;j++)

{

if(stu[j-1].score1

{

temp=stu[j];

stu[j]=stu[j-1];

stu[j-1]=temp;

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

教育统计学与SPSS名解总结

第一章导论(阅览前必读:书上每个章节后的名解我全都列出来了,黑色字体的都是书上原文,量多,但有些不重要的名解没必要背,你挑着背不要被吓到。绿色是章节题目,红色的就是我的一些说明、补充、吐槽,一个人打字很无聊啊有木有!一直自言自语啊有木有!并非书上的名词解释,看看就好,可删。这段紫色的也删了哈。接下来……正文,走你!) 统计学(statistics):即研究统计原理与方法的科学。 教育统计学(educational statistics):是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。 描述统计(descriptiive statistics):是实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。 Or:是研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质的一种统计方法。 推断统计(inferencial statistics):又称抽样统计,它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的团体。 Or:是研究如何通过局部数据所提供的信息,运用概率的理论进行分析论证,在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。 实验设计(experimental statistics):是研究如何更加合理、有效的获得观测资料,如何更正确、更经济、更有效的达到实验目的,以揭示实验中各种变量关系的实验计划。 Or:实验者为了揭示实验中自变量与因变量的关系,在实验之前所制定的实验计划,称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。 小数永存法则:从总体中抽取的第一个样本中所表现的特性,在其他样本中也会存在。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。 有效数字:是指能影响测量准确性的数字。 随机变量(random variable):在统计学中把在取值之前不能预料到取什么值的量称为变量(随机变量)。 数据(data):如果一旦某个数值被取定了,成这个数值为随机变量的一个观察值,即数据。 总体(population):指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。 个体(individual): 构成总体的基本单位或单元,又称元素或个案。 样本(sample):从总体中抽取的一部分个体。 参数(parameter):表示总体特征的量数。 统计量(statistic):是直接从样本计算出的量数,代表样本的特征。

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 ●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 ●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 产品类型体重变化情况 明显减轻无明显变化 第一种产品2719 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing

Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度? 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开(O)】→【数据(A)】→文件类型选“Excel(*.xls,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,在“范围” 中输入“A1:Q283”→【确定】→在“变量视图”窗口,调整A1变量的宽度,输入变量名标签和变量值标签→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“居民储蓄调查数据”→【保存】. 8、现有股民投资状况调查的文本数据,文件名为“股民投资数据.txt”。其中各变量的含义和编码见文件“股民投资数据.xls”。请将该文本数据读入SPSS,并定义变量名标签和变量值标签。其中各变量取值为9的均为用户缺失值,请加以定义说明。(注:本调查问卷中涉及多选项问题,以及多选项问题的编码等,可先忽略。) 【文件(F)】→【打开文本数据(D)】→【数据(A)】→文件类型选“Text(*.txt,…)”,文件名选“股民投资数据.txt”,【打开】→在“您的文本文件与预定义的格式匹配吗?”中选“否”,【下一步】→在“变量名称是否包括在文件的顶部”中选“是”,【下一步】→在“第一个数据个案从哪个行号开始”中输入“2”,其他默认,【下一步】→【下一步】→在“数据格式”中输入“字符串”,接着在弹出的窗口输入“4”,【下一步】→默认各选项,【完成】→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“股民投资数据”→【保存】.

统计学 SPSS作业

频率 统计量 XB性别MRC月消费金额 N 有效126 126 缺失0 0 频率表 XB性别 频率百分比有效百分比累积百分比 有效 A.男65 51.6 51.6 51.6 A.女61 48.4 48.4 100.0 合计126 100.0 100.0 MRC月消费金额 频率百分比有效百分比累积百分比 有效 A.300元-400元 1 .8 .8 .8 B.401元-600元9 7.1 7.1 7.9 C.601元-1000元77 61.1 61.1 69.0 D.1000元以上39 31.0 31.0 100.0 合计126 100.0 100.0

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 游程检验 2 XB性别NL年龄 检验值a 1.48 19.59 案例 < 检验值65 70 案例 >= 检验值61 56 案例总数126 126 Runs 数8 35 Z -10.017 -5.112 渐近显著性(双侧) .000 .000 a. 均值 从上图中可以知道图中显示性别的分割点分别为1和1.48,,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和19.59,而不是原先的中位数20,导致游程增加到46和35.

可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0 由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975,P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性 1.000 . 显著性(双侧). . df 0 15 YY 相关性. 1.000 显著性(双侧). . df 15 0 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图

教育统计学 SPSS练习题

1.某学校初中一年级80名学生的数学考试成绩如下,制作频数分布表和图形并作频数分布分析。 某校初一年级80名学生的数学考试成绩 88,89,90,72,89,88,84,83,92,86 90,86,76,87,91,90,90,74,85,84 90,85,89,76,77,85,93,91,81,84 91,83,80,85,87,86,87,84,89,91 84,89,88,84,83,95,85,89,89,89 80,95,83,91,86,87,92,93,89,73 95,82,87,89,80,70,85,85,68,83 82,89,88,85,90,89,80,90,77,72 2.将第1题中的80名学生的数学考试成绩分成0-60,60-70,70-80,80-90,90-100五段,进行分段频数统计,并绘制频数分布条形图 3.某班学生政治面貌分布情况为:党员21人,团员35人,群众43人,请绘制统计图。 4.某班学生政治面貌分布情况为:党员21人(其中男生11人,女生10人),团员35人(其中男生15人,女生20人),群众43人(其中男生23人,女生20人),请绘制统计图。 5.某职业技术学院2000年对其240名学生家长的职业调查结果如下:公务员58人,医生26人,军人15人,工人90人,个体工商业主45人,教师6人,请据此绘制一个圆形图。 6.对15名初三学生用一套初中数学水平测验试卷进行测试,其测验得分如下,另以这些学生的校内数学期末考试成绩为效标,试计算初中数学水平测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 水平测验得分56 73 65 78 64 77 90 61 54 75 45 72 88 95 61 期末成绩63 65 70 74 68 85 92 64 59 70 50 79 90 91 65 7.某大学一年级12名学生的英语阅读理解能力测验成绩与其平时阅读作业成绩如下表所列,试计算阅读理解能力测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 测验得分32 33 34 34 36 37 38 39 40 41 43 45 作业成绩(等级)6 4 2 7 5 9 1 3 11 12 10 8 8. 从某班学生中随机抽取15名,测得他们的数学成绩如下: 65,77,80,78,89,90,74,73,89,95,83,56,68,92,82 (1)试对该班学生的数学平均成绩和成绩的离散程度作出估计。 (2)试求该班成绩均值的95%和99%的置信区间。 9.已知某年级学生的语文成绩服从正态分布,其中总体平均数为76.9,标准差未知。现从该年级某班随机抽取16名学生的语文成绩,数据如下: 75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,问该班学生的平均语文成绩是否也是76.9?(α=0.01)

统计分析与SPSS的应用(第五版)课后练习答案(第6章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第6章SPSS的方差分析 1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示: 1)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。 2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。 (1)分析→比较均值→单因素ANOV A→因变量:销售额;因子:组别→确定。 ANOVA 销售额 平方和df 均方 F 显著性 组之间405.534 4 101.384 11.276 .000 组内269.737 30 8.991 总计675.271 34 概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。

可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有显著差异。 2、从两个总体中分别抽取n 1 =7 和和n 2 =6 的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格“A”和单元格“B”内的计算结果。 答:已知组内均方=组内偏差平方和/自由度,所以A=26.4/11=2.4 F 统计量=组间均方/组内均方所以B=7.5/2.4=3.125 3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。 1)请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么? 2)请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。 3)如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者?(1)因F检验的概率P值小于显著性水平(0.05),拒绝原假设,方差不齐,不满足方差分析的前提假设。 (2)4*276.032=1104.128;1104.128+1524.990=2629.118;4+63=67;1524.990/63=24.206 (3)各组均值存在显著差异。更适合第三组 4、 1)选择恰当的数据组织方式建立关于上述数据的SPSS数据文件

统计学模拟实验spss 实验报告

(此文档为word格式,下载后您可任意编辑修改!) 目录 第一章数据介绍 (3) 1.1研究问题的提出 (3) 1.2数据的来源 (3) 第二章基本统计分析 (4) 2.1 基本统计分析 (4) 2.1.1 全部变量的频数分析 (4) 2.1.3变量的交差分析 (9) 2.1.5 异常值的检验 (12) 2.2 参数检验 (13) 2.2.1 单样本T检验 (13) 2.2.2 两独立样本T检验 (14) 2.3 相关分析 (14) 2.4 多元线性回归分析 (15) 第三章总结和建议 (21) 3.1 存在的问题 (21) 3.2 如何改进这些不足 (21) 附录A22 附录B22

摘要 当前的消费市场中,大学生作为一个特殊的消费群体正受到越来越大的关注。由于大学生年纪较轻,群体较特别,有着不同于社会其他消费群体的消费心理和行为。一方面,他们有着旺盛的消费需求,另一方面,他们尚未获得经济上的独立,消费受到很大的制约。消费观念的超前和消费实力的滞后,都对他们的消费有很大影响。社会大众对大学生的消费存在种种争议,认为他们出手阔绰。本文从我校大学生消费状况,消费的行为、消费结构、消费倾向和消费观念等方面来分析大学生的消费特征以及怎样提高他们的消费观念和理财能力,引导在校大学生树立正确的消费观。 关键词:大学生消费观;理性;问题;改进;数据分析

第一章数据介绍 1.1研究问题的提出 大学生消费问题日渐成为一个社会广为关注的问题,大学生作为一个特殊的群体,处于校园与社会交界处,脱离了父母,开始经济独立,独自生活。大学是一个精彩的世界,社会生活又是充满诱惑的,对大学生的消费都存在着很大的影响。同时也不免回存在一些非理性的消费问题,导致社会群众对大学生消费状况的批评。为了弄清大学生的消费问题的真实问题本小组成员进行了该项调查主要想弄清楚大学生们平时把钱花在哪里,花多少,影响他们消费的因素有哪些,以及他们在消费中有那些问题,应该怎样的去改造这些问题。 1.2数据的来源 本次分析的数据来源于我校90名不同专业和年级的同学消费情况调查。Spss数据中共包含十一变量,分别是:性别,户口状况,家庭年总收入,月生活费,伙食费占生活费的比例,娱乐占生活费的比列,生活费的来源,消费习惯,消费倾向,消费商品是注重,生活费盈余的处理,消费状况是否满意。通过运用spss统计软件,对变量进行基本统计分析、参数检验、相关分析、回归分析,以了解我校同学在上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 第二章基本统计分析 2.1 基本统计分析 2.1.1 全部变量的频数分析 户口情况频数分析(表一) 频率百分比有效百分比累积百分比 有效城镇17 18.9 18.9 18.9 农村73 81.1 81.1 100.0 合计90 100.0 100.0 从表一中可知被调查的同学中有73人来自农村占总人数的81%,只有17个同学来自城镇占总人数的19%。说明我校学生户口大多数分布在农村,生活水平较低。 性别状况的频数分析(表二) 频率百分比有效百分比累积百分比

统计分析与SPSS应用_期末作业

统计分析与SPSS的应用 摘要:为对统计分析与spss应用分析所学知识进行巩固和检验,特运用所学知识进行简单的统计分析应用,下文以某校学生学期成绩进行模拟分析。 一:原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

统计分析与SPSS应用 期末作业

统计分析与SPSS的应用 原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

社会统计学与spss应用练习题[1]

一、单项选择题 1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量 2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B) A. B. C.

D. 3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这说明新生婴儿性别状况属于(D)。 A.非统计现象 B.统计现象 C.非随机现象 D.随机现象 4.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这体现新生婴儿性别状况具有(D)。 A.确定性 B.因果性 C.必然性 D.随机性 5.为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。(B) A.完备 B.互斥 C.整体 D.差异 6.下列哪类变量能用折线图表示其分布状况?(C) A.定类变量 B.定序变量 C.定距变量 D.虚拟变量 7.下列某变量取值状况的累积图,其中正确的表现形式是(B)。

8.下两图是正态分布密度曲线,两图的σ2相同,图1较之图2的密度曲线向左移了一些,这说明(C)。 A.μ1>μ2 B.μ1=μ2 C.μ1<μ2 D.μ1≥μ2 9.在SPSS软件中, 对于多选项分析而 言,如下所示首先应 该操作步骤的是(C) A.B. C.D. 图1 图2

《统计分析与SPSS的应用(第五版)》课后练习

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

统计学SPSS作业

频率 频率表 XB生别 交叉表

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 例较大;女性则较集中在41-60元这一区间。 游程检验 a. 中值 b. 所有值都大于或小于分界值。无法执行 Runs检验。 c. 仅有一次运行。无法执行Runs检验 从上图中可以知道图中显示性别的分割点分别为1和1.48, ,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和佃.59,而不是原先的中位数20,导致游程增加到46和35.

T检验 可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。 T检验

分析结果的第一部分为Levene'方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975, P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。

a L Lift: CF消费结构 对心目中合理的消费状态和结构的调查显示,超过50%的学生希望让每个月有盈余, 可供自己支配,也有20%左右的学生希望能制定出较细的消费计划。

均缎=5J5 惋准爾基=5.47 N=126 最终生成的图如上 图,可见现在大学生存在的消费弊端的分布不接近正太曲线,左侧几个较高的极端值存在,图形右侧还自动给出了样本的均值,标准差和样本量。 根据上图,可以知道在大一和大二学生当中,生活费来源于父母和勤工俭学的学生中, 女性大于男性;在大三学生当中,生活费来源于做兼职的学生当中,男性大于女性;而在大四学生当中,生活费来源于其他的男女学生相差不大。

条件概率、全概率公式与贝叶斯公式

条件概率、全概率公式与贝叶斯公式 一、背景 一个随机事件的概率,确切地说,是指在某些给定的条件下,事件 发生的可能性大小的度量.但如果给定的条件发生变化之后,该事件的概率一般也随之变化.于是,人们自然提出:如果增加某个条件之后,事件的概率会怎样变化的?它与原来的概率之间有什么关系?显然这类现象是常有的. [例1] 设有一群共人,其中个女性,个是色盲患者. 个色盲患者中女性占个. 如果={从中任选一个是色盲}, ={从中任选一个是女性},此时, .如果对选取规则附加条件:只在女性中任选一位,换一句话说,发生之后,发生的概率(暂且记为) 自然是. [例2] 将一枚硬币抛掷,观察其出现正反面的情况.设事件为“两次掷出同一面”,事件为“至少有一次为正面H”.现在来求已知事件已经发生的条件下事件发生的概率. 这里,样本空间.易知此属于古典概型问题.已知事件已发生,有了这一信息,知道不可能发生,即知试验所有可能结果所成的集合就是.中共有3个元素,其中只有属于.于是,在发生的条件下,发生的概率为

对于例1,已知 容易验证在发生的条件下,发生的概率 对于例2,已知 容易验证发生的条件下,发生的概率 对一般古典概型, 容易验证:只要,则在发生的条件下, 发生的概率, 总是成立的. 在几何概率场合,如果向平面上单位正方形内等可能任投一点,则当发生的条件下, 这时发生的概率为

由此可知对上述的两个等可能性的概率模型,总有成立. 其实,还可以验证, 这个关系式对频率也是成立的.于是,从这些共性中得到启发,引入下面的一般定义. 二、条件概率 若是一个概率空间,,若,则对于任意的,称 为已知事件发生的条件下, 事件发生的条件概率. [例3] 一盒子中装有4只产品,其中有3只是一等品,1只是二等品.从中取产品两次,每次任取一只,作不放回抽样,设事件为“第二次取到的是一等品”,事件为“第一次取到的是一等品”,试求条件概率 解:易知此属古典概型问题.将产品编号:1,2,3号为一等品,4号为二等品.以表示第一次、第二次分别取到第号、第号产品.试验E (取产品两次,记录其号码)的样本空间为 ={(1,2),(1,3),(1,4), (2,1),(2,3),(2,4), (3,1),(3,2),(3,4), (4,1),(4,2),(4,3)} ={(1,2),(1,3),(1,4), (2,1),(2,3),(2,4), (3,1),(3,2),(3,4)} ={(1,2),(1,3), (2,1),(2,3), (3,1),(3,2)} 由条件概率公式得,

统计学 SPSS作业

频率 统计量 XB 性别 MRC 月消费金额 N 有效 126 126 缺失 频率表 XB 性别 频率 百分比 有效百分比 累积百分比 有效 A 、男 65 51、6 51、6 51、6 A 、女 61 48、4 48、4 100、0 合计 126 100、0 100、0 MRC 月消费金额 频率 百分比 有效百分 比 累积百分 比 有效 A 、300元-400 元 1 、8 、8 、8 B 、401元-600元 9 7、1 7、1 7、9 C 、601元-1000元 77 61、1 61、1 69、 D 、1000元以上 39 31、0 31、0 100、0 合计 126 100、0 100、0

通过以上交叉表可知,男性日常用品花费在41-60元与61-100元这两个区间所占比例 从上图中可以知道图中显示性别的分割点分别为1与1、48,,SPSS计算出游程数分别共有1与8,表格中年龄所使用的分割点为均数19与19、59,而不就是原先的中位数20,导致游程增加到46与35、

低于基线水平100、样本均数抽样误差为0、13216 由上面的检验结果t=-742、635 p=0 由于p值小于检验水准0、05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。 分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差就是否为齐性方差,这里的检测结果为F=10、975,P=0、006,因此拒绝Ho,认为本例中两个样本所在总体的方

差就是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性1、000 、 显著性(双侧) 、、 df 0 15 YY 相关性、1、000 显著性(双侧) 、、 df 15 0 在控制了月消费金额之后计算出的年龄与总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图 对心目中合理的消费状态与结构的调查显示,超过50%的学生希望让每个月有盈余,可供自己支配,也有20%左右的学生希望能制定出较细的消费计划。

条件概率及全概率公式练习题

二、计算题 1.从1, 2, 3,…, 15中,甲、乙两人各任取一数(不重复),已知甲取到的数是5的倍数,求甲数大于乙数的概率. 解.设事件A表示“甲取到的数比乙大”, 设事件B表示“甲取到的数是5 的倍数”. 则显然所要求的概率为P(A|B). 根据公式 而P(B)=3/15=1/5 , , ∴P(A|B)=9/14. 2. 掷三颗骰子,已知所得三个数都不一样,求含有1点的概率. 解.设事件A表示“掷出含有1的点数”, 设事件B表示“掷出的三个点数都不一样”. 则显然所要求的概率为 P(A|B). 根据公 式 , , ∴

P(A|B)=1/2. 3.袋中有一个白球和一个黑球,一次次地从袋中摸球,如果取出白球,则除把白球放回外再加进一个白球,直至取出黑球为止,求取了N次都没有取到黑球的概率. 1解.设事件A i表示“第i次取到白球”. (i=1,2,…,N) 则根据题意P(A1)=1/2 , P(A2|A1)=2/3, 由乘法公式可知: P(A1A2)=P(A2|A1)P(A1)=1/3. 而P(A3|A1A2)=3/4 , P(A1A2A3)=P(A3|A1A2)P(A1A2)=1/ 4 . 由数学归纳法可以知道 P(A1A2…A N)=1/(N+1). 4. 甲袋中有5只白球, 7 只红球;乙袋中有4只白球, 2只红球.从两个袋子中任取一袋, 然后从所取到的袋子中任取一球,求取到的球是白球的概率. 解.设事件A表示“取到的是甲袋”, 则表示“取到的是乙袋”, 事件B表示“最后取到的是白球”. 根据题意: P(B|A)=5/12 , , P(A)=1/2. ∴ . 5.有甲、乙两袋,甲袋中有3只白球,2只黑球;乙袋中有4只白球,4只黑球.现从甲袋中任取2个球放解.设事件A i表示“从甲袋取的2个球中有i 个白球”,其中i=0,1,2 .

SPSS管理统计学作业

洪城水业2009-2013年日收盘价与大盘走势分析研究 --以上证A股洪城水业(600461)为例 (一)个股分析 本文我们将对洪城水业2009-2013年五年每日的收盘价为样本研究对象,将大盘走势用上证综合指数来表示。剔除离群值,画出图形,并进行数据分析。本文数据来源于国泰安数据库,利用EXCEL! SPSS21.进行分析。在我们所要分析的数据中,有时会出现个别测定值与其他数据相差甚远,这些数据被称为离群值。而离群值对统计分析会造成影响,造成参数估计的偏离,统计分布的错判,以及对统计方法的选择与结果解释都会造成一定的影响,从而得出错误的统计分析结论。常用的剔除离群值的方法有:(1)可依据常识和 原理直接判断;(2)箱线图观察;(3)Z值观察。箱线图法剔除离群值相对精确,因此为提高数据的代表性我们选择此种方法去除离群值对样本的影响。如图: 图1-1 箱线图 2009 2010 2011 2012 2013 处励「I期图1-2 图中的点为疑似异常点,相应的序号为245、246、247、256、258、259、260、265、458、463、465、466、469、1177、1176代表异常点在各列对应的位置。将这些离群值去掉所得洪城水业历史五年从2009-2013年每日收盘价共1192个数据。图中横轴表示时间,纵轴表示日收盘价。从箱线图1-1中我们可以看出2010年日收盘价相对较高,而2011年全年股价的每日收盘价差异较大,并在这一年股价也达到了历史最高水平,相对前几年来说2012-2013股价变化平稳。

图1-3 交易日期 频率百分比有效百分比累积百分比 2009 241 20.2 20.2 20.2 2010 236 19.8 19.8 40.0 2011 240 20.1 20.1 60.2 有效 2012 237 19.9 19.9 80.0 2013 238 20.0 20.0 100.0 合计1192 100.0 100.0 图1-3表示洪城水业2009-2013年日收盘价的频率分析图 图1-4 N 极小 值 极大值均值标准差偏度峰度 统计量统计 量统计 量 统计量标准误统计量统计 量 标准 误 统计量标准 误 2009 241 5.61 12.07 9.1080 .09352 1.45184 -.271 .157 -.167 .312 2010 236 10.52 18.64 14.9551 .11298 1.73566 -.575 .158 .554 .316 2011 240 8.09 19.87 13.1935 .23612 3.65803 .414 .157 -1.637 .313 2012 237 6.11 9.03 7.4653 .04368 .67245 .385 .158 -.703 .315 2013 238 6.26 9.15 7.6996 .03709 .57222 .194 .158 -.283 .314 数据来源:作者手工整理 根据2009-2013年洪城水业个股收盘价描述性分析图可以看到5年历史日收盘价2009年为最低值5.61在2011年达到最大值19.87,股价波动的最大差距为14.26,反映股价5年间波动较大。2010年日收盘价均值为14.9551均高于其他年度,说明2010年洪城水业股票价格增长势头明显,可以给投资者带来更多投资回报。而2012年和2013年日收盘价的最小值分别为6.11和6.26,最大值为9.03和9.15,标准差分别为0.67245和0.57222,表明这两年股价变化平稳,相比以往年度有所下降。 图1-5 曰收陽价 N - 1 ,1DS = 10.48

统计学与spss作业

《多元统计与SPSS》作业 作业1:举例说明总体、个体、抽样、样本、样本含量、抽样误差 作业2:举例说明什么是统计量、参数 作业3、把下列表1的154个分数输入SPSS,请完成下列各项: (1)计算这154个分数的极差、最大值、最小值、中位数、百分位数(8%、15%、25%、41%、57%、64%、73.3%、82.55%、91.6%、99%)、平均数、标准差、标准误、方差。并检验这个 样本与总体(μ=58.5)是否有显著性差异。 (2)计算成绩大于等于60分的数据的极差、最大值、最小值、中位数、百分位数(10%、25%、50%、75%、90%)、平均数、标准差、标准误、方差。并检验这个样本与总体(μ=76.5) 是否有显著性差异 (3)按下列规则对全部数据重新编码:大于等于90的标为9,80分以上(含80)至89分(含89分)标为8,其它类推为7、6、5、4、3、2、1、0。然后统计各分数段的频数和频率 表1 原始数据 12 5 23 34 46 52 64 77 82 93 21 67 87 69 4 13 3 5 31 47 53 63 7 6 88 91 78 68 86 85 12 24 35 46 5 7 6 8 7 9 80 91 56 67 76 87 76 34 45 56 67 68 78 77 79 86 83 84 91 56 57 45 65 57 76 78 67 87 67 76 91 45 67 78 87 56 67 78 89 55 66 77 85 66 68 62 76 76 82 45 56 67 68 60 76 75 78 76 86 85 74 71 70 91 87 83 77 78 71 72 73 65 67 63 61 56 54 43 44 55 66 77 88 90 22 11 34 45 56 67 76 56 65 76 67 78 87 71 72 74 75 75 65 65 82 34 45 65 76 56 67 68 69 76 75 78 76 86 87 作业4、下列表2是实验组A(22人)和对照组B(21人)在实验前后的数据,实验组在音乐的伴奏下进行为期3个月的立定跳远训练,对照组进行为期3个月的传统立定跳远训练,请把数据输入SPSS,并把差异检验结果列在一个三线表格内,再对检验结果进行分析。 表2 两个组实验前后情况 A实验前 2.00 2.02 2.03 2.05 2.10 2.11 2.03 2.04 2.05 2.08 2.08 2.05 2.12 2.15 1.98 1.96 2.08 2.10 2.11 2.05 2.04 2.03 A实验后 2.23 2.25 2.28 2.34 2.35 2.36 2.34 2.38 2.39 2.27 2.33 2.36 2.39 2.38 2.35 2.33 2.41 2.42 2.43 2.35 2.33 2.29 B实验前 2.00 2.01 2.05 2.26 2.01 2.11 2.15 2.05 2.08 2.09 2.08 2.11 2.09 2.08 1.98 1.95 2.11 2.08 2.07 2.07 2.05 B实验后 2.18 2.19 2.20 2.21 2.22 2.23 2.18 2.17 2.16 2.23 2.19 2.23 2.25 2.19 2.18 2.18 2.16 2.20 2.21 2.22 2.19 作业5 (1)ABCD四组立定跳远的成绩如下,检验他们之间的显著性差异。 (2)按照下列标准重新编码:2.20以下计为1,2.21—2.30之间计为2,2.31以上计为3,则检验四组之间是否有显著性差异? (3)利用(2)的数据,把1、2、3看作是收入高、中、低标志,把ABCD看作是经济发达程度渐低的4个区域,问从四个区域抽出的样本的收入与地区发达程度的关系如何? 表3 原始数据 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A 2.34 2.41 2.17 2.17 2.31 2.44 2.33 2.43 2.16 2.40 2.44 2.30 2.14 2.20 2.24 2.16

相关主题