搜档网
当前位置:搜档网 › 统计学总复习提纲

统计学总复习提纲

统计学总复习提纲
统计学总复习提纲

统计学复习提纲

第一章:绪论

1、

1)统计的含义:

统计一词有统计工作、统计资料、统计科学三种含义,但最基本的还是统计工作。没有统计工作就不会有统计资料,没有丰富的统计实践经验就不会产生统计科学。

2)统计的研究对象:

统计学的研究对象是统计工作的规律,即搜集、整理和分析统计数据的方法,是一门方法论科学。

3)统计的特点:

数量性、具体性、综合性

2、统计学的基本概念

1)总体:

总体是指在某种共性的基础上由许多个别事物结合起来的整体。

总体有三方面特征:同质性、大量性、差异性

总体可分为有限总体和无限总体

2)总体单位:

构成总体的个别事物叫总体单位。

总体和总体单位是根据统计研究的目的来确定的。

3)标志:

标志是指说明总体单位特征的名称。

标志可分为数量标志(用数字回答问题)和品质标志(用文字回答问题)。

标志还可分为不变标志和可变标志。

不变标志:所有总体单位共同具有的特征。它是构成总体的必要条件和确定总体范围的标准。可变标志:在总体各单位之间必然存在差异的标志。

4)变量:

可变标志中既有品质标志也有数量标志。可变的数量标志就叫变量。

变量的具体数值叫变量值。

凡变量值只能以整数出现的变量,叫离散变量。

凡变量值可作无限分割的变量,叫连续变量。

5)指标与指标体系:

指标:说明总体数量特征的概念。

指标体系:以共同的研究目的为纽带而相互联系的一系列统计指标。

6)指标与标志的区别与联系

区别有二:第一,指标说明总体的特征;而标志说明总体单位的特征。

第二,指标只反映总体的数量特征,所有指标都要用数字来回答;标志则既有反映总体单位的数量特征(用数字回答),也有反映总体单位的品质特征(用文字回答)。

二者联系:

主要表现:许多标志的数值都是由总体各单位的数量标志的标志值汇总而得来的。

品质标志虽然本身不具有数值,但有些指标是按品质标志分组分组计算得出。由于总体和总体单位可随统计研究的目的而易位,故指标和数量标志在一定的条件下可以变换。

第二章:统计调查

1、统计调查:是指根据统计研究的目的,有组织、有计划地搜集统计资料的过程。

2、统计调查的基本原则:

1)要实事求是,如实反映情况

2)要及时反映,及时预报

3)要数字与情况相结合

3、统计调查的组织形式:

1)普查:

普查是指为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查。

2)随机抽样调查:

又叫概率抽样,是指按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以对端和认识总体的一种统计方法。它是各种非全面调查方法中最科学的一种方法。(抽样调查即非全面调查。按抽选调查单位方法的不同,它分为随机抽样和非随机抽样两类。)

3)非随机抽样调查:

是指调查者有意识地或随意而非随机地从总体中抽取部分单位进行调查的统计方法。

非随机抽样不遵循随机原则,不能事先计算和控制抽样误差,一般也不用于推算总体指标。4)定期统计报表:

A.是指按国家同一规定的指标体系、表格形式、报送程序和报送时间,定期地自下而上地向国家和上级主管部门报送统计资料的一中统计调查形式。

它是国家取得经常性的基本统计资料的手段。

它即可用于全面调查,也可用于非全面调查。

B.

按内容的不同,可分为基本统计报表和专业统计报表。

按报告周期的不同,可分为日报、旬报、月报、季报、半年报和年报。

按报告形式的不同,可分为电讯报和表式报。

4、非随机抽样的类型

1)重点抽样:

是指只对总体中为数不多但影响颇大(其标志值在总体标志总量中所占比重较大)的重点单位进行研究的一种非全面调查。它适用于分布比较集中的事物。

特点:以较少的人力、物力和财力,几时地掌握总体的基本状况及其发展变化的基本趋势。2)典型抽样:

是指根据对调查对象的初步了解,有意识地从中挑选有代表性的单位进行研究的一种非全面调查。

特点:灵活方便,反应迅速,省时省力,深入具体,可以把数字和情况结合起来。

作用:a.“解剖麻雀”,推论一般,指导全局。

b.研究新事物,推广新鲜经验,促进新生事物的发展。

c.有利于全局与典型、数字与情况的结合,促进统计研究的深化。

3)任意抽样:

又叫方便抽样或随意抽样(不是随机抽样)。是指调查者随意抽取调查单位进行调查的一种方法,但不保证每个单位都有相等的中选机会。

4)配额抽样:

配额抽样就是在对总体作若干种分类和样本总容量既定的情况下,按配额(按一定要求给定的样板单位数)从总体各部分抽取调查单位进行调查的方法。

5、调查误差的概念和种类

概念:是指调查所得的统计数字与调查对象的实际数量之间的差异,即调查所得的数量大于或小于调查对象的实际数量之差。

种类:

1)工作误差:由于调查工作中的食物所造成的误差。

2)代表性误差:以部分推断总体时必然存在的误差。

第三章:统计整理

统计整理的程序-审核,分组,汇总,制表

统计分组的种类:按作用目的分:类型分组,结构分组,分析分组;按标志的多少和分组形式分:简单分组,复合分组,并列分组;按指标的性质分:品质分组,数量分组。(P43)

1.统计分组(根据社会经济现象的特点和统计研究的目的要求,按照某种重要

指标把总体分为若干部分的科学分类)

1.1.组数(即将总体分为几组)

品质分组的组数确定主要取决于两个因素-(PPT)统计研究的要求(书:统计研究的任务)与(PPT)事物本身的属性(书:事物的特点).

数量分组的组数直接取决于两个因素-总体的标志变异全距;组距

在等距分组的条件下,组数等于全距/组距。

全距=最大指标值-最小指标值

1.2.组距

组距=各组的最大指标值(上限)-各组最小指标值(下限)

组数组距确定的斯特杰斯经验公式:

n=1+lg(N)/lg(2) 或是n=1+1.33lg(N)

d = R/n = (Xmax-Xmin)/1+1.33lg(n)

n:数组;N:总体单位数;d:组距;R:全距

Xmax:最大变量值; Xmin:最小变量值

1.3.组限(每组两端的数值)

每组的起点数值(最小值)为下限;终点数值(最大值)为上限。

组限的形式:

重合式:相邻两组中,前一组的上限与后一组的下限数值相重。一般用与连续变量。组距=本组上限-本组下限

不重合式:前一组的上限与后一组的下限,两值紧密相连而又不相重复。一般用于离散变量。组距=下组下限-本组下限=本组上限-上组上限

1.4.组中值

重合式:组中值=(上限+下限)/2=下限+组距/2=上限-组距/2

不重合:组中值=(本组下限+下组下限)/2=本组下限+组距/2=下组下限-组距/2

组距式分组中,常常遇到首末两组“开口”的情况,即有第一组上限无下限,最后一组由下限无上限,此时,组中值=上限-邻组组距/2=下限+邻组组距/2

2.分布数列及其种类

2.1.分布数列:指反映总体单位在各组的分布状况的一系列数字,又叫次数分布或是次数

分配。其包含两要素:一是组的名称;二是各组的次数(也称频数)或是频率。

2.2.分布数列的种类(以下数列见表p54-57)

2.2.1.按分组指标分:品质数列(由各组名称和各组单位数构成);变量数列(由变量和次

数两个要素构成)

2.2.2.按分组形式分:单项式数列(各组都由一个具体的变量值(单项)来表示的数列);

组距式数列(指各组都由两个变量值界定的变量区间(组距)来表示的数列,它又分为等距数列和不等距数列)。注:它们都属于变量数列。

2.2.

3.按次数分布的特征分:钟形分布数列(其中包括正态分布,偏态分布-右偏分布,左

偏分布),U形分布数列,J形分布数列(包括J形,倒J形)

第四章总量指标和相对指标

1.总量指标和种类

1.1.总量指标:指反映社会经济现象在一定时间,地点条件下所达到的总规模,

总水平或工作总量的综合指标。也称为绝对指标。表现形式:绝对数,增量。

1.2.总量指标的种类

1.2.1.按总量指标的总体内容分

总体总量即总体单位数,它是由每个总体单位加总而得到的。

标志总量是指总体各单位某一数量标志值得总和。

1.2.2.按其时间状态分

时期指标也称为时期数。其特点:时期指标可以累计相加;时期指标数值的大小与时期的长短密切相关。

时点指标也称为时点数。其特点:各时点指标不能累计相加;时点指标数值的大小与时期长短无直接的关系。

1.2.3.按计量单位分;

实物指标是指以实物单位计量的总量指标,即以事物的物理属性或自然属性为计量单位的指标。实物单位分为:自然单位;度量衡单位;专用单位;复合单位;标准实物单位。例见(P79)

价值指标是以货币为计量单位的总量指标。

劳动量指标是以劳动量单位计量,即以劳动时间为计量单位的指标。相对指标和种类及各种相对指标的计算

1.3.相对指标(指两个有联系的统计指标进行对比的比值,也称为相对数)

其表现形式:无名数;有名数。

无名数是抽象化的数值,表现形式:成数,系数,倍数,百分数,千分数等。(P81)

有名数是指有具体内容的计量单位的数值。其有单名数和复名数之分。

(p82)

1.4.计划完成相对数及其派生公式

1.4.1.其指计划期内实际完成数与计划数之比。其考核、反映计划完成的程度(进

度)。计划完成相对数=实际完成数/计划完成数×100%(分子分母位置不能互换)。超额完成(或未完成)绝对数=实际完成数-计划数

1.4.

2.派生公式:(1)产量,产值增长百分数:计划完成相对数=(100%+实际

增长%)/(100%+计划增长%)×100%(2)产品成本降低百分数:计划完成相对数=(100%-实际降低%)/(100%-计划规定降低%)×100%

1.5.结构相对数(部分占全体的比例,反映事物的内部构成、性质、质量及其变

化。)

结构相对数=总体某部分数值/总体数值×100%

特点:同一总体的结构相对数之和应为100%,且分子分母位置不能互换。

1.6.比例相对数(指同一总体某一部分数值与另一部分数值对比的比值。反映

总体各部分间的内在联系与比例关系。(同一总体不同部分比较))

比例相对数=总体中某一部分数值/同一总体另一部分数值

特点:分子分母可互换,且属于同一个总体。

1.7.比较相对数(同一时间的同类指标在不同空间对比的比值。反映同类现象

在不同空间的数量差异。)

比较相对数=甲地区(单位)某指标数值/乙地区(单位)同一指标数值

特点:用百分数或倍数表示,分子分母可替换

1.8. 动态相对数(某一社会经济现象在不同时期两个数值对比的比率。又称发

展速度或指数。反映事物发展变化的方向与程度。) 动态相对数=报告期数值/基期数值×100%

其中:报告期又称计算期,是研究或计算时期。基期是作为比较基础的时期。

特点:分子与分母的位置一般不能互换。常用百分数、倍数、千分数表示。 1.9. 强度相对数(是指两个性质不同而又相互联系指标之比。①反映一国一地的发展水平、力量强弱。②反映事物存在的密度、普遍程度、运动强度、负担强度。③反映经济效益的高低。)

强度相对数=某一指标数值/另一有联系的指标数值

特点:有些指标分子与分母可互换,形成正指标和逆指标两种计算方法,数值大小与强度成正比为正指标,反之为逆指标。计量单位常用复名数。

第五章:平均指标

1、平均指标及其种类;

平均指标概念:平均指标是指同质总体各单位某一数量标志在一定时间、地点、条件下

所达到的一般水平。是总体的代表值。它也是描述分布数列集中趋势的指标。 种类:算数平均数、调和平均数、几何平均数、众数和中位数

2、各种平均指标的计算: 算术平均数:简单和加权

简单算数平均数公式:

加权算数平均数:

交替标志平均数; 调和平均数:简单和加权

几何平均数:简单和加权

简单几何平均计算公式:

n x x n 1n x ...x x X n 1i i n 21∑∑=

=+++==∑∑=

++++++=

f

xf

f ...f f f x ...f x f x X n 21n n 2211P N

N N N N 0N 1f xf X 1

2121==+?+?==

∑)(1

11

)

(111加权平均式简单平均式∑

∑∑

∑∑

∑====f

x f f f x H x n

n x H n

n

1

i i

n n

21X

X X X G ∏==??????=

加权集合平均计算公式:

众数:指总体中出现次数最多的标志值(不唯一)

中位数:如果将总体各单位标志值按大小顺序排列,局域中点位置那个标志值就是中位数。(奇数个数据:(n+1)/2, 偶数个数据n/2)

3、算术平均数、众数和中位数的关系:

(1)在正态分布的情况下,算数平均数、中位数和众数三者完全相等

(2)在偏态分布的情况下,变量数列是右偏时,就有众数<中位数<算数平均值 (3)在偏态分布的情况下,变量数列是左偏时,就有算术平均数<中位数<众数

算术平均数、调和平均数和几何平均数的关系:

算术平均数、调和平均数、几何平均数是三种不同形式的平均数,分别有各自的应用条件。进行统计研究时,若适宜采用算数平均数,就不能用调和平均数或几何平均数;若适宜用调和平均数,就不能才有其他两种平均数。但从数量关系上来考虑,如果用同一资料(变量各值不相等)计算以上三种平均数,其结果则是:算数平均数大于几何平均数,而几何平均数又大于调和平均数。当所有的变量值都相等时,这三种平均数则相等。

第六章:变异度指标

1、变异度指标的概念和种类

变异度指标的概念:指综合反映总体各单位标志值及其分布的差异度的指标也称标志变

动度指标。

变异度指标的种类:(1)全距和四分位差 (2)平均差、标准差和方差

(3)偏度和峰度

2、各种变异度指标的计算: 全距和四分位差

全距 R=最大值xmax -最小值xmin

四分位差Q=第三个四分位数Q3—第一个四分位数Q1 (Q3的位置=3(n+1)/4, Q1的位置=(n+1)/4)

平均差、标准差和方差(总方差、组间方差和组内方差P147)

简单平均差:

加权平均差 ∑=∑??????==∏

=n

1i i n 21f n

1i f i

f f n f 2f 1x x x x G n x

x D A ∑

-=

..∑

-=f

f

x x D A ..

标准差:

变异系数(平均差系数、标准差系数)

平均差系数=平均差与算术平均数对比的比值

标准差系数=标准差与算术平均数对比的比值

3、偏度和峰度:了解含义;能根据偏度和峰度系数判断分布的特点。 偏度:反映总体次数分布偏斜方向和程度的指标

偏态系数=0为对称分布 偏态系数> 0为右偏分布 偏态系数< 0为左偏分布

峰度:峰度是指统计学中描述分布曲线峰顶尖峭程度的指标。

峰态系数=0扁平峰度适中 峰态系数<0为扁平分布 峰态系数>0为尖峰分布

第七章:抽样调查

1、了解几种常用分布的特点:二项分布、泊松分布、超几何分布和(标准)正态分布。P175

二项分布:是指只有两种可能结果的重复随机试验的概率分布。

泊松分布:是指在λ=np 恒定的情况下,当n 趋于无穷大,p 趋于0时,二项分布趋于泊松

分布的概率分布。

超几何分布:是指只有两种可能结果的不重复试验的概率分布。

2、了解大数定理、中心极限定理的的含义

(一)大数定理是指大量随机变量的平均结果具有稳定性的一系列定理的总称,也称大数法则。

(1).贝努里大数定理

设是n 次独立试验中事件A 发生的次数,P 是事件A 在每次试验中发生的概率,则对于任意正数,有:

lim p{|m/n-p|< ε}=1 这一定理表明,当试验在不变的条件下重复进行很多次时,随机事件出现的频率在它的概率附近摆动;并且只要试验次数n 足够大,事件出现的频率就趋于其概率。

(2).契比雪夫大数定理 契比雪夫不等式 :

契比雪夫定理: 设独立随机变量序列X (i ),分别有数学期望E(Xi)和方差D(xi),

并且有一致

()n

x x ∑

-=

2

σ%100x

.

D .A V .D .A ?=%100x

V ?σ

=

σ

的上限,即存在某一常数K 使得D(xi)<=k (i=1,2,..,n)。则对于任意的正数ε,恒有:

(二)中心极限定理P184

中心极限定理是指随机变量序列的极限分布渐近于正态分布的一系列定理的总称。

(1)独立同分布中心极限定理:即当样本容量n 趋于无穷大时,随机变量的数学期望趋于平均值、方差为σ2 /n 的正态分布。

(2)棣莫弗—拉普拉斯中心极限定理:即当n 趋于无穷大时,样本成数p 趋于总体成数P 、方差为n

PQ

的正态分布。

3、抽样调查的基本原理:P187

1)基本概念:总体和样本;总体指标和样本指标 总体:指调查研究对象的全体。

样本:指从总体中按随机原则抽取的那部分调查单位所构成的总体。

总体指标:是根据总体某种属性计算的综合指标.(唯一确定,定植,例如:总体平均数,

总体标准差)

样本指标:根据样本某种属性计算的综合指标。(不是唯一确定,随机变量,例如:样本平

均数,样本方差)

2)重复抽样和不重复抽样

重复抽样:指从总体中随机抽选一个样本登记后,还需要把它在放回,下一次仍然从总体所

有单位中抽取,如此进行下去,知道抽够预定的样本单位数n 为止。

不重复抽样 :从总体中随机抽选一个样本等级之后,不再把它放回,下一次只从剩余总体

单位中抽选,如此进行下去,直到抽够预定的样本单位数n 为止。

3)抽样误差:实际误差、平均误差和极限误差。

抽样实际误差:是指一次抽样中,由随机因素引起的样本指标与全及指标之间的离差。 抽样平均误差:是指样本平均数(或样本成数)的标准差,它反映了所有抽样结果所得的样本

指标值与全及指标值的平均离差。

抽样极限误差:是指样本指标与全及指标之间的可能误差范围。由于样本指标是围绕全及指

标上下波动的随机变量,其变动幅度或大或小,取值或正或负,这种变动范围的绝对值就是抽样极限误差。

4、了解抽样调查的几种组织形式及其特点:简单随机抽样、类型抽样、等距抽样、整群抽样和多级抽样。

简单随机抽样:又称纯随机抽样,它是根据随机原则直接从总体中抽取样本单位的一种抽样

方法。从理论上讲,简单随机抽样最符合抽样的随机原则.

(特点:主要适用于总体单位数较少、范围较狭窄的情况)

类型抽样:又称分层抽样或分类抽样,它是指对总体各单位先按主要标志加以分类,然后再

从各类中按随机原则抽选一定单位构成样本的抽样组织形式。

(特点:类型抽样通过对总体各单位分类后,可以使总体单位标志值比较接近的单位

归为一类,使各类的分布比较均匀,在样本量一定的条件下,可以缩小抽样平均差距,提高抽样调查的效率。)

等距抽样:又称为机械抽样或系统抽样,是将总体全部单位按照某一标志排列,而后按固定顺序和间隔来抽选样本单位的抽样组织形式。

(特点:随机性表现在抽取第一个样本单位,当第一个单位确定后,其余的各个单位也就确定了。)

整群抽样; 讲总体各单位划分成若干群,然后以群为单位从中随机抽取一些群,对抽中群的所有单位都进行调查的抽样组织形式。

(特点:组织方便,节省人力财力时间;调查单位相对集中,在总体中分布不均匀,抽样误差较大,抽样估计精度也较低。)

多级抽样:又称多阶段抽样,它把抽取样本单位分为n个步骤进行,即先从总体中抽取一级单位,然后再从抽中的一级单位中抽取二级单位,知道抽取最终单位。

(特点;调查的总体范围分布广,节省人财物,灵活方便)

第八章:参数估计和假设检验

1、点估计和区间估计

点估计:

区间估计:

2、假设检验的含义和步骤;

假设检验:假设检验是利用样本的实际统计量,去检验事先对总体某些数量特征所作的假设是否可信,进而为决策取舍提供依据的一种统计分析方法。

步骤:(1)建立假设;

(2)决定检验的显著性水平α;

(3)确定检验统计量;

(4)将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受原假设的决策。

3、原假设、备择假设;

原假设:又称零假设、虚无假设,一般用H0表示

备择假设:又称择一假设,即原假设被否定之后而采取的逻辑对立的假设。

4、基本概念:显著性水平、置信水平、置信区间、P值;

双侧检验和单侧检验;z检验、t检验

显著性水平:显著性水平α——是指在进行假设检验时,事先规定的、作为判断界限的一个小概率的标准。

置信水平:

置信区间:

P值:是一个概率值;如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率;

被称为观察到的(或实测的)显著性水平。

双侧检验:检验样本平均数(成数)与总体平均数(成数)有没有显著性差异,不问差异的方向是正差还是负差时,用双侧检验。

单侧检验:左单侧检验——检验总体平均数或成数是否低于预先假设,应该用左侧检验。

检验总体平均数或成数是否超过预先假设,应该用右侧检验。

Z检验:从一般非正态分布总体中抽取容量为n的样本,当容量很大时,样本平均数也趋近

于正态分布,而统计量Z 趋近于标准正态分布。

t 检验:假定样本样本取自正态总体并且样本平均数x 和抽样标准差相互独立的一种分布。

5、总体均值检验、总体成数(比例)检验、总体方差检验(卡方检验)

总体均值检验:检验当前总体平均数是够和事先假设的总体平均数存在显著性差异。 总体成数(比例)检验:

1.假定条件

? 有两类结果

? 总体服从二项分布 ? 可用正态分布来近似

2. 比例检验的 Z 统计量

)1,0(~)

1(000

N n

P Z πππ--=

(π0为假设的总体比例)

总体方差(卡方)检验:

1. 检验一个总体的方差或标准差

2. 假设总体近似服从正态分布

3. 检验统计量 )1(~)1(220

2

2

--=

n S n χσχ

6、假设检验的两类错误及其关系。

1) 第一类错误(弃真错误)

? 原假设为真时拒绝原假设 ? 会产生一系列后果

? 第一类错误的概率为a

● 被称为显著性水平

2) 第二类错误(取伪错误)

? 原假设为假时接受原假设 ? 第二类错误的概率为b (Beta)

关系:a 小b 就大, a 大b 就小

第九章:相关和回归

1、区分函数关系和相关关系

函数关系所反映的现象之间的具体关系值固定,自变量与因变量在数量上一一对应;而相关关系所反映的现象之间的具体关系值不固定,有关现象变动在数量上不是一一对应的,具有一定的随机性。

2、相关关系的种类、相关系数

种类:

? 变量多少:单相关和复相关;

? 相关形式:线性相关和非线性相关; ? 相关方向:正相关和负相关;

? 相关程度:完全相关、不完全相关和不相关; ? 相关性质:真实相关和虚假相关。

相关系数R :它是直线相关分析中用来衡量两个变量之间相关程度的重要指标。

()()()()

2

222?1?y y y

y y y y y R i i i i i -∑-∑-=-∑-∑= 1、当︱R ︱=1,称完全相关; 2、当 R=0,称零相关;

3、当 0<︱R ︱<1,称普通相关。

其中:当 R > 0.8 高度相关; 当 0.3 ≤ R ≤ 0.8 中度相关; 当 R < 0.3 低度相关

3、熟悉回归的含义和种类;

含义:回归是研究自变量与因变量之间的关系形式的分析方法 种类:1)按变量的多少分——一元回归方程和多元回归方程;

2)按是否线性分——线性回归方程和非线性回归方程;

3)按是否有滞后关系分——自身回归方程和无自身回归方程; 4)按是否带虚拟变量分——普通回归方程和带虚拟变量回归方程。

4、相关分析和回归分析的区别和联系;

区别:相关分析研究的都是随机变量,不分自变量与因变量;回归分析研究的变量要定出自

变量(确定的变量)与因变量(随机变量)。

联系:它们是研究现象之间相互依存关系的两个不可分割的方面。

5、简单直线回归的原理:最小平方法的中心思想

原理:在相关图的分析的基础上,可以选择一定的回归方程式进行定量分析。对两个具有线

性关系的变量,配合线性回归方程,并根据自变量的变动来测定因变量平均发展趋势。

中心思想;是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列两点

要求:

(1)原数列的观察值与模型的估计值的离差平方和为最小; (2)原数列的观察值与模型的估计值的离差总和为零。

6、总平方和; 反映因变量的 n 个观察值与其均值的总离差

回归平方和:

反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和.

残差平方和: 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩

余平方和.

可决系数(判定系数):1) 是回归平方和占总离差平方和的比例

()()

()()

∑∑∑∑====---

=--==

n

i i

n

i i

n

i i n

i i

y y

y

y

y y

y y

SST

SSR

R 12

12

1

2

12

2??1?

2)反映回归直线的拟合程度

3)取值范围在 [ 0 , 1 ] 之间

4)R 2 →1,说明回归方程拟合的越好;R 2→0,说明回归方程拟合的越差 5)判定系数等于相关系数的平方,即R 2=(r )2

可决系数和相关系数之间的数量关系;相关系数是可决系数的平方根。

7、回归系数的含义和解释:

回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。 回归系数的标准误差: t 统计量的含义:

回归系数显著性的P 值检验: 模型整体显著性的F 检

熟悉估计量的评价标准:五篇性,有效性,相合性

根据回归模型进行预测:根据自变量 x 的取值估计或预测因变量 y 的取值。

第十章 时间数列分析指标

1、区分时期数列和时点数列

时期数列:是指由反映某种社会经济现象在一段时间内发展过程累计量的总量指标所构成的绝对数时间数列。

时期指标时间数列具有以下特点:

A )可加性,不同时期的总量指标可以相加;

B )指标值的大小与所属时间的长短有直接关系。

C )指标值采用连续统计的方式获得。

时点数列:是指反映某种现象在一定时点(瞬间)上的发展状况的总量指标所构成的绝对数时间数列。

时点指标时间序列具有以下特点:

A )不可加性。不同时点的总量指标不可相加,这是因为把不同时点的总量指标相加后,无法解释所得数值的时间状态。

B )指标数值的大小与时点间隔的长短一般没有直接关系。在时点数列中,相邻两个指标所属时间的差距为时点间隔。

C )指标值采用间断统计的方式获得。

2、水平分析指标:发展水平、平均发展水平;增长量、平均增长量;

发展水平:时间数列中的每一具体指标值,反映某种社会经济现象在一定时期或时点所达到的规模或水平。

平均发展水平:是将时间数列中各时期的发展水平加以平均而得出的平均数。因是不同时间的,动态上的平均,又叫序时平均数或动态平均数。

增长量:是指时间数列中计算期水平和基期水平之差,说明社会经济现象在一定时期内增减变化的绝对量。

平均增长量:是指逐期增长量的简单算数平均数,说明经济现象在一段较长时间内,平均每期增减变化的数量。

3、速度分析指标:(环比、定基)发展速度、(环比、定基)增长速度;

发展速度:计算期发展水平与基期发展水平之比,表示计算期水平已达到或相当于基期水平的多少,反映了某种社会经济现象在一定时期内发展的方向和速度。

定基发展速度:时间数列中计算期发展水平与固定基期发展水平之比,说明某种社会经济现象的逐期发展方向和速度。

环比发展速度:时间数列中计算期发展水平与前期发展水平之比,说明某种社会经济现象在较长时期内总的发展方向和速度,也叫总速度。

增长速度:计算增长量与基期发展水平之比,说明经济现象在一定时期内增减的快慢程度。

环比增长速度:逐期增长量与前期发展水平之比,表明社会经济现象逐期增长的程度。

定基增长速度是累积增长量与最初(基期)发展水平之比,表明社会经济现象在一定时期内增长的总速度。

4、平均发展速度和平均增长速度

平均发展速度:指环比发展速度的序时平均数,说明某种社会经济现象在一段较长时间内逐期发展变化的平均速度。

平均增长速度:平均发展速度的派生指标,说明某种社会经济现象在一段较长时期内逐期平均增减变化的程度。

平均增长速度=平均发展速度-1

5、增长1%的绝对值

增长1%的绝对值=逐期增长量/环比增长速度=前期水平/100

第十一章时间数列预测方法

1、时间数列的因素分解:长期趋势、季节变动、循环变动和不规则变动及其含

长期趋势:指受事物发展的根本原因制约而形成的事物在一段较长时期内持续增长或持续下降的基本趋势。

季节变动:指由于自然条件、社会条件的影响,社会经济现象在一年内随着季节的转变而引起的周期性变动

循环变动:指社会经济现象以若干年为周期呈波浪式的变动

不规则变动:指由于天灾人祸战乱等意外因素的影响而产生的变动

2、了解时间数列预测分析的基本原理:乘法型和加法型

乘法型:指时间数列由各种因素相乘的乘积所形成的结构类型。

Y=T*S*C*I

加法型:指时间数列由各种因素相加的总和所形成的结构类型。 Y=T+S+C+I

3、长期趋势预测:了解时距扩大法、移动平均法、一次指数平滑法、最小平方法。

时距扩大法:

A.定长期趋势最原始、最简单的方法。

B.时间序列的时间单位予以扩大,并将相应时间内的指标值加以合并,从而得到一个扩大了时距的时间序列。

C.用:—消除较小时距单位内偶然因素的影响,显示现象变动的基本趋势 移动平均法:

对时间数列的各项数值,按照一定的时距进行逐期移动,计算出一系列序时平均数,形成一个派生的平均数时间数列,以此削弱不规则变动的影响,达到对原序列进行修匀的目的,显示出原数列的长期趋势 指数平滑法:

A.是加权平均的一种特殊形式

B.对过去的观察值加权平均进行预测的一种方法

C.观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑 一次指数平滑:

A.只有一个平滑系数

B.观察值离预测时期越久远,权数变得越小

C.以一段时期的预测值与观察值的线性组合作为t +1的预测值,其预测模型为

最小平方法。

最小平方法:也称最小二乘法,是时间数列长期趋势预测分析中的传统方法。

4、季节变动分析:同期水平平均法

以若干年资料数据求出同月(季)的平均水平与各年总月(季)水平,进而对比得出各月(季)的季节指数来测定季节变动的程度。计算步骤:A, 计算各年同月(季)的平均数和总平均数;B.将同月(季)的平均数和总平均数对比

第十二章 统计指数

1、了解指数和指数体系的基本概念;

广义指数:指反映社会经济现象变动与差异程度的相对数。包括一切动态相对数和某些比较相对数。

如:产量指数、出口额指数、产值指数、出口购买力指数、贸易条件指数等。

狭义指数:指反映由不同度量的事物所构成的特殊总体变动或差异程度的特殊相对数。 如:产量总指数、物价总指数、成本总指数等。 分类:

按指数所研究对象或研究范围的不同分为:个体指数和总指数。 按指数的作用不同可分为:质量指标指数和数量指标指数。 按所用基期的不同可分为:定基指数和环比指数。 按计算时所依据的数列性质不同可分为:时间数列指数、空间数列指数和属性数列指数。 按编制方法和计算公式不同可分为:综合指数、平均指数。

t t t F Y F )1(1αα-+=+

指数体系:

广义:有若干内容上相互关联的统计指数所结成的体系。

狭义:指在经济内容上有联系的几个指数所结成的数量关系式。

2、综合指数:指数化因素、同度量因素、拉氏指数、派氏指数

指数化因素:即通过指数去反映其变化或差异程度的因素。

同度量因素:即将特殊总体中不同度量的事物转化为同度量事物的媒介因素。

3、综合指数的计算方法:从相对数和绝对数两个方面进行分解。

销售量综合指数(数量指标综合指数)

销售价格合指数(质量指标综合指数)

销售额指数

4、掌握利用指数体系进行因素分析

连锁替代法:在被分析指标的因素结合式中和相互联系的数量关系,将各个因素的基期数字依次以报告期的数字替代,每次替代后的结果与替代前的结果进行对比从相对数和绝对数两方面分析各因素对现象总体的影响。

非常感谢下列同学的参与与付出:吴广乔:1-2;熊雅雯:3-4;张文蔚:10-12;黄丹蔓:7-9;朱凯仪:5-6。

所总结的东西仅供参考,不做标准答案,重要的还是自己学习。而且希望各位不要因为有人整理就放松了自己的复习。加油咯。

医学统计学简答题35506

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用: 特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均

匀下降; 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; 5、u变换:为了便于描述和应用,常将正态变量作数据转换; 应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围 2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能

统计学复习提纲

旅游统计学复习提纲 考试题型 一、单项选择题(每小题1分,共10分) 二、多项选择题(每小题2分,共10分) 三、名词解释(每小题4分,共20分) 四、简答题(每小题6分,共30分) 五、计算题(每小题15分,共30分) 第一章绪论 第一节统计的概念及其产生和发展 一、“统计”的概念(三种涵义,两重关系) 1、统计工作:资料收集、整理和分析研究等活动。 2、统计资料:工作成果。包括统计数据和分析报告。 3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。统计的科学定义: 它是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。 第三节旅游统计的基本方法 二、旅游统计的基本环节 (一)统计调查 有组织、有计划地搜集资料。要求:准确、完整、及时。 (二)统计整理 对调查资料去伪存真、去粗取精、科学分类、浓缩简化。 (三)统计分析 运用各种统计方法,揭示被研究对象的发展变化趋势和规律性,作出科学结论。包括描述性分析、推断分析、决策分析。要求:定性定量结合。 第四节旅游统中的几个基本概念 一、统计总体和总体单位 ①统计总体:统计研究所确定的客观对象,是具有共同性质的许多单位组成的整体。 ②总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。 二、标志与指标 ①标志:说明总体单位属性、特征的名称,标志值是标志的具体表现。 ②指标:综合反映总体数量特征的概念和数值,由指标名称和指标数值组成。

三、变异和变量 ①变异:总体各单位的标志表现存在一定的差异,是统计存在的前提。分 为品质变异和数量变异。 ②变量:可变的数量标志和统计指标。分为⑴确定性变量和随机性变 量、 ⑵离散性变量和连续性变 量。 第二章统计调查 第一节统计调查的意义 一、统计调查的概念和意义 ㈠概念:统计调查是根据统计目的,取得相应数据的统计资料搜集活动。 ㈡意义:①是统计工作的开始阶段;②是统计整理和统计分析的前提; ③统计调查在整个统计工作中,担负着提供基础资料的任务,是一切 统计资料的来源。 二、统计调查的任务和要求 ⑴基本任务:根据统计指标体系,通过每一项的具体调查,取得反映社 会经济总体现象及各个部分间相互关系的原始统计资料 ⑵基本要求:准确性、及时性、全面性、系统性(前三个是衡量统计调查 工作质量的重要标志) 第二节统计调查的基本方法 ★统计调查的基本方法有哪些? 答:直接观察法、报告法、采访法、问卷法、通讯调查法、特尔菲法(专家调查法)、 集中意见法 第三节统计调查方案 第四节几种专门调查 第三章统计资料的整理与分析 第二节资料的整理 一.资料整理的概念 资料整理是指对统计调查所搜集到的数据进行分类和汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过

432--《统计学》考试大纲

432--《统计学》考试大纲 一、基本要求 《统计学》考试的目的在于考查考生对统计学及其在社会经济应用中所涉及的基本概念、基本理论和基本方法的掌握情况以及分析解决实际问题的能力。基本要求是: 1.准确地理解《统计学》中的基本概念; 2.准确地把握《统计学》的基本理论; 3.正确理解统计分析的方法; 4.能够应用《统计学》的基本理论和方法解决社会经济实际问题; 5.了解统计学的发展趋势和发展动态。 《统计学》课程考试对考生的具体要求分为四个层次: 1.识记:能知道有关的名词、概念、知识的含义,并能正确认识和表述。 2.领会:在识记的基础上,能全面把握基本概念、基本原理,能掌握有关概念和原理的区别与联系。 3.简单应用:在领会的基础上,能用学过的一两个知识点分析和解决简单的问题。 4.综合应用:在简单应用的基础上,能用学过的多个知识点,综合分析和解决较复杂的问题。 二、考试范围 1.导论 识记:统计学的概念、数据类型、总体和样本概念。 领会:数据分类的标准、总体和样本的区别、参数和统计量的区别。 2.数据的来源 识记:常用的概率抽样和非概率抽样方法。 领会:不同抽样方法适用的条件。 3.数据的描述 识记:分类数据、顺序数据和数值型数据的集中趋势、离散程度的测度、几种常用图形的使用和区别。 应用:会计算分组数据和原始数据的均值、方差、标准差、离散系数。 4.参数估计 识记:点估计、区间估计概念。 综合应用:一个总体均值和比例的区间估计;两个总体参数的区间估计;样本量的计算。 5、假设检验 识记:两类错误、原假设、临界值概念。 综合应用:一个总体均值和比例的假设检验,包括单侧、双侧、大样本、小样本等情况;两个总体参数的检验。

统计学总复习

《统计学》综合复习资料一、单选题 1.统计一词的三种涵义是()。 A.统计工作.统计资料.统计学 B.统计调查.统计整理.统计分析C.统计设计.统计分组.统计预测 D.统计方法.统计分析.统计预测2.要研究某地区570家工业企业的产品生产情况,总体是()。 A.每个工业企业 B.570家工业企业 C.570家工业企业每一件产品 D.570家工业企业全部工业产品3.为了解全国钢铁生产的基本情况,对鞍钢、武钢、宝钢等特大型钢铁企业的产量进行调查,属于() A.重点调查 B.典型调查 C.简单随机抽样调查 D.整群抽样调查 4.某商品销售量的前三个季度的季节指数分别为:112%,88%,90%,则第四个季度的季节指数为()。 A.102% B.110% C.98% D.100% 5.某厂2009年完成产值2千万,2010年计划增长10%,实际完成2310万元,则计划完成程度为()。

A.105% B.5% C.115.5% D.15.5% 6.两个性质不同的指标相对比而形成的相对指标是()。 A.比较相对指标 B.结构相对指标 C.比例相对指标 D.强度相对指标 7.当相关系数接近于()时,说明两变量间线性相关程度是很低的。 A.1 B.0 C.0.5 D.-1 8.统计调查按其组织形式分类,可分为() A.普查和典型调查 B.重点调查和抽样调查 C.统计报表和专门调查 D.经常性调查和一次性调查 9.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用()。 A.算术平均数 B.调和平均数 C.几何平均数 D.众数10.第一组工人的平均工龄为6年,第二组为8年,第三组为10年,第一组工人数占总数的30%,第二组占50%,则三组工人的平均工龄为()。 A.8年 11.直接反映总体规模大小的指标是()。 A.总量指标 B.相对指标 C.平均指标 D.变异指标

统计学原理韩兆洲期末考试复习提纲

第一章绪论(小题) 1、统计的含义 人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点 数量性、具体性、综合性 3、统计学的若干基本概念 (1)总体与总体单位;总体的特征; 总体是指在某种共性的基础上由许多个别事物结合起来的整体。 例:制造业企业是一个总体、由所有从事制造业的企业所组成,每一个制造业企业都是一个总体单位。 特征:同质性(都是制造业)、大量性、差异性(不同的总体单位间,除了某方面必须有共性之外,其他方面的差异性,如员工人数等等) (2)总体的分类:有限总体与无限总体 总体单位有限为有限总体,总体单位无限称为无限总体 (3)标志、变异与变量 标志:指说明总体单位特征的名称,由标志名称+标志值构成。 变异:可变的品质标志 变量:离散变量、连续变量,(指的是标志,不是标志值) 例:中华人民共和国人口普查 总体:具有中华人民共和国国籍的所有公民 总体单位:每一位公民

标志名称标志值 国籍:中国(不变标志) 姓名:张三(品质标志) 性别:男(品质标志) 民族:汉(品质标志) 婚姻状况:已婚(品质标志) 数量标志: 家庭成员数:4人(离散变量) 年龄:50(连续变量) 身高:172cm (连续变量) 体重:72.5kg(连续变量) 收入:2000元/月(连续变量) (4)连续型变量与离散型变量联系和区别 离散变量:以整数出现 连续变量:可做无限分割的变量 在某些特殊场合,连续变量可做离散化处理。(当人口按年龄分组)(5)指标与标志 指标:是说明总体数量特征的概念。由指标名称+指标值组成。例:工业普查 总体:工业企业 总体单位:每一个工业企业 指标名称指标值

2019-2020第二学期统计学复习大纲

2019-2020第二学期《统计学》复习大纲 填空题、选择和判断知识点: 1. 统计学发展的三个阶段:古典统计学时期、近代统计学时期和现代统计学时期,古典统 计学有两大学派:国势学派和政治算术学派,代表人物分别是德国的康令、阿亨瓦尔和英国的威廉?配第、约翰?格朗特。近代统计学也有两大学派:数理统计学派和社会统计学派,代表人物分别是比利时的凯特莱和德国的克尼斯。现代统计学以推断统计为主流。 2. 统计的含义:统计资料、统计工作和统计学。统计资料是经过观察、调查得到的各种具有 信息价值的数字资料;统计工作是对各种统计数据资料进行搜集、整理、推断和分析的活动过程;统计学即指导统计工作的理论和方法,是关于统计数据资料的搜集、整理和推断的科学。统计工作与统计资料是统计活动与统计成果的关系,统计工作与统计学则是统计实践与统计理论的关系。统计的本质就是用数据说明问题,用数据反应真相。 3. 标志与指标的种类判断:标志是用以描述个体所共同具有的某种属性或特征的名称。标 志按其结果的表示方式不同分为品质标志和数量标志两种。品质标志表明个体属性方面的特征,数量标志说明个体数量方面的特征,标志表现是标志在各个体上的具体表现结果。标志按其在每个个体上的具体表现结果是否相同可以分为不变标志和可变标志。标志按其表现个体特征的直接程度不同可以分为直接标志和间接标志。标志的测定尺度有四种,按由低层次到高层次的顺序分别为:定类尺度、定序尺度、定距尺度和定比尺度。从狭义上看,变量是指可变的数量标志,从广义上看,也可包括可变的品质标志。 变量按其所受影响因素不同可以分为确定性变量和随机性变量;变量按其数值的变化是否连续出现可以分为离散型变量和连续型变量。 统计指标是反映实际存在的社会经济现象总体数量特征的概念及其数值。统计指标由指标名称和指标数值两部分组成,具体包括指标名称、计算方法、时间限制、地点限制、指标数值和计量单位六个要素。统计指标按其计算的范围不同,可以分为总体指标和样本指标;统计指标按其反映现象的内容不同,可以分为数量指标和质量指标;统计指标按其反映现象的时间状态不同,可以分为静态指标和动态指标;统计指标按其功能不同,可以分为描述指标、评价指标和预警指标。统计指标的设计要确定指标的名称与涵义、计算范围、计算方法、资料搜集方法、量化尺度和计量单位等内容。统计指标与标志之间既存在区别(说明的对象不同,表现结果的形式不同),又存在联系(标志是计算指标的依据,两者可以互换)

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

医学统计学总复习练习题(含答案)

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为 C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 B A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有

统计学复习提纲

第一章绪论 第一节统计的产生和发展 一、统计的产生:源于人类的计数与统计实践活动。 二、统计的发展 1、英国的政治算术学派(17世纪)【“有实无名”的统计学】 创始人:英国的威廉·配第(政治经济学之父) 代表作:《政治算术》——统计学诞生的标志; 文中针对英、法、荷兰的国情,利用数字、重量、尺度的方法,并配以朴素的图表(现代统计学广为采用的方法和内容)进行三国国力的比较,但没有使用“统计学”一词。 2、德国的国势学派(又称记述学派)(18世纪)【“有名无实”的统计学】 代表人物:康令、阿亨瓦尔 康令在大学开设“国势学”课程,以文字技术和比较为主,反映各国的国情国力;阿亨瓦尔继承和发展了康令的思想,并于1749年首次使用“统计学”代替“国势学”,认为统计学是关于各国基本制度的学问,但缺乏数字和内容。 3、数理统计学派(19世纪) 代表人物:凯特勒(比利时)(古典统计学的完成者,近代统计学的先驱者) 代表作:《社会物理学》——他将概率论引进统计学,完成了统计学和概率论的结合。 第二节统计学的性质和特点 一、统计的三个含义:统计工作(过程)、统计资料(成果)和统计学(理论)。 二、统计学的研究对象:大量社会现象(主要是经济现象)的总体数量方面的方法论科学。 三、统计学的特点:数量性、总体性、具体性、社会性、广泛性。 第四节统计学中的几个基本概念 一、统计总体与总体单位 1、统计总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体可以分为有限总体和无限总体,总体所包含的单位数有限的比如人口数、企业数,反之比如大海里的鱼资源数。 2、总体单位:是指构成总体的个别单位。 注:总体和总体单位的划分是相对的,它们随着统计研究对象和研究目的变化而相互转化。 二、统计标志与统计指标 1、统计标志:用来说明总体单位所具有的属性或特征的名称。可分为品质标志和数量标志。品质标志是说明总体单位质的特征,不能用数字来表示的,如性别、籍贯、工种等; 数量标志是说明总体单位量的特征,是可用数字来表示的,如年龄、身高、收入等。 2、统计指标:综合反映统计总体数量特征的名称,包括指标名称和指标数值两部分。 可分为数量指标和质量指标。数量指标是说明总体规模、总数量的指标,一般用绝对数表示;质量指标是说明总体结构、比例、强度等质方面的指标,一般用相对数或平均数表示。又按其作用和表现形式分为总量指标(绝对数)、相对指标(相对数)、平均指标(平均数)。 指标与标志的联系和区别: 区别:标志是说明总体单位特征的,而指标是说明统计总体特征的;指标都能用数字表示,而标志中的品质标志是用文字来描述的,不能用数值表示。指标一般是经过一定的汇总取得,而标志值一般是经过测量、观察直接取得的。标志一般不需要说明时间、地点、条件,但完整的指标必须说明时间、地点、条件等。 联系:大多数指标的数值是从总体单位的数量标志值综合而来;例如,某企业的工资总额是

统计学复习资料分析

《统计学》 第一章 一、填空题 1、统计是、和的统一体,是统计工作的成果,是 统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量; 变量按分,可分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表 现是否相同分为和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标 就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误得区别与联系? 区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(X)之间得变异度大小,S越大,变量值(X)越分散;反之变量值越集 中,均数得代表性越强。标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n得关系不同:n增大时,S趋于。(恒定),标准误减少并趋于 0(不存在抽样误差)。 (3)用途不同:标准差表示X得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。 2.简述假设检验得基本步骤。 1.建立假设,确定检验水准。 2.选择适当得假设检验方法,计算相应得检验统计量。 3、确定P值,下结论3.正态分布得特点与应用: 特点:1、集中性:正态曲线得高峰位于正中央,即均数所在得位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均 匀下降; 4、正态分布有两个参数,即均数》与标准差0 ,可记作N(?,。):均数卩决定正态曲线得中心位置;标准差。决定正态曲线得陡峭或扁平程度。0越小,

曲线越陡峭;0越大,曲线越扁平; 5、U变换:为了便于描述与应用,常将正态变量作数据转换; 应用:1、估计医学参考值范围2、质量控制3、正态分布就是许多统计方法得理论基础 4.简述参考值范围与均数得可信区间得区别与联系 可信区间与参考值范围得意义、计算公式与用途均不同。 1、从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围 2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是: ±l、96s。总体均数95%可信区间得公式就是:前者用标准差,后者用标准误。前者用1、96,后者用a为0、05,自由度为V得t界值。 5.频数表得用途与基本步骤。 用途:(1)揭示资料得分布特征与分布类型;(2)便于进一步计算指标与分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距二R/组段数,但一般取一方便计算得数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验得适用条件。 (1)资料不符合参数统计法得应用条件(总体为正态分布、且方差相等)或总体分布类型未知:(2)等级资料:(3)分布呈明显偏态又无适当得变量转换方法使之满足参数统计条件;(4)在资料满足参数检验得要 求时,应首选参数法,以免降低检验效能 7.线性回归得主要用途。

统计学提纲第五章

第五章抽样推断 第一节抽样推断的相关基本概念 一、抽样调查 (一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行 观察,用所获得的样本数据推算总体数量特征的一种非全面调查。 (二)抽样调查的特点: 1.按随机原则去抽取调查单位。随机原则也就是机会均等的原则,每个 单位被抽中的机会相等。其目的是保证抽出的样本是随机样本。 2.以样本数据估计总体参数或检验总体的某种假设。抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。 3.抽样误差可以事先计算并加以控制。 (三)抽样调查的适用范围: 1.能够解决全面调查无法或难以解决的问题; 2.对能取得全面资料,但不必进行全面调查的情况。 3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。(四)抽样调查的基本形式 基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。 1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。 2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。 4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。 二、抽样推断的概念及主要内容 (一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。 (二)抽样推断的主要内容为:参数估计和假设检验 三、抽样的有关基本概念 (一)全及总体和样本总体 1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。也就是具有某种共同性质的许多单位的集合体。 2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全

统计学复习提纲

统计学基础复习提纲 复习内容: 第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。 重点内容: 第一章统计和数据 (1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。 (3)统计中的基本概念:总体与样本;参数与统计量;变量。 第二章数据搜集 (1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计 (3)统计数据质量 第四章数据分布特征的测度 (1)集中趋势的测度:平均数;中位数和分位数;众数 (2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数 (3)偏态与峰态度量:偏态系数;峰态系数 第五、六章参数估计与假设检验 (1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。(5)总体均值的检验:大样本检验方法;小样本检验方法。第七章相关与回归分析 (1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。 (2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。(3)利用回归房产进行估计和预测 第八章时间序列分析与预测 (1)时间序列的分解和描述:图形描述;增长率分析 (2)预测方法的选择和估计 (3)平稳序列的预测:移动平均法;指数平滑法 (4)趋势序列的预测:线性趋势预测;非线性趋势预测

432统计学考试大纲

全国硕士研究生入学统一考试应用统计硕士专业学位统计学考试大纲 I 考查目标 全国硕士研究生入学统一考试应用统计硕士专业学位《统计学》考试是为高等院校和科研院所招收应用统计硕士生而设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以利用选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据处收集、处理和分析的一些基本统计方法。 具体来说。要求考生: 1.掌握数据收集和处理的基本分方法。 2.掌握数据分析的基本原理和方法。 3.掌握了基本的概率论知识。 4.具有运用统计方法分析数据和解释数据的基本能力。 II 考试形式 一、试卷满分及考试时间 试卷满分为150分,考试时间180分钟。 二、答题方式 答题方式为闭卷、笔试。允许使用计算器(仅仅具备四则运算和开方运算功能的计算器),但不得使用带有公式和文本存储功能的计算器。 三、试卷内容与题型结构 统计学120分,有以下三种题型: 单项选择题25题,每小题2分,共50分 简答题3题,每小题10分,共30分 计算与分析题2题,每小题20分,共40分 概率论30分,有以下三种题型: 单项选择题5题,每小题2分,共10分 简答题1题,每小题10分,共10分 计算与分析题1题,每小题10分,共10分 III 考查内容 一、统计学 1.调查的组织和实施。 2.概率抽样与非概率抽样。 3.数据的预处理。 4.用图表展示定性数据。 5.用图表展示定量数据。 6.用统计量描述数据的水平:平均数、中位数、分位数和众数。

《医学统计学》样题一

《医学统计学》样题一 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 1. 样本率与总体率差别的假设检验可用。 A 四格表直接概率法计算 B 四格表χ2检验 C 不能检验 D 由样本率制定总体率的可信区间来判断 E 以上都不是 2.在抽样研究中,当样本例数逐渐增多时_____。 A 标准误逐渐加大 B 标准差逐渐加大 C 标准差逐渐减小 D 标准误逐渐减小 E 标准差趋近于0 3.2008年某乡卫生院接诊结核病患者100人,其中男性76人,女性24人,分别占76%和24%,则可以推断出的结论为。 A 该病男性易患 B 该病男女患病率不同 C该病女性易患 D 该病男女发病率不同 E 尚不能得出男女间患病率孰高孰低的结论 4.要减少抽样误差,通常的做法是_____。 A 适当增加样本例数 B 将个体变异控制在一个范围内 C 减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P<0.05 P值越小,则获得的结论是。

A 两样本均数差别越大 B 两总体均数差别越大 C 越有理由说两总体均数不同 D 越有理由说两样本均数不同 E 越有理由说两总体均数差别很大 6 在两样本均数比较的t检验中,无效假设是_____。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E样本均数等于总体均数 7.要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是。 A 用该市8岁女孩身高的95%或99%正常值范围来评价????????? B 作身高差别的假设检验来评价 C 用身高均数的95%或99%可信区间来评价 D 不能作评价 E 以上都不是 H是_____。 8.两个独立样本秩和检验时的 A 两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D 两总体分布相同 E 两总体分布没有关联 9.在配对设计数值变量资料的对比分析中,配对的目的是为了。 A 提高测量精度 B 操作方便 C 应用t检验 D 提高组间可比性 E 减少实验误差 10.配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数据,两次t检验的结果_____。 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E 结论可能相同或相反 11. 总体是由组成的。 A 部分个体 B 全部个体 C 相同的观察指标 D 全部研究对象 E 同质个体的所有观察值 12.关于构成比,不正确的是。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小

统计学复习提纲(整理)

统计学复习提纲(学生用) 一、单选题 1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( C ) A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均花费 D.1000个消费者的平均花费 2.为了调查某学校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( D ) A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样 3.某班学生平均成绩是80分,标准差10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70-90分之间的学生大约占( C )一个标准差范围 A. 95% B.89% C.68% D.99% 4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的期望(等于总体均值)和抽样分布的标准差分别为( B ) A. 50,8 B. 50,1 C. 50,4 D. 8,8 5.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生考试分数的置信区间为75-85分。全班学生的平均分数( B&D )【有争议,两个中任选一个都对】A.肯定在这一区间内 B.有95%的可能在这一区间内 C.有5%的可能在这一区间内 D. 或者在区间内,或者不在。 6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所做的一项调查中,随机抽取120个新车主中有57人为女性,检验2005年薪车主中女性的比

例是否显著增加,建立的原假设和备择假设为( C ) A. H 0: π=40%,H 1: π≠40% B. H 0: π≥40%,H 1: π<40% C. H 0: π≤40%,H 1: π>40% D. H 0: π<40%,H 1: π≥40% 7.在回归分析中,因变量的预测区间估计是指( B )。 A. 对于自变量x 的一个给定量x 0,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定量x 0,求出因变量y 的个别值的区间 C. 对于自变量y 的一个给定量y 0,求出自变量x 的平均值的区间 D. 对于自变量y 的一个给定量y 0,求出自变量x 的个别值的区间 8.在多元线性回归分析中,如果F 检验表明线性关系显著,则意味着( A ) A. 至少有一个自变量与因变量之间的线性关系显著 B. 所有自变量与因变量之间的线性关系显著 C. 至少有一个自变量与因变量之间的线性关系不显著 D. 所有自变量与因变量之间的线性关系不显著 9.如果时间序列的逐期观察值按一定的增长率增长(即增长的增长)或衰落,则适合的预测模型是( D ) A.移动平均模型 B.指数平滑模型 C.线性模型 D.指数模型 10.设p 为商品价格,q 为销售量,则指数∑∑0010 q p q p 的实际意义是综合反映了( C ) A. 商品销售额的变动程度 B.商品价格变动对销售额的影响 [D. 商品价格和销售量的变动对销售额的影响 11. 根据所使用的计量尺度,统计数据分为( A ) A.分类数据,顺序数据和数值型数据 B.观测数据和试验数据

统计学复习题1要点

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间? 4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组青少年组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人) 150~155 155~160 160~165 165~170 22 108 95 43 70~75 75~80 80~85 85~90 26 83 39 28

2医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r

统计学知识点梳理

复习提纲:(计算部分全用红色标注了!其他红色的是我的推断,可能出什么题型;有下划线的重点记忆!当然整理的知识点都是重点!都要背和理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料和统计学 统计工作:统计实践活动,搜集,整理,分析和提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料和加工整理资料 统计学:关于认识客观现象总体数量特征和数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查:第一阶段,是认识客观经济现象的起点,是统计整理和统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。 统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 例如:所有的工业企业就是一个总体,其中的每一个工业企业就是一个总体单位。 四.标志和指标 标志是用来说明总体单位特征的名称。 指标,亦称统计指标,是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。(以上内容理解即可) 1.指标和标志的区别和联系(简答) 指标与标志的区别:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的;(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的;(2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2.标志与标志值(会区分) 标志分为品质标志和数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3.变异与变量(会什么是变异,什么是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄是42岁,月工资2200元。 4.统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。 (2)统计指标按其作用和表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一.统计调查的含义 统计调查是统计工作过程的第一阶段。它是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要和可能确定

相关主题