搜档网
当前位置:搜档网 › 统计学复习资料整理

统计学复习资料整理

统计学复习资料整理
统计学复习资料整理

极差:一组数据的最大值与最小值之差称为极差,也称全距,用R表示。其计算公式为:R=max(xi)-min(xi)

离散系数:也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其计算公式为:V=S/X。离散系数是测量数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。

三大统计分布:卡方分布、T分布、F分布

卡方分布(χ2)

定理:设n个相互独立并且都服从正态N(0,1)分布的随机变量X1、X2,……Xn,记

则随机变量χ2服从自由度为n的χ2分布。

统计变量服从卡方分布,其含义是:在给定概率α的条件下,满足

或者说表达式的概率为α。

T分布

定理:设随机变量x,y相互独立,X~N(0,1),Y~χ2(n)记。则随

机变量T服从自由度为n的t分布。

设T~t(n),0<α<1,对于满足下列等式

的数t a(n),称为t(n)分布的上侧分位数。对于较大的n(>45)可以同标准正态分布的上侧分位数u a作为t(n)分布的上侧分位数

F分布

定理:设随机变量x,y相互独立,X~χ2(n1),Y~χ2(n2)记,则随机变量F服从第一自由度为n1,第二自由度为n2的F分布,记作:F~F(n1,n2)

若F~F(n1,n2),易知:,若

统计量:描述样本特征的概括性数字度量。完全由样本决定的量,叫做统计量;或者说不含有其他未知量的样本的函数称为统计量。统计量可以看做是对样本的一种加工,它吧样本中所包含的关于总体的其一方面的信息集中起来。最常用的统计量是样本均值和样本

方差S 2。

自由度:随机变量所包含的独立变量的个数。

参数估计:就是用样本统计量去估计总体的参数。在参数估计中,用来估计总体参数的统计

量的名称称为估计量,用符号θ表示。样本均值、样本比例、样本方差等都可以是一个

估计量。而根据一个具体的样本计算出来的估计量的数值称为估计值。参数估计的方法

有点估计和区间估计两种。

点估计:就是用样本统计量θ的某个取值直接作为总体参数θ的估计值。

区间估计:是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统

计量加减估计误差得到。与点估计不同,进行区间估计时,根据样本统计量的抽样分布

可以对样本统计量与总体参数的接近程度给出一个概率度量。

样本量:从总体中抽取的一部分元素的集合为样本,构成样本的元素的数目为样本量。样本

量的大小是选择检验统计量得一个要素。

置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比

例称为置信水平。表示为(1-α)%,α为是总体参数未在区间内的比例。也称置信度

或置信系数。

假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。事先对总体参数或分

布形式作出某种假设,然后利用样本信息来判断假设是否成立;有参数假设检验和非参

数假设检验。采用逻辑上的反证法,依据统计上的小概率原理。

单侧检验:拒绝域在右侧或者在左侧的假设检验,左单侧检验 右单侧检验

双侧检验:拒绝域在两侧的假设检验

原假设:提出一个或两个参数是否等于或大于、小于某个特殊值的命题。H0:有待检验的

假设,又称0假设,收集证据予以反对的假设(总是有等号)

备择假设:H1:又称研究假设,收集证据予以支持的假设。与原假设相对立的假设(总是

有不等号)

方差分析:缩写为ANOV A ,就是通过检验各总体的均值是否相等来判断分类型对数值型变

量是否有显著影响的统计方法。

因子和处理:在方差分析中,所要检验的对象称为因素或因子,是所研究的分类型变量的另

一个名称。因素的不同表现称为处理或水平。

总平方和:记为SST 。它是全部观测值xij 与总均值x 的误差平方和。

组间平方和:记为SSA ,它是各组均值xi 与总均值x 的误差平方和,反应各样本之间的差

异程度,因此又称为因素平方和。

组内平方和:记为SSE ,它是每个水平或组的各样本数据与其组均值的误差平方和,反应了

每个样本观测值的离散情况,因此称为组内平方和。该平方和反应了随机误差的大小。

SST 、SSA 、SSE 之间的关系:

组间方差:SSA 的均方,也称为组间均方,记为MSA ,其计算公式为:

MSA=组间平方和/自由度=SSA/k -1

组内方差:SSE 的均方,也称为组内均方,记为MSE ,其计算公式为:

MSE=组内平方和/自由度=SSE/n -k

将上述MSA 与MSE 进行对比,即得到所需要的检验统计量F 。当H 0为真时,二者的

比值服从分子自由度为k -1、分母自由度为n -k 的F 分布。

单因素方差分析:研究一个分类型自变量同数值型因变量之间关系的一种统计方法。 =====-+k i n j ij k i i i k i n j ij i i x x 11

212112()()()∑∑∑∑∑=====-+-=-k i n j ij k i i i k i n j ij i i x x x x n x x

11212112

双因素方差分析:研究两个分类型自变量同数值型因变量之间关系的一种统计方法。当方差

分析中涉及两个分类型自变量时,称为双因素方差分析。无重复双因素分析 有重复双

因素分析

相关关系:变量之间存在的不确定的数量关系,称为相关关系,一个变量的取值不能由另一

个变量唯一确定。

相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是

根据总体全部数据计算的,称为总体相关系数,记为ρ;若使根据眼根数据计算的,则

称为样本相关系数,记为r 。样本相关系数的计算公式为:

LSD :最小显著差异法。存在一定的缺陷。在都与对照相比时可以使用该法。是对检验两个

总计均值是否相等的t 检验方法的总体方差估计加以修正(用MSE 来代替)而得到的。

式中,t α/2为t 分布的临界值,通过

查t 分布表得到,其自由度为(n -k ),

这里的k 是因素中水平的个数;MSE

为组内方差;ni 和nj 分别是第i 个

样本和第j 个样本的样本量。

简述评价估计量好坏的标准。

1. 无偏性:估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ,所选择

的估计量为θ,如果E (θ)=θ,则称θ为θ的无偏估计量。

2. 有效性:对同一总体参数的两个无偏点估计量有更小标准差的估计量更有效。在无偏估

计的条件下,估计量的方差越小,估计也就越有效。

3. 一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。换而言之,

一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。

怎样理解置信区间?

在区间估计中,又样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的

最小值称为置信下线,最大值称为置信上线。由于统计学家在某种程度是上确信这个区间会

包含真正的样本的总体参数,所以给它取名为置信区间。

什么是假设检验中的两类错误?两类错误之间存在什么样的数量关系?

一类错误是原假设H 0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α

错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,

所以也称β错误或者取伪错误。

α和β在数量上是此消彼长的关系。 2

222

y ()()2222∑∑∑∑∑∑∑-?--=

y y n x x n y

x xy n r

简述假设检验的基本步骤。

1.提出假设

2.确定适当的检验统计量

3.规定显著性水平

4.计算检验统计量的值

5.作出统计决策

方差分析包括哪些类型?它们有何区别?

1.单因素方差分析:研究一个分类型自变量最一个数值型因变量的影响。

2.双因素方差分析:究两个分类型自变量同数值型因变量之间关系的一种统计方法。当方

差分析中涉及两个分类型自变量时,称为双因素方差分析。无重复双因素分析:两个影响因素相互独立;可重复双因素分析:两个因素有交互作用,结合后产生新的影响。

简述方差分析的基本思想。

方差分析的基本假定:1.每个总体都应服从正态分布2.各个总体的方差必须相同(同质性)3.观察值是独立的

方差分析的基本思想和原理:1.判断均值之间是否有差异时需要借助于方差。2,。通过对数据误差来源的分析判断不同总体的均值是否相等。 3.即:判断均值之间是否有差异需要进行方差分析。

解释R2的含义和作用。

R2称为多重判定系数,在无重复双因素方差分析中用于关系强度的测量。行因素所产生的误差平方和记为SSR,列因素所产出的误差平方和记为SSC,这两个平方和加在一起则度量了两个自变量对因变量的联合效应,联合效应与总平方和的比值定义为R2,其平方根R 则反映了这两个自变量合起来与因变量之间的关系强度。即:R2=联合效应/总效应=SSR+SSC/SST

简述相关系数的性质。

1.r的取值范围为-1到1,r=1时,完全正线性相关

R=-1时,完全负线性相关

R=0时,不存在线性相关关系

0>r>=-1,负线性相关

0

R越趋近于+—1,线性相关关系越密切

R越趋近于0,线性相关关系越不密切

2.r具有对称性。x与y之间的相关系数和y与x之间的相关系数相等。

3.r数值大小与x和y的原点及尺度无关。

4.r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。

5.r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。

简述相关系数显著性检验的步骤。

1.提出假设:H0:p=0;H1:P不等于0

2.使用t检验的方法,根据公式计算检验的统计量得出t~t(n-2)

3.根据置信度a,查表,确定接受区域和拒绝区域

4.检验t在哪个区域:若t在拒绝域,则拒绝H0;若t在接受域,则不拒绝H0

5.如果求出两变量之间的线性相关系数,并且证明了两者有显著相关性,则考虑用一

简述参数最小二乘估计的基本原理。

未知量的最可能值是使各项实际观测值和计算值之间差的平方乘以其精确度的数值以后的和为最小。

在回归分析中,F检验和t检验各有什么作用?

F检验(线性关系检验)是检验自变量x和因变量y之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y=β1+β2x+ε来表示。

t检验(回归系数检验)是要检验自变量对因变量的影响是否显著。

参数估计:

1,样本均值根据1-a%这样的概率水平构造了一个置信区间,而总体均值在这个区间里的概率为1-a%,即置信水平为1-a%,显著性水平为a%。

1,一个总体参数的估计的评估:首先看其是否是无偏性,即估计量的抽样分布的数学期望与被估计的总体参数一样;其次,对同一总体参数的两个无偏点,以其方差小的更有效;

一致性,即随着样本容量逐渐增大,估计量应该越来越接近被估计的总体参数。

2,关键掌握几个公式(1),总体均值的估计区间

(2),总体方差的估计区间

方差分析:

1,就是比较组间方差和组内方差,如果相等,则说明组间没有显著性差异,也就是说不同品种不造成影响。因为组间方差既包含系统误差也包含随机误差,组内方差只包含随机方差。

2,误差来源也就是说是组间的还是组内的,方差分析就是对误差来源的分析,判断均值是否相同。前提是三个假定:正态分布,每组的组内方差相同,相互独立

个线性关系式表达两者之间的线性关系

单因素方差分析:

(1),提出假设:H0,H1

(2),计算出每组的平均值X1,计算出总体的平均值X0,计算出总平方和SST,即所有数值的分散情况

(3),计算出组间平方和SSA,即各组均值的分散情况

(4),计算出组内平方和SSE,即各个观察值与该组的均值的平方和之和(所有组)

SST(总误差)=SSA(系统误差和随机误差)+SSE(随机误差)

所以,如果没有显著性差异,则应该是不存在系统误差,那么就是说SSA/自由度=SSE/自由度

SST自由度为n-1

SSA自由度为k-1

SSE自由度为n-k

所以现在需要计算的是SSA/(k-1)与SSE/(n-k)的值,即MSA/MSE,得到的值遵循F分布,其实也就是得到一个F值,然后在给定的显著性水平下,根据k-i和n-k的值在表中查到一个对应的Fa值,比较两者的大小,如果Fa>F,则不接受H0

双因素方差分析:

(1),同单因素一样,首先进行假设,H0,H1;H0,H1(因为是两个因素,所以要分别的假设,最后的结果也是分开的,分别的检验)

(2),求出总误差平方和SST,自由度为kr-1

行误差平方和SSR,自由度为k-1

列误差平法和SSC,自由度为r-1

随机误差项平方和SSE,自由度为(k-1)(r-1)

SST=SSR+SSC+SSE

(3),根据各误差平方和和自由度,求出各均方,MST,MSE,MSR,MSC

下面的步骤和单因素类似,根据行误差均方和随机误差均方的比值MSR/MSE=Fr 根据列误差均方和随机误差均方的比之MSC/MSE=Fc 分别就两种因素中的一种检验,根据自由度,给定的置信度,查出Fa。分别查找行行和列的,分别比较

回归分析与相关分析的区别

1.相关分析中,变量x变量y 处于平等的地位;

2.回归分析中,变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化.

3.相关分析主要是描述两个变量之间线性关系的密切程度;

4.回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制。

回归分析与相关分析的联系

相关分析反映的是一元回归分析所揭示的两个变量之间线性关系的密切程度;

弃法法则:

1.四舍五入法

2.四舍六入五单双法

?(1)四舍六入

?(2)若舍入的该位数是5,则分情况:

a.若该位数前为奇数,或该位数后还有不为零的数字,则入;

b.若该位数后数字全为0,且其前为偶数,则舍去。

计算法则:

(1)进行加减法运算结果的有效位数,自左起不超过参加运算中的数值第一个出现的可疑数字位数,如:1.48+1.23+21.40=24.11=24.1

(2)进行乘除运算,其积商保留的有效数字可比参加运算的有效数字数最少数多一位。如:

0.032×6.0346=0.032×6.03=0.193088(0.1931072)=0.193=0.19

(3)求平方、立方、开方运算中,其结果的有效数字与原数值的有效数字位数相同。

如1.22=1.44=1.4

(4)在对数和反对数运算中,所确定的对数的小数点后的位数应与真数有效数字位数相同。(5)统计计算中,平均值的精度通常较个别观测值高。

多于4个观测值的平均数有效数字比个别观测值多保留一位。

在表示测定精度时,标准差取二位有效数,每当观测参数很大(>50)时,才多取一位。

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学?学习它有何意义? 教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。 2、教育科学研究数据的特点 (1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。 3、思考题:选用统计方法有哪几个步骤? ①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方 法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。 4、教育统计学的分类 (1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。 5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性 质。 具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。 6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。 7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系? 教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。 8、教育统计与心理统计的异同 相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。 9、数据的类型 (一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2. 考试时间共100分钟。 一、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 号证考准

、选择题. 1、统计学的研究对象是( ) A 、各种现象的内在规律 B C 、统计活动过程 D 、各种现象的数量方面 、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( A 、数量指标 B 、质量指标 C 、数量标志 3、一个统计总体( )。 A 、只能有一个标志 B C 、可以有多个标志 D D 品质标志 、只能有一个指标 、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查, 则总体单位是( ) A 、每一名职工 B C 、500名职工 D 5、在全国人口普查中,( )。 A 、女性是品质标志 B C 、人口的平均寿命是数量指标 D 6重点调查的重点单位是( )。 A 、收集数据资料的重点单位 、每一名职工的工资水平 、500名职工的工资总额 、某人的年龄30岁是变量 、全国人口总数是统计指标 B 、在全局工作中处于重要地位的单位 C 这些单位的标志值在总体标志总量中占有很大比重 D 这些单位数量占总体单位数的很大比重 7、 要了解我国煤炭生产的基本情况,最适合的调查方式是( ) A 、抽样调查 B 、重点调查 C 、典型调查 D 普查 8、 对一批商品进行质量检验,最适宜采用的方法( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 重点调查 9、 目前我国城镇职工家庭收支情况调查是采用( )。 A 、普查 B 抽样调查 C 、典型调查 D 重点调查 10、 下列分组中属于按品质标志分组的是( ) A 、学生按考试分数分组 E 、产品按品种分组

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

2017统计学考试复习资料

统计学考试复习资料 简答题(12题选5个) 1、统计数据的类型有哪些? (1)、按计量层次分类: a.分类数据:只能归于某一类别的非数字型数据;对事物进行分类的结果,数据表现为类别,用文字来表述,例如:人口按性别分为男、女两类。 b.顺序数据:只能归于某一有序类别的非数字型数据;对事物类别顺序的测度,数据表现为类别,用文字来表述,例如:产品分为一等品、二等品、三等品、次品等。 c.数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。 (2).按收集方法分类: a.观测的数据:通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据。 b.试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据。 (3).按时间状况分类: a.截面数据:在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况,比如,2005年我国各地区的国内生产总值数据。 b.时间序列数据:在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据。 2、简述数据误差的来源? (1)抽样误差:由于抽样的随机性带来的误差,所有样本可能的结果与总体真值

之间的平均性差异,影响抽样误差的大小的因素为样本量的大小和总体的变异性。 (2)非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。存在与所有的调查之中:概率抽样、非概率抽样、全面性调查。有抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 3、衡量数据离散程度的指标有哪些? 衡量数据离散程度的指标有:(1).异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;(2).四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;(3).方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 4、为什么说正态分布是客观现象中最主要的分布? 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 5、请你说明小概率原理的含义? 在概率论中,我们将发生概率很小一般来说不超过百分之五的事件称为小概率事件,小概率原理指的是在假设检验中,我们提出一个假设,用小概率事件去检验,如果小概率事件发生了,证明我们的假设有问题。 6、评价估计量的标准有哪些?并解释他们的含义。 在实际工作中,总体参数往往是未知的,需要使用样本统计量来估计总体参数。衡量估计量优劣的标准一般有以下三个: (1)无偏性:无偏性不是要求估计量与总体参数不得有偏差,因为这是不可能的,既然是抽样,必然存在抽样误差,不可能与总体完全相同。无偏性指的是如果对这同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数。符合这种要求的估计量被称为无偏估计量。(2)有效性:估计量与总体之间必然存在着一定的误差,衡量这个误差大小的一个指标就是方差,

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

统计学期末考试题库及答案

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。() 三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备

4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是 ( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。 A.标志是说明总体单位特征的 B.品质标志是用文字表示的 C.数量标志是用数字表示的 D.数量标志说明总体量的特征 9.关于变量下列说法不正确的是( )。 A.只能取整数的变量是离散变量 B.可以用小数表示的是连续变量 C.只能用小数表示的是连续变量 D.数量标志的具体表现称为变量值 10.关于指标下列说法不正确的是( )。 A.数量指标说明总体规模和水平 B.数量指标用绝对数表示 C.质量指标只能用相对数表示 D.质量指标用相对数或平均数表示 四、多项选择题 1.属于连续型变量的有( )。 A.国内生产总值 B.企业数 C.身高 D.体重 E.人数2.属于离散型变量的有( )。 A.增加值 B.学校数 C.机器台数 D.销售额 E.粮食产量3.下列属于品质标志的有( )。

统计学知识点全归纳全面准确

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 二、统计学的产生与发展 (1)政治算术学派 最早的统计学源于17世纪英国。其代表人物是威廉·配第,代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。其被称为“无统计学之名,有统计学之实”。 (2)记述学派 亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。因此被称为“有统计学之名,无统计学之实”。 (3)社会统计学派 创始人和代表人物,德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。 (4)数理统计学派 创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。 从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之

间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。 (4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。(2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析 描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用

关于生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

统计学重要考点总结

第一章导论 1.2、 描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计 方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 1.3、统计学据可以分成哪几种类型,各有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同,分为:观测数据、和实验数据。 观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域。 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 1.4 分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,该数据表现为类别,使用文字来表述的,分类数据主要由分类尺度计量形成的。 顺序数据:只能归于某一有序类别的非数字型数据,这些类别是有顺序的,它是由顺序尺度计量形成的。 数值型数据:按数字尺度测量的观察值,是使用自然或度量衡单位对事物进 行测量的结果,其结果表现为具体的数值。 第二章数据的搜集 2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽 样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本

被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 第三章数据的图表搜集 3.4直方图和条形图有何区别? 条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积 表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度 与宽度都有意义; 直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。 3.6饼图和环形图的不同? 饼图只能显示一个样本或总体各部分所占比例。环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。 第四章习题答案 4.5简述众数、中位数和平均数的特点和应用场合。 众数:主要用于分类数据集中趋势的度量;是一组数据的峰值; 优点:不受极值的影响。 缺点:具有不唯一性;只有数据量较大时才有效果 中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。 平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。 优点:利用了所有数据信息;数据误差相互抵消,具有无偏性; 缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。 4.9测度数据分布形状的统计量有哪些?峰态系数、偏态系数。

2020年统计学考试复习资料

《统计学》复习资料 一、单项选择题: 1. 调查项目通常以表的形式表示,称作调查表,一般可分为( B )。 A.单一表和复合表 B.单一表和一览表 C.简单表和复合表 D.简单表和一览表 2. 要准确地反映异距数列的实际分布情况,必须采用( D ) A.次数 B.累计频率 C.频率 D.次数密度 3. 政治算术派产生于17世纪资本主义的英国,代表人物是( B )。 A.亚当·斯密 B.威廉·配第 C.康令 D.凯特勒 4. 进行相关分析,要求相关的两个变量( A )。 A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 5. 调查某市工业企业职工的工种、工龄、文化程度等情况( D )。 A.填报单位是每个职工 B.调查单位是每个企业 C.调查单位和填报单位都是企业 D.调查单位是每个职工,填报单位是每个企业 6. 下面的函数关系是( B )。

A.销售人员测验成绩与销售额大小的关系 B.圆周的长度决定于它的半径 C.家庭的收入和消费的关系 D.数学成绩与统计学成绩的关系 7.统计总体的同质性是指( B )。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志属性或数量标志值D.总体各单位具有若干互不相同的品质标志或数量标志 8.反映抽样指标与总体指标之间抽样误差可能范围的指标是( C )。 A.抽样平均误差;B.抽样极限误差; C.抽样误差系数;D.概率度 9.某工人月工资90元,则工资是( C )。 A、质量指标 B、数量指标 C、数量标志 D、变量值 10.某厂工业总产值逐年有所增加,1999年、2001年、2002年分别增长5%、8%、10%,三年工业总产值总共增长( D )。A.23% B.22% C.11.2% D.24.74% 11.某电器厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( C ). A.统计报表B.重点调查C.全面调查D.抽样调查

2018统计学-18总复习资料

《统计学》综合复习资料 一、单项选择题 1.统计一词的三种涵义是()。 A.统计工作.统计资料.统计学B.统计调查.统计整理.统计分析 C.统计设计.统计分组.统计预测D.统计方法.统计分析.统计预测 2.要研究某地区570家工业企业的产品生产情况,总体是()。 A.每个工业企业 B.570家工业企业 C.570家工业企业每一件产品 D.570家工业企业全部工业产品 3.为了解全国钢铁生产的基本情况,对鞍钢、武钢、宝钢等特大型钢铁企业的产量进行调查,属于 ()。 A.重点调查 B.典型调查 C.简单随机抽样调查 D.整群抽样调查 4.某商品销售量的前三个季度的季节指数分别为:112%,88%,90%,则第四个季度的季节指数为()。 A.102% B.110% C.98% D.100% 5.某厂2009年完成产值2千万,2010年计划增长10%,实际完成2310万元,则计划完成程度为()。 A.105% B.5% C.115.5% D.15.5% 6.统计调查按其组织形式分类,可分为()。 A.普查和典型调查 B.重点调查和抽样调查 C.统计报表和专门调查 D.经常性调查和一次性调查 7.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用()。 A.算术平均数 B.调和平均数 C.几何平均数 D.众数 8.第一组工人的平均工龄为6年,第二组为8年,第三组为10年,第一组工人数占总数的30%,第二组占50%,则三组工人的平均工龄为()。 A.8年 B.7.55年 C.32.5年 D.7.8年 9.直接反映总体规模大小的指标是()。 A.总量指标 B.相对指标 C.平均指标 D.变异指标 10.某商品价格比原先降低5%,销售量增长了5%,则销售额()。 A.上升 B.下降 C.不变 D.无法确定

统计学考试重点题目

1、某车间30 要求:累计 要求:按考试成绩分组编制组距式变量数列,并计算出各组频率和组中值。 比上期增长多少;又该企业产品单位成本计划在上期699元水平上降低12元,实际上本期单位成本为672元,试计算单位成本计划完成百分数。 (2)某企业2001年产品销售计划为上年的108%,实际为上年的114%,

试计算该企业2001年度产品销售计划完成百分数。 (3)某企业2001年劳动生产率增长计划完成102%,这一年劳动生产率为2000年的107%,试计算该企业2001年劳动生产率计划比2000年增长百分数。 (1)(1+5%)÷103%-1=1.94% 672÷(699-12)=97.82% (2)114%÷108%=105.56% (3)107%÷102%-1=14.90% 3、已知甲、乙两农贸市场某种农产品分等级的销售资料如下表: 要求:通过计算比较甲、乙两农贸市场哪一个的平均价格高,并说明两市场平均价格不一致的理由。 ∑∑===(元)甲38.14/5.5/f Xf X (元) 乙33.14/3.5/===∑∑f Xf X 4、某厂生产的某种零件,要经过三道工序,已知各工序的合格率分别为95%、93%和98%。要求:计算该零件在各道工序的总合格率和平均合格率。 总合格率=%583.86%98%93%95=?? 平均合格率=%31.95%98%93%953=?? 5、某商业局系统所属20个商店2000年的商品销售额与流通费用率资料如下表: 要求:计算该系统所属商店的平均流通费用率和销售额计划平均完成百分数。

M/m/x ym/m 6、(1)某数列的平均数为1000,标准差系数为0.256,求标准差; (2)某数列的平均数为12,各变量值平方的平均数为169,求标准差系数; (3)某数列的标准差为3,各变量值平方的平均数为25,求平均数; (4)某数列的标准差为30,平均数为50,求变量值对90的方差; (5)设y = x ± a ,若y σ=28,求x σ; (6)设y = 0,若y σ=12,求x σ。 (1)2561000256.0=?=?=X V σ(2)5)12(169222=-=-=X X σ 4167.012/5/===X V σ (3)4325222=-=-=σX X (4)2500)5090(30)90(2222 2 90=-+=-+=X X σσ (5)28==y x σσ (6)158.0/12||/===a y x σσ 9、设甲县农民人均收入为5880元,标准差为680元,农业人口为88.2万人;乙县农民人均收入6240元,标准差860元,农业人口89.50万人。要求:计算甲、乙两县农民人均纯收入的平均数、方差和标准差系数。

统计学重点整理及复习资料

统计学重点整理及复习资料 第一章 统计有三个含义,即:统计工作、统计资料、统计学。 统计学的研究对象:社会经济现象数量的总体数量特征及数量关系。(学科性质:方法论) 统计学的特点:数量性、总体性、具体性、社会性、广泛性。 统计工作的过程:设计、调查、整理、分析。 统计的研究方法:统计分组法、大量观察法、综合指标法、统计模型法、统计推断法。 统计总体:客观性、同质性、差异性。组成统计总体的个别单位称为总体单位。 标志:统计学中总体单位所具有的属性或者特征;分为数量标志和品质标志(不可量性). 指标:反应总体某一综合数量特征的名称或范畴;可分数量指标和质量指标(率、平均)。 变异:指可变的品质标志;变量:指可变化的数量标志,变量的树枝也叫做变量值(标志值)。 第二章 统计调查:指根据统计研究的目的和要求,运用科学的调查方法有计划的、有组织的向社会实际搜集各项统计资料的过程。 统计调查的意义:是人们认识社会的基本方式、是统计的重要环节、在统计学中占有重要地位。统计调查的基本要求:准确、及时、系统、和完整性。 统计调查的种类:1、按组织方式可分为统计报表制和专门调查。2、按调查对象可分为全面调查和非全面调查。3、按登记事物的连续性可以分为经常性调查和一次性调查(时点状态)。4、按搜集资料的不同可分为直接观察法、报告法、采访法、问卷调查法。 统计方案的设计:一、确认调查任务和目的,二、确定调查对象和单位,三、确定调查项目和设计调查表,四、确定调查时间地点,五、制定调查的组织实施计划。 专门调查可分为:普查、重点调查、典型调查和抽样调查。 普查:为了特定的研究目的而专门组织的一次性全面调查;特点:1、一次性调查2、主要调查一定时点的情况3、普查的数据一般比较准确,规范化程度较高;原则:1、必须统一规定普查的时点2、正确选择普查的时期3、在普查范围内各调查单位或调查点应尽可能的同时进行4、同类普查的内容在各次普查中应尽可能的保持一致。

期末考试复习--统计学

习题课 1、有两个班同学参加统计学考试,甲班的平均分数81分,标准差9.9分,乙班的考试成绩如下: 要求:(1)计算乙班的平均分数和标准差。 (2)比较哪个班的平均分数更有代表性。 解题过程参考教材和作业。 2、某钢铁厂2002年—2007年钢铁产量如下表。 (1)计算出表中各动态分析指标的数值,并填入表内的相应格中,

(2)计算2002年—2007年的平均增长量。 需要掌握的时间序列的动态分析指标有: 1. 增长量: (1) 逐期增长量:12312;;;----n n a a a a a a (2) 累积增长量:00201;;;a a a a a a n --- (3) 平均增长量 = 逐期增长量之和/逐期增长量个数 = 累积增长量/(时间序列项数-1) 2. 发展速度与增长速度: (1) 环比发展速度:123 12,,,-n n a a a a a a (2) 定基发展速度: 02 01,,a a a a a a n (3) 增长速度 = 发展速度-1 (4) 平均发展速度 = n n a a 0 (5) 平均增长速度 = 平均发展速度-1 3、某厂生产的三种产品的有关资料如下:

要求: (1)计算三种产品的价格总指数以及由于价格变动使销售总额变动的绝对额 (2)计算三种产品的销售量总指数以及由于销售量变动而使销售总额变动的绝对额 (3)利用指数体系分析说明销售总额(相对程度和绝对额)变动的情况 解:列表计算如下:

(1)三种产品的价格指数: %11515.126100 30100 11 1或== = ∑∑z q z q k z 由于价格变动影响的销售总额绝对额: ∑∑0111-z q z q =30100-26100=4000元 (2)三种产品的销售量总指数: %10303.125350 26100 001或== = ∑∑z q z q k q 由于销售量变动影响的销售总额绝对额: ∑∑0001-z q z q =26100-25350=750元 (3) 销售总额指数: %7.118187.125350 30100 01 1或== = ∑∑z q z q k qz 销售总额的绝对额: ∑∑0011-z q z q =30100-25350=4750元 指数体系:118.7%=115%*103% 4750万元=4000万元+750万元 分析说明:………….….。 4、宁波新四方快餐厅连续3个星期抽查49位顾客,以调查顾客的平 均消费额,得样本平均消费额为25元,并假设总体的标准差为10.5元,要求:

统计学原理期末复习资料(题目及答案)

统计学原理期末复习资料汇总 一、考试题型 单选:12%,每小题2分,共12分,见平时作业手册; 多选:8%,每小题2分,共8分,见平时作业手册; 判断:10%,每小题2分,共10分,见平时作业手册; 简答题:20%,每小题10分,共20分; 计算题:50% 考试时间:90分钟,闭卷,可以带计算器 二、简答题 1、举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 2、一个完整的统计调查方案包括哪些内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 3、简述调查对象、调查单位与填报单位的关系并举例说明。 答:调查对象即统计总体,是根据调查目的所确定的研究事物的全体。统计总体这一概念在统计调查阶段称调查对象。调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。报告单位也成填报单位,也是调查对象的组成要素,它是提交调查资料的单位,一般是基层企事业组织。调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。例如对工业企业进行全部设备调查时,工业企业的全部设备是调查对象,每台设备是调查单位,而每个工业企业则是填报单位。 4、某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查额典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查时依据对总体的分析,有意识地选取调查单位。因此,根据本题选择调查单位的方法可判断出该地区对工业企业进行调查,采用的是典型调查方式。 5、简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 6、单项式分组与组距式分组分别在什么情况下运用? 答:离散型变量如果变量值变动幅度较小,可依次将每个变量值作为一组。采用单项式分组。离散型变量如果变量值变动很大,次数又很多,或是连续性变量,采用组距式分组。 7、简述结构相对指标和比例相对指标有什么不同,并举例说明。 答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。如:各工种的工人占全部工人的比重。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况,如:轻重工业比例。 8、强度相对指标与平均指标的区别?

相关主题