搜档网
当前位置:搜档网 › 统计学课后习题答案(第四版)

统计学课后习题答案(第四版)

统计学课后习题答案(第四版)
统计学课后习题答案(第四版)

《统计学》第四版

第四章练习题答案

4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=

5.5,M e =10;平均数:

6.910

96

==

=

∑n

x x i

(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.49

4

.1561

)

(2

==

-=

∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23

(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5 (3)平均数==

∑n

x

x i

600/25=24,标准差65.61

251062

1

)

(2

=-=

-=

∑-n i s x x

(4)偏态系数SK=1.08,峰态系数K=0.77

(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 4.3 (1

(2)==

∑n

x

x i

63/9=7,714.08

08

.41

)

(2

==

-=

∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==

∑n

x x i

8223/30=274.1

中位数位置=n+1/2=15.5,M e =272+273/2=272.5

(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5 (3) 17.211

307

.130021

)

(2

=-=

-=

∑-n i s x x

4.5 (1)甲企业的平均成本=总成本/总产量=

41.19340

6600

30

1500203000152100150030002100==++++

乙企业的平均成本=总成本/总产量=

29.18342

6255

30

1500201500153255150015003255==++++

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较

大,因此拉低了总平均成本。

4.6 (1)(计算过程中的表略),==

∑n

M x f i

i

51200/120=426.67

48.1161

1207

.16146661

)

(2

=-=

-=

∑-n f i s i

x M

SK=0.203 K=-0.688

4.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。

(2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。

4.8 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为v 女=5/50=0.1,男生体重的离散系数为v 男=5/60=0.08,所以女生的体重差异大。 (2)男生:=x 60×2.2=132(磅),s=5×2.2=11(磅)

女生:=x 50×2.2=110(磅),s=5×2.2=11(磅)

(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg 之间。

(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg 之间。 4.9 通过计算标准分数来判断:

;115100115=-=-=A A A A s x x z

;150

400

425=-=-=B B B B

s x x z

该测试者在A 项测试中比平均分数高出1个标准差,而在B 项测试中只高出平均分数0.5

个标准差,由于A 项测试的标准分数高于B 项测试,所以,A 项测试比较理想。 4.9 通过标准分数来判断,各天的标准分数如下表:

4.11

(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。

(2)成年组身高的离散系数:024.01.1722

.4==

s v 幼儿组身高的离散系数:035.03

.715

.2==s v

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 4.12

(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。

(2)下表给出了各种方法的主要描述统计量。

从三种方法的集中趋势来看,方法A 的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:013.0.6

1653

.12A ==

v ,014.0.731285.71B ==

v ,022.0.53

125.77

2C ==v 。方法A 的离散程度最小,因此,应选择方

法A 。 4.13

(1)用方差或标准差来评价投资的风险。

(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。 (3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。

第七章 练习题参考答案

7.1 (1)已知σ=5,n=40,x =25,α=0.05,

z

05.0=1.96

样本均值的抽样标准差

σ

x

=n

σ

=

79.0405= (2)估计误差(也称为边际误差)E=

z 2

α

n

σ

=1.96*0.79=1.55

7.2(1)已知σ=15,n=49,x =120,α=0.05,

z

05.0=1.96

(2)样本均值的抽样标准差

σ

x

=n

σ

=

=4915 2.14 估计误差E=

z 2

α

n

σ

=1.96*

=4915 4.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n

x z σ

α

±

=120±1.96*2.14=120±4.2,即(115.8,124.2)

7.3(1)已知σ=85414,n=100,x =104560,α=0.05,

z

05.0=1.96

由于总体标准差已知,所以总体均值μ的95%的置信区间为: n

x z σ

α

±

=104560±1.96*

=100

85414104560±16741.144即(87818.856,121301.144)

7.4(1)已知n=100,x =81,s=12, α=0.1,

z

2

1.0=1.645

由于n=100为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=81±1.645*

=100

1281±1.974,即(79.026,82.974)

(2)已知α=0.05,

z

2

05.0=1.96

由于n=100为大样本,所以总体均值μ的95%的置信区间为:

n

s x z 2

α±=81±1.96*

=100

1281±2.352,即(78.648,83.352)

(3)已知α=0.01,

z

2

01.0=2.58

由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n

s x z 2

α±=81±2.58*

=100

1281±3.096,即(77.94,84.096)

7.5(1)已知σ=3.5,n=60,x =25,α=0.05,

z

05.0=1.96

由于总体标准差已知,所以总体均值μ的95%的置信区间为: n

x z σ

α

±

=25±1.96*

=60

.5325±0.89,即(24.11,25.89)

(2)已知n=75,x =119.6,s=23.89, α=0.02,z

2

02.0=2.33

由于n=75为大样本,所以总体均值μ的98%的置信区间为:

n

s x z 2

α±=119.6±2.33*

=75

9.823119.6±6.43,即(113.17,126.03)

(3)已知x =3.419,s=0.974,n=32,α=0.1,

z

2

1.0=1.645

由于n=32为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=3.419±1.645*

=32

74.90 3.419±0.283,即(3.136,3.702)

7.6(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=0.05,z

2

05.0=1.96

由于总体服从正态分布,所以总体均值μ的95%的置信区间为:

n

x z σ

α2

±=8900±1.96*

=15

5008900±253.03,即(8646.97,9153.03)

(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=0.05,

z

2

05.0=1.96

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:

n

x z σ

α2

±=8900±1.96*

=35

5008900±165.65,即(8734.35,9065.65)

(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.1,

z

2

1.0=1.645

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=8900±1.645*

=35

5008900±139.03,即(8760.97,9039.03)

(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.01,

z

2

01.0=2.58

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:

n

s x z 2

α±=8900±2.58*

=35

5008900±218.05,即(8681.95,9118.05)

7.7 已知:n=36,当α=0.1,0.05,0.01时,相应的

z

2

1.0=1.645,

z

2

05.0=1.96,

z

2

01.0=2.58

根据样本数据计算得:x =3.32,s=1.61

由于n=36为大样本,所以平均上网时间的90%置信区间为:

n

s x z 2

α±=3.32±1.645*

=36

1.61 3.32±0.44,即(

2.88,

3.76)

平均上网时间的95%置信区间为:

n

s x z 2

α±=3.32±1.96*

=36

1.61 3.32±0.53,即(

2.79,

3.85)

平均上网时间的99%置信区间为:

n

s x z 2

α±=3.32±2.58*

=36

1.61 3.32±0.69,即(

2.63,4.01)

7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)

(18t

2

05.0-=2.365 根据样本数据计算得:x =10,s=3.46 总体均值μ的95%的置信区间为:

n

s x t 2

α±=10±2.365*

=8

3.4610±2.89,即(7.11,12.89)

7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)

(116t

2

05.0-=2.131 根据样本数据计算得:x =9.375,s=4.113

从家里到单位平均距离的95%的置信区间为:

n

s x t 2

α±=9.375±2.131*

=14

4.1139.375±2.191,即(7.18,11.57)

7.10 (1)已知:n=36,x =149.5,α=0.05,

z

2

05.0=1.96

由于n=36为大样本,所以零件平均长度的95%的置信区间为:

n

s x z 2

α±=149.5±1.96*

=36

1.93149.5±0.63,即(148.87,150.13)

(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为μ、方差为

σ

2

的总体中,抽取了容量为n 的随机样本,当n 充分大时(通常要求30n ≥),样本均值

的抽样分布近似服从均值为μ,方差为

n

σ

2

的正态分布。

7.12 (1)已知:总体服从正态分布,但σ未知,n=25为小样本,

α=0.01,)125(201.0-t

=2.797 根据样本数据计算得:x =16.128,s=0.871

总体均值μ的99%的置信区间为:

n

s x t 2

α±=16.128±2.797*

=25

0.87116.128±0.487,即(15.64,16.62)

7.13 已知:总体服从正态分布,但σ未知,n=18为小样本,α=0.1,)118(2

1.0-t

=1.74

根据样本数据计算得:x =13.56,s=7.8

网络公司员工平均每周加班时间的90%的置信区间为:

n

s x t 2

α±=13.56±1.74*

=18

7.813.56±3.2,即(10.36,16.76)

7.14 (1)已知:n=44,p=0.51,α=0.01,z

2

01.0=2.58

总体比例π的99%的置信区间为:

n p p )1(p z 2

-±α=0.51±2.5844

)

51.01(51.0-=0.51±0.19,即(0.32,0.7) (2)已知:n=300,p=0.82,α=0.05,z

2

05.0=1.96

总体比例π的95%的置信区间为:

n p p )1(p z 2

-±α=0.82±1.96300

)

82.01(82.0-=0.82±0.04,即(0.78,0.86) (3)已知:n=1150,p=0.48,α=0.1,,z

2

1.0=1.645

总体比例π的90%的置信区间为:

n p p )1(p z 2

-±α=0.48±1.6451150

)

48.01(48.0-=0.48±0.02,即(0.46,0.5) 7.15 已知:n=200,p=0.23,α为0.1和0.05时,相应的z

2

1.0=1.645,

z

2

05.0=1.96

总体比例π的90%的置信区间为:

n p p )1(p z 2

-±α=0.23±1.645200

)

23.01(23.0-=0.23±0.05,即(0.18,0.28) 总体比例π的95%的置信区间为:

n p p )1(p z 2

-±α=0.23±1.96200

)

23.01(23.0-=0.23±0.06,即(0.17,0.29) 7.16已知:σ=1000,估计误差E=200,α=0.01,

z

2

01.0=2.58

应抽取的样本量为:E

z 2

2

2

)(2n σ

α=

=

200

1000

58.22

2

2

?=167

7.17 (1)已知:E=0.02,π=0.4,α=0.04,

z

2

04.0=2.05

应抽取的样本量为:E

z 22

12n )()(ππα-==2.0005.22

2

.401.40)

(-??=2522

(2)已知:E=0.04,π未知,α=0.05,

z

2

05.0=1.96

由于π未知,可以使用0.5(因为对于服从二项分布的随机变量,当π取0.5时,其方差达

到最大值。因此,在无法得到总体比例的值时,可以用0.5代替计算。这样得出的必要样本容量虽然可能比实际需要的容量大一些,但可以充分保证有足够高的置信水平和尽可能小的置信区间)

故应抽取的样本量为:

E

z 2

2

12n )()(ππα-=

=

4

.006.912

2

.501.50)

(-??=601

(3)已知:E=0.05,π=0.55,α=0.1,

z

2

1.0=1.645

应抽取的样本量为:E

z 2

2

12n )()(ππα-=

=

.05

0.64512

2

.5501.550)

(-??=268

7.18 (1)已知:n=50,p=32/50=0.64,α=0.05,

z

2

05.0=1.96

总体中赞成该项改革的户数比例的95%的置信区间为:

n p p )1(p z 2

-±α=0.64±1.9650

)64.01(64.0-=0.64±0.13,即(0.51,0.77) (2)已知:E=0.1,π=0.8,α=0.05,

z

2

05.0=1.96

应抽取的样本量为:E

z 2

2

12n )()(ππα-=

=

.1

0.9612

2

.801.80)

(-??≈62

第四章统计学综合指标课后习题

二、单项选择题 1.加权算术平均数的大小( ) A受各组次数f的影响最大B受各组标志值X的影响最大 C只受各组标志值X的影响D受各组次数f和各组标志值X的共同影响 2,平均数反映了( ) A总体分布的集中趋势B总体中总体单位分布的集中趋势 C总体分布的离散趋势D总体变动的趋势 3.在变量数列中,如果标志值较小的一组权数较大,则计算出来的算术平均数( ) A接近于标志值大的一方B接近于标志值小的一方C不受权数的影响D无法判断4.根据变量数列计算平均数时,在下列哪种情况下,加权算术平均数等于简单算术平均数( ) A各组次数递增B各组次数大致相等C各组次数相等D各组次数不相等 5.已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法 6.已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用( ) A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法 7.计算平均数的基本要求是所要计算的平均数的总体单位应是( ) A大量的B同质的C差异的D少量的 8,某公司下属5个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是( ) A计划产值B实际产值C工人数D企业数 9.中位数和众数是一种( ) A代表值B常见值C典型值D实际值 10.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( ) A各组的次数必须相等B各组标志值必须相等 C各组标志值在本组内呈均匀分布D各组必须是封闭组 11.四分位数实际上是一种( ) A算术平均数B几何平均数C位置平均数D数值平均数 12.离散趋势指标中,最容易受极端值影响的是( ) A极差B平均差C标准差D标准差系数 13.平均差与标准差的主要区别在于( ) A指标意义不同B计算条件不同C计算结果不同D数学处理方法不同 A 7万元 B 1万元 C 12 万元 D 3万元 15.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为( ) A25% B 30% C 40% D 50% 17.方差是数据中各变量值与其算术平均数的( ) A离差绝对值的平均数B离差平方的平均数 C离差平均数的平方D离差平均数的绝对值 18.一组数据的偏态系数为1.3,表明该组数据的分布是( ) AlE态分布B平顶分布C左偏分布D右偏分布 19.当一组数据属于左偏分布时,则( )

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

统计学课后第四章习题答案

第4章练习题 1、一组数据中岀现频数最多的变量值称为() A. 众数 B.中位数 C.四分位数 D.平均数 2、下列关于众数的叙述,不正确的是() A. —组数据可能存在多个众数 B.众数主要适用于分类数据 C. 一组数据的众数是唯一的 D. 众数不受极端值的影响 3、一组数据排序后处于中间位置上的变量值称为() A.众数 B.,中位数 C.四分位数 D.平均数 4、一组数据排序后处于25%和75%位置上的值称为() A.众数 B.中位数 C.四分位数 D.平均数 5、非众数组的频数占总频数的比例称为() A.异众比率 B.离散系数 C.平均差 D.标准差 6、四分位差是() A. 上四分位数减下四分位数的结果| B. 下四分位数减上四分位数的结果 C.下四分位数加上四分位数 D. 下四分位数与上四分位数的中间值 7、一组数据的最大值与最小值之差称为() A.平均差 B.标准差 C.极差 D.四分位差 8、各变量值与其平均数离差平方的平均数称为() A.极差 B. 平均差 C.,方差 D.标准差 9、变量值与其平均数的离差除以标准差后的值称为() A.标准分数 B.离散系数 C.方差 D.标准差 10、如果一个数据的标准分数-2,表明该数据() A.比平均数高出2个标准差 B. ■比平均数低2个标准差 C.等于2倍的平均数 D. 等于2倍的标准差 11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有() A.68%的数据 B.95% 的数据 C.99% 的数据 D.100%勺数据 12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是() A. 至少有75%勺数据落在平均数加减4个标准差的范围之内 B. 至少有89%的数据落在平均数加减4个标准差的范围之内 C. 至少有94%的数据落在平均数加减4个标准差的范围之内 D. 至少有99%的数据落在平均数加减4个标准差的范围之内 13、离散系数的主要用途是() A.反映一组数据的离散程度 B.反映一组数据的平均水平 C.比较多组数据的离散程度 D.比较多组数据的平均水平 14、比较两组数据离散程度最适合的统计量是() A.极差 B.平均差 C.标准差 D.离散系数 15、偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数() A.等于0 B.等于1 C.大于0 D. 大于1 16、如果一组数据分布的偏态系数在0.5~1或-1?-0.5之间,则表明该组数据属于() A.对称分布 B.中等偏态分布 C.高度偏态分布 D.轻微偏态分布 17、峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值是() A.等于0 B. 大于0 C. 小于0 D. 等于1 18、如果峰态系数k>0,表明该组数据是() A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计学课后习题答案第四章动态数列

第四章动态数列 一﹑单项选择题 1.下列动态数列中属于时点数列的是 A.历年在校学生数动态数列 B.历年毕业生人数动态数列 C.某厂各年工业总产值数列 D.某厂各年劳动生产率数列 2.构成动态数列的两个基本要素是 A.主词和宾词 B.变量和次数 C.分组和次数 D.现象所属的时间及其指标值 3.动态数列中各项指标数值可以相加的是 A.相对数动态数列 B.平均数动态数列 C.时期数列 D.时点数列 4.最基本的动态数列是 A.指数数列 B.相对数动态数列 C.平均数动态数列 D.绝对数动态数列 5.动态数列中,指标数值的大小与其时间长短没有直接关系的是 A.时期数列 B.时点数列 C.相对数动态数列 D.平均数动态数列 6.动态数列中,指标数值是经过连续不断登记取得的数列是 A.时期数列 B.时点数列 C.相对数动态数列 D.平均数动态数列 7.下列动态数列中属于时期数列的是 A.企业历年职工人数数列 B.企业历年劳动生产率数列 C.企业历年利税额数列 D.企业历年单位产品成本数列 8.动态数列中,各项指标数值不可以相加的是 A.相对数动态数列 B.绝对数动态数列 C.时期数列 D.时点数列 9.动态数列中,指标数值大小与其时间长短有关的是 A.相对数动态数列 B.绝对数动态数列 C.时期数列 D.时点数列 10.动态数列中,指标数值是通过一次登记取得的数列是 A.相对数动态数列 B.绝对数动态数列 C.时期数列 D.时点数列 11.编制动态数列的最基本原则是保证数列中各项指标必须具有 A.可加性 B.可比性 C.连续性 D.一致性 12.基期为某一固定时期水平的增长量是 A.累计增长量 B.逐期增长量 C.平均增长量 D.年距增长量 13.基期为前期水平的增长量是 A.累计增长量 B.逐期增长量 C.平均增长量 D.年距增长量 14.累计增长量与逐期增长量之间的关系是 A.累计增长量等于相应的各个逐期增长量之和

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案 一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。() 2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 1)表明同类统计事项指标的对比关系; (2)揭示总体内部的结构; (3)反映统计事项的发展动态; (4)分析统计事项之间的依存关系; (5)说明总体单位的分配; (6)检查计划的执行情况; (7)观察统计事项在地域上的分布。 3.简述相关的含义及种类。 答:相关就是指事物或现象之间的相互关系。

统计学第四章课后题及答案解析

第四章 一、单项选择题 1.由反映总体单位某一数量特征的标志值汇总得到的指标是() A.总体单位总量 B.质量指标 C.总体标志总量 D.相对指标 2.各部分所占比重之和等于1或100%的相对数() A.比例相对数B.比较相对数C.结构相对数D.动态相对数 3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为() A.104.76% B.95.45% C.200% D.4.76% 4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度() A.14.5% B.95% C.5% D.114.5% 5.在一个特定总体内,下列说法正确的是( ) A.只存在一个单位总量,但可以同时存在多个标志总量 B.可以存在多个单位总量,但必须只有一个标志总量 C.只能存在一个单位总量和一个标志总量 D.可以存在多个单位总量和多个标志总量 6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是() A.大量的 B.同质的 C.有差异的 D.不同总体的

7.几何平均数的计算适用于求() A.平均速度和平均比率 B.平均增长水平 C.平均发展水平 D.序时平均数 8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是() A.3 B.13 C.7.1 D.7 9.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是() A.方差 B.极差 C.标准差 D.变异系数 10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( ) A.两个总体的标准差应相等 B.两个总体的平均数应相等 C.两个总体的单位数应相等 D.两个总体的离差之和应相等 11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用() A.简单算术平均数 B.加权算术平均数 C.加权调和平均数 D.几何平均数 12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。在对称的钟形分布中() A.算术平均数=中位数=众数 B.算术平均数>中位数>众数 C.算术平均数<中位数<众数 D.中位数>算术平均数>众数 二、多项选择题 1.下列属于时点指标的有() A.某地区人口数B.某地区死亡人口数C.某地区出生人口数

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

《统计学原理》作业参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。 A、等于78% B、大于84% c、在此76%与84%之间D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定

相关主题