搜档网
当前位置:搜档网 › 我国GDP统计数据质量评估方法研究

我国GDP统计数据质量评估方法研究

我国GDP统计数据质量评估方法研究
我国GDP统计数据质量评估方法研究

我国GDP统计数据质量评估方法研究

——基于构建诊断模型的研究西南财经大学刘盾、魏子力、吕达劲

摘要:统计是认识社会的武器,政府统计关系到国民经济的方方面面。政府统计数据的质量,对于宏观调控,科学研究,企业营销策略等,都起着不可或缺的重要作用。但是,近年来,中国官方统计数据受到不少的质疑,有必要对我国统计数据质量的定量检验进行系统深入的研究。

本文首先从统计数据的研究背景和研究意义出发,介绍了统计数据质量的概念和重要性;其次采用了三种方法来进行数据质量的检验,第一种方法:探索性数据质量分析方法。该方法适用于在没有以往数据资料积累或质量记录的情况下,根据GDP的数据特征,判断数据是否存在质量问题。并通过作箱线图的形式明确指出了可能是异常值的对应数据。第二种方法:Probit模型数据质量分析方法。通过建立Probit模型对数据进行分析,并进行了预测。第三种方法:基于层次分析法的模糊综合评价方法。从研究统计数据的分布规律入手,对统计数据准确性检验问题进行了探讨,接着利用模糊综合评价方法对政府统计数据质量进行整体优度检验。

关键词:统计数据质量,探索性数据分析, Probit模型,

异常点识别,模糊综合评价

目录

一、引言 (3)

二、文献综述 (4)

(一)统计数据质量的相关研究方法 (4)

(二)各种研究方法的优缺点 (5)

(三)各种研究方法的文献综述 (7)

1.逻辑性评估方法 (7)

2.从异常值的角度对数据质量进行评估 (7)

3.从误差的角度对数据质量进行评估 (8)

4.事后预测及反常结果判断的方法 (8)

5.模糊综合评价方法 (8)

6.判别分析方法 (8)

三、本文的研究方法 (9)

(一)模型选择 (9)

(二)数据的选择与来源 (10)

四、模型构建及分析 (10)

(一)探索性数据质量分析方法 (10)

1.数据处理 (10)

2.分析步骤及分析结果 (10)

(二)Probit模型数据质量分析方法 (16)

1.Probit模型的原理 (16)

2.分析步骤及分析结果 (16)

(三)层次分析法与模糊综合评价方法 (18)

1.对政府统计数据的对数正态分布检验 (18)

2.政府统计数据的准确性检验 (21)

3.AHP-模糊综合评价方法相结合——对政府统计数据质量进行整体优度检验 (23)

五、相关结论与建议 (32)

(一)结论: (32)

(二)建议: (33)

1.对数据使用者的相关建议 (33)

2.对提供数据的相关政府部门的建议 (33)

参考文献: (35)

附录: (36)

1.Probit模型建立前的辅助计量模型自变量的选择: (36)

2、Probit模型回带期望概率 (39)

3、所用数据 (45)

一、引言

随着统计信息对我国社会主义市场经济管理作用的不断增强,社会各界对统计数据的需求越来越大,对其质量给予了更多的关注,同时提出了更高的要求。社会、政治、经济、科学技术等诸多领域都离不开政府统计数据。统计数据更是衡量一个国家、一个地区经济发展水平的晴雨表和温度计。

近年来,我国经济持续、快速增长,引起了世界的关注,而作为衡量经济发展规模和水平的政府统计数据及其质量也成为国内外相关机构及研究者关注的焦点。在众多的统计数据指标中,最为引人关注的就是国内生产总值(GDP),它被公认为是衡量一个国家经济发展水平的最佳指标。2010年,我国GDP总量超越日本,成为世界第二大经济体,世界也对中国的GDP指标给予更多的关注。

我国政府统计工作经过改革开放后30年的不断深入研讨,取得了很大的进展,统计数据的准确性、及时性都得到了很大的提高,为我国经济增长现状和前景的判断提供了切实可靠的分析基础。但与发达国家相比,我国政府的GDP 统计数据在质量上还存在一些问题。数据的真实性受到国内外一些学者和研究机构的质疑。例如2009年上半年31个省份公布的GDP数据总和为153769.4亿元,国家统计局核算全国GDP数据是139862 亿元,地方GDP之和高出全国核算数据约1.4万亿元,达9.9%。2010年第一季度,在按期公布GDP的29个省(区、市)中,除了新疆(增速为11%)外,其它28个省(区、市)一季度GDP增速均高于全国11.9%的水平,其中更有18个省(区、市)的增速竟然超过15%。此外,国际能源署(IEA) 也指出,中国政府公布2009年第一季度GDP 较上年同期增长6.1%,但这一数据与中国当季石油需求下降3.5%的情况不符,与异常疲软的电力需求也不相吻合。同时,针对2008年第四季度以来中国出现的工业增加值正增长、工业用电量负增长两者背离现象,国际能源署认为这一现象与电力消费和经济增长同向变化的一般规律显然不符,更与中国2000年以来电力消耗增长快于经济增长的经验相背离。这些矛盾现象都在说明我国GDP 数据存在着质量问题。

进一步净化统计工作环境,提高GDP数据质量,全面履行政府统计职能,

树立政府统计权威,确保统计数据能准确、及时和客观地反映社会经济事业发展的实际情况已成当务之急,也是众多统计工作者探讨的重要理论和现实课题之一。然而,提高和保证统计数据质量,不是靠几次执法大检查等临时性措施所能办到的,需要根据政府统计改革和建设发展的要求,基于正确的数据质量观念,从理论和实践上研究数据质量管理体系的建立和实施。

目前国内外学者对统计数据质量问题研究的方法上还有一定差距,尤其体现在利用各种数学方法对统计数据质量进行定量研究方面。本文从实际工作出发,根据实际应用的需要,应用了三种分析方法,吸收前人的研究成果,重点研究如何利用定量方法来对GDP数据质量进行检验的问题,并在基于层次分析法的模糊综合评价方法分析中采取了规范分析和实证分析相结合的研究方法,对其质量进行整体拟合优度检验。

二、文献综述

(一)统计数据质量的相关研究方法

1.逻辑性评估方法

逻辑性评估方法包含基于规则的逻辑性评估方法和相关性的逻辑性评估方法。基于规则的逻辑性评估方法具体包含差额平衡法、相关平衡法、同项相等法和运用生产及使用的平衡关系进行评估的方法;相关性的逻辑性评估方法主要是根据部分指标与总体指标间结构关系、指标间的比例关系以及相关指标的弹性系数等方面进行判断, 也可以运用主成分分析、回归分析等计量方法。

2.从异常值的角度对数据质量进行评估

从异常值的角度评估数据质量主要包含基于统计分布的异常值检验、时间序列的异常值分析和探索性数据分析的异常值检验。运用基于统计分布的异常值检验时,假定给定的统计数据服从一个随机分布(如Γ分布、正态分布等),并使用不一致性测试来识别异常点;在时间序列的异常值分析中,异常点是以多种形式出现的,而且只有在一个描述性模型中才能对其进行定义和识别;探索性数据分析的异常值检验可以在不破坏原始数据中其他数据前提下凸显异常数据或没有用处的数据,进而为判断数据质量提供依据。

3.从误差的角度对数据质量进行评估

统计调查有两大误差来源——抽样误差和非抽样误差。抽样误差是用样本推断总体过程中无法避免的误差,非抽样误差是抽样误差以外的误差。测定方法有两种思路:一种是尝试对估计值建立总误差模型,并且测算出非抽样误差的具体数值和它在总误差中所占比例的大小;另一种是先直接判断原始资料中是否有失真资料,然后设法找出这部分失真资料,再对其进行修正或剔除,进而消除这些误差的影响,得到一个较好的估计,保证统计数据的质量。

4.事后预测及反常结果判断的方法

事后预测是利用已通过各种检验(例如经济意义检验、统计检验和DW检验等),被证明是合理的计量经济模型,对各观测点进行事后预测,测算出各个预测值与实际值的相对误差。而某一变量的观测数据中有时出现个别相对特别小或特别大的数据,这些数据称为反常结果。反常结果判断法包含极值偏差法、方差比法和极差比法(即Dixon准则)三种基本方法。

5.层次分析法与模糊综合评价方法相结合

模糊综合评价方法是建立在层次分析法的基础上,综合考虑系统(或事物)的多种价值因素,用模糊集理论来评定其优劣的方法。对数据进行了统计质量的对数正态分布和准确性检验后,再通过建立影响统计数据质量的十个因素各自的分项评价指标,建立科学、合理的统计数据质量评价指标体系,对政府统计数据质量进行整体优度检验。

6.判别分析方法

判别分析是根据已有的历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,在此基础上建立判别函数和判别准则。在遇到新的样本点时,只需要根据总结出来的判别函数和判别准则,就能判别该样本点所属类别。

(二)各种研究方法的优缺点

1.逻辑性评估方法

规则的逻辑性评估方法不仅可用于原始调查资料,还适用于汇总数据。但这种方法只适用于有逻辑平衡关系的数据,难以对大量夹杂在原始数据中的非逻辑性平衡异常数据做出较准确的判断。相关性的逻辑性评估方法在运用时需要注意

这几个问题:相关指标间的关系并非一直稳定;与被评估指标相关联的统计数据必须可靠;同被评估指标相关联的指标往往不止一个;根据不同的关联指标进行判断的结果应该一致等。

2.从异常值的角度对数据质量进行评估

从异常值角度对数据质量进行评估,不仅要识别出异常值,还要结合异常值产生的背景判断其是否由统计数据质量问题导致。基于统计分布的异常值检验法存在两个问题, 一是数据使用者并不清楚数据的分布;二是即便已知在低维( 一维或二维) 时的数据分布,但在高维情况下估计数据点的分布也极其困难。

探索性数据分析方法具有以下突出特点:不受极端值影响,展示的数据所包含信息量大并能简单、直观的显示出极端值;而且无需过多数学计算,易于理解,易于为基层人员接受。在其应用基于时间序列的异常值检验时,前提条件是历史数据不存在系统性偏误,其主要缺点是序列异常的概念并未得到普遍认可。而且使用这种方法会遗漏不少的异常数据,诊断方法也比较复杂,所以它主要适用于科研上对统计数据质量以及结构变化的诊断。

3.从误差的角度对数据质量进行评估

从误差的角度评估统计数据质量的方法,主要适用于对原始调查数据质量的控制和检验,而且随着抽样调查技术应用在我国的发展,使用这种方法进行原始数据质量的评估,显得更加重要。但目前在如何检测和度量各种非抽样误差,尤其是各种因素导致的计量误差方面的研究还很不够,这也是当前需进一步研究的课题。

4.事后预测及反常结果判断的方法

运用该方法的关键在于需要找出描述被考核指标的有关解释变量,并建立函数关系式,以及要求有相应的统计来估计。其基本前提条件是所有数据应来自于同一总体在相同或相似的经济环境下的统计资料。

5.基于层次分析法的模糊综合评价方法

模糊综合评价方法存在多因素模糊性和主观判断等问题,但基于层次分析法的模糊综合评价方法能较好地处理这些问题。但由于最初表示指标间相对重要程度的判断矩阵是由专家主观给定,仍包含一定的主观随意性,是否充分反映了客观实际,还需很好地把握。

6.判别分析方法

判别分析方法包括Probit模型和贝叶斯逐步判别分析等,这些方法充分利用先验历史信息建立模型,不但关注极端值,还可根据以往的数据质量记录判断出很多波动不大,却确实存在数据质量问题的个案。但是,贝叶斯逐步判别分析依赖于一些严格的假设成立,例如多元正态性和协差阵相等的假设,这在很多情况下却难以达到。而Probit模型的建模过程则比较复杂,不易操作。

从各种方法的阐述和其优缺点来看,每种方法都有各自的优缺点,一起使用才能搭建起数据质量控制的大厦。比如,可以利用逐步判别分析和Probit法找出有效变量,再应用数据挖掘的方法进行数据质量判断,从而使得数据挖掘的训练时间和效果进一步提高。

(三)各种研究方法的文献综述

1.逻辑性评估方法

叶长法、岑国荣( 1998) 总结了4种基本的逻辑平衡审核评估方法:差额平衡法、相关平衡方法、同项相等的方法、运用生产和使用的平衡关系进行评估的方法;孟连、王小鲁(2000、2002)首先将全国各地区GDP汇总后,发现其并不等于全国总GDP等多项指标,指出我国经济增速的统计数据存在问题,并利用生产函数等方法估计了我国经济增长数据的可信度,指出统计数据存在失真。孔炯炯(2002)、朱优江(2002)等人研究了我国政府统计数据质量的现状,指出了主要差距。张新、陈昌华和蒋殿春(2002)使用了几种不同方法估算GDP增长率的可信度,发现1998年的增长率最为可疑,1997和1999年次之。

2.从异常值的角度对数据质量进行评估

成邦文等(2001)的研究表明,反映现象规模大小的“社会经济规模指标”如产量、产值、人员等,近似服从对数正态分布,基于此,他们提出了统计数据质量检查和异常点识别的对数正态分布检验法;成邦文等(2001)还证明了反映社会经济规模大小的多维指标也近似服从多维正态分布,并基于此提出了对这类数据质量及其异常点进行检查和识别的多维对数正态分布检验法;傅德印(2001) 以我国“开发区高新技术企业主要经济指标”数据为例, 就茎叶图法用于统计汇总数据质量控制进行了探讨;李子奈、周健( 2005) 主要采用这种方法对我国36个宏观经济时间序列的结构变化进行了全面的分析, 研究表明我国的宏观经济

统计数据中存在10%以上的异常点。

3.从误差的角度对数据质量进行评估

杨清(2000)提出应首先直接判断原始资料中是否存在失真资料,设法找出这些失真资料后, 再对其进行修正或剔除, 消除这些误差的影响, 进而得到一个较好的估计, 从而保证统计数据的质量;苗敬毅和张海珍(2001)分析了影响统计数据质量的误差来源,对系统性误差进行测量并提出纠偏思路;屈耀辉、曾五一(2004)针对农产量抽样调查中的计量误差, 以具体例子介绍了效应比较甄别法和贝叶斯估计3σ图甄别法的具体运用。

4.事后预测及反常结果判断的方法

刘孝新、朱慧明、胡先红(1997)建立模型估计未知参数,在对模型作整体检验通过后,计算观测点的事后预测值,得到预测的误差百分率;周建(2005)从计量经济学角度讨论了诊断中国宏观经济统计数据质量的理论和方法,探究了我国宏观经济统计数据的质量问题,并做出相应的评价;刘洪、黄燕(2007)采用组合模型对时间序列数据的变化特点建模,并选取我国1978—2003年间的GDP 作为样本,运用趋势模拟评估法来评估我国2004年国内生产总值的准确性。

5.模糊综合评价方法

郭江(2006)在其硕士毕业论文中采用统计数据质量的定量二级检验方法进行分析,文中首先采用正态分布与对数正态分布检验对异常点进行判断,然后采用层次分析法的模糊综合评价模型,通过构造判断矩阵、一致性检验等进行数据质量检验,该方法避免了“好”与“不好”的直接判断,但是权重方面赋值有待优化。

6.判别分析方法

翟春玲(2008)在其硕士毕业论文中应用了无指导判别技术(探索性分析)、有指导判别技术(贝叶斯逐步判别分析)、二元选择模型(Probit模型、Logit 模型)和神经网络方法对数据质量进行分析。结果表明几种方法的回判率和预测率均比较高,且神经网络方法回判率和预测率略优于Probit模型。

三、本文的研究方法

(一)模型选择

在回顾了研究统计数据质量的几种主要方法后,因为本文着重于探讨定量研究我国GDP统计数据质量,故没有采用“逻辑性评估方法”;而“从误差的角度”研究数据质量,尚未从理论上较好的解决各种非抽样误差,而我国GDP数据中可能存在大量的非抽样误差,故此法也不适宜采用。经过筛选后,本文拟采用“探索性数据质量分析方法”、“Probit模型数据质量分析方法”、“层次分析法与模糊综合评价方法”这三种方法对我国的GDP数据质量进行研究。以下简介本文所用方法及采用理由。

1.探索性数据分析是对初步调查、观察所得到的原始数据,在较少的先验假定下进行处理,通过制表、作图等形式和方程拟合、计算某些特征量等手段,探索数据的规律、结构的一种数据分析方法。

探索性数据分析的最大特点是不强调对数据的整理,而是在分析思路上让数据说话。而传统统计方法是先假定一个模型,例如数据服从某个分布(例如正态分布),再使用适合此模型的方法进行拟合、分析及预测。

但我国GDP数据本身存在一些疑点,可能无法保证满足假定的理论分布。采用传统的统计方法研究可能会受到很大的局限。因此本文首先从我国GDP原始统计数据出发,采用探索性分析方法。

2.Probit模型是一种传统的线性模型,假设事件发生的概率服从累积正态分布函数的二元选择。该模型要求数据服从正态分布。本文采用该模型,主要是希望与探索性数据分析的结果进行对比。这两种方法对数据正态分布方面要求迥异,其判别结果的比较也将是本文探讨内容之一。

3.模糊综合评价法是建立于模糊数学基础上的综合评价方法。根据模糊数学的隶属度理论,把定性评价转化为定量评价,对受到多种因素制约的事物或对象做出一个总体的评价。它的突出优点是结果清晰,系统性强,较好地解决了将各种模糊的、非确定性问题进行了量化处理。本文将层次分析法与模糊综合评价方法相结合,建立政府统计数据质量评价模型。结合采用层次分析法,可使模糊综合评价更加科学、公正、客观。

(二)数据的选择与来源

基于我们对国家GDP 数据质量的思考,我国的GDP 数据究竟是否合理,不同学者得出的GDP 不合理结论究竟是由于数据本身的问题还是研究方法的缺陷等疑问,本文拟选用全国各省份(30个省份)2000-2008年数据,对各省数据进行质量检验。数据来源于中国统计年鉴(2001-2009)。

四、模型构建及分析

(一)探索性数据质量分析方法

1.数据处理

本文以30个省市自治区(除西藏)数据为样本,检验各省GDP 数据质量。具体选择的指标包括:各省GDP (Y )、货物周转量(1X )、能源消耗(2X )、税收(3X )和社会消费品零售总额(4X )。在判断各省GDP 数据质量前,由于各省GDP 总额的不同,需要对数据进行变换,具体变换的方法是:

Y *

1

Y X =, Y **2Y X =, Y ***3Y X =, Y **** 4

Y X =

经过变换后的Y *,Y ** ,Y ***和Y **** 应近似服从正态分布。

2.分析步骤及分析结果

我们首先应用SPSS 软件,对处理后的2000-2008年的数据进行质量诊断,分别作箱线图分析,找出各省的极端值及相应的年份。具体分析结果如下:

我们假定C ,P ,R ,T 分别是GDP 与货物周转量、耗电量、社会消费品零售额、税收之间的比值。我们以“省市——province ”为分组变量对这四个比值进行探索性分析来检验其中的异常值。

我们采用箱线图的方式来清楚显示出与整体数据差别较大的异常值。在一个标准的箱线图中,其中心是一个矩形盒,它两端的位置分别对应数据的上下四分位数(Q1和Q3)。在矩形盒内部,中位数(Xm )位置画一条线段称为中位线。在Q3+1.5IQR (四分位距)和Q1-1.5IQR 处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;在F +3IQR

和F-3IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值,在外限以外的为极端的异常值。

在下面几张箱线图中,用“〇”标出的是温和的异常值,用“*”标出的是极端的异常值。

图1 各省市2000年至2008年GDP与货物周转量的比值箱线图从图1中的编号可以看出,2008安徽,2006湖北,2000湖北,2008上海,2004天津,这几个比值是用“〇”标出的,与整体差异较大;2008河北,2007湖北,2004上海,这几个比值是用“*”标出的,与整体差异极为突出。故暂认定差异极为突出的数值为异常值。

因此,根据GDP与货物周转量的比值C,我们能够得出2008河北,2007湖北,2004上海的GDP在核算中可能出现了偏差,即与其它省市相比较来说,属于异常值。

图2 各省市2000年至2008年GDP与耗电量的比值箱线图从图2中编号可以看出:2000安徽,2003安徽,2007安徽,2008江苏,2008江西,2008内蒙古,2008辽宁,2000青海,2008青海,2008浙江,2000重庆,2008重庆,这几个比值是用“〇”标出,与整体差异较大;2008安徽,2008

黑龙江,2008湖北,2008湖南,2008宁夏,2008四川,这几个比值是用“*”标出的,与整体差异极为突出。故暂认定差异极为突出的数值为异常值。

因此,根据GDP与耗电量的比值P,我们能够得出2008安徽,2008黑龙江,2008湖北,2008湖南,2008宁夏,2008四川的GDP 在核算中可能出现了偏差。这些数据与其它省市进行对比,属于异常值。

图3 各省市2000年至2008年GDP与社会消费品零售额的比值箱线图从图中编号可以看出:2003福建,2008江苏,2004四川,2006四川,2004重庆,这几个比值是用“〇”标出,与整体差异较大;2003江苏,2004江苏,2004山西,2005四川,这几个比值是用“*”标出的,与整体差异极为突出。故暂认定差异极为突出的数值为异常值。

因此,根据GDP与社会消费品零售额的比值R,我们能够发现2003江苏,2004江苏,2004山西,2005四川在GDP核算中出现了偏差。这些数据在与其它省市做比较时,属于异常值。

图4 各省市2000年至2008年GDP与税收的比值箱线图从图中编号可以看出:2006安徽,2007贵州,2006河南,2007河南,2007黑龙江,2008黑龙江,2007吉林,2000辽宁,2007内蒙古,2008山东,2005四川,2000浙江,2000重庆,这几个比值是用“〇”标出的,与整体差异较大;2007甘肃,2008甘肃,2007广西,2008广西,2008河南,2004青海,2000四川,2006四川,这几个比值是用“*”标出的,与整体差异极为突出。故暂认定差异极为突出的数值为异常值。

通过GDP与税收的比值T,我们能够发现2007甘肃,2008甘肃,2007广西,2008广西,2008河南,2004青海,2000四川,2006四川在GDP核算中存在着误差,我们也就认定这些与整体数据相背离的数据为异常值。

表1 2000年至2008年各省市GDP数据诊断结果

通过上述判定方法我们将所有数值分为正常值和异常值两类,从表1中可知在被研究的270个数据中被归为正常值的有249个,占整体数据百分比的92.2%,

被归为异常值的有21个,占整体数据百分比的7.8%。

表2 2000年至2008年各年份GDP异常值数量

从各年异常值数据看来:2008年有十一个省份数据出现异常状况,2004年有三个省份数据出现异常状况,2006年、2007年有二个省份数据出现异常状况,2000年、2003年、2005年有一个省份数据出现异常状况。

表3 2000年至2008年GDP异常值数量按省份分类

从各省份异常值数据看来:甘肃、广西、湖北、江苏、山西、四川等省份从2000年到2008年之间出现过两次异常值,而安徽、河北、河南、黑龙江、湖南、宁夏、青海、上海、天津等省份从2000年到2008年之间出现过一次异常值,其余省份在此期间未出现异常值。

(二)Probit 模型数据质量分析方法

1.Probit 模型的原理 Probit 模型如下:

i P E =(i Y 1=|1i X ,2i X ,...,mi X )=F (0β+ 11X β+,...,+m mi X β)

P i 为数据异常发生的概率,Y i 为一个二分变量,表示第i 个事件是否发生,X i 为影响因素,E(X)为数学期望,F(X)为累计概率分布函数。

2.分析步骤及分析结果 (1)建立模型

本文以Y 代表GDP,1X 、2X 、3X 和4X 分别代表货物周转量、税收、能源消费品零售额。采用各省市2000-2008年的Y 、1X 、2X 、3X 和4X 的数据,利用Eviews 分析软件进行参数估计,为了避免多重多线性的影响,本文采用逐步回归方法选择解释变量,最终建立起的2000-2008各年回归模型为:

2000年: 23

Y 3.0934********X 1.71498344436*X 202.751806489=+- ;2001年:23Y 3.25596887881*X 1.65602026693*X 206.326213205=+-; 2002年:23Y 3.08677093873*X 1.67084585716*X 179.906835807=+-; 2003年: 23Y 2.84660368587*X 1.77933171502*X 101.075787029=+-; 2004年: 23Y 3.60915760113*X 1.81086751845*X 322.994434232=+-; 2005年: 23Y 2.58844491475*X 2.0933********X 288.360170364=+-;

2006年:23

Y 2.51691546461*X 2.17269783493*X 365.163363366=+-; 2007年:23Y 2.34079429933*X 2.29159212532*X 379.002300077=+-;

2008年:23

Y 2.88536548596*X 2.12399454662*X 340.680017168=+-。 将2000-2008年的数据分别代入上述方程中,求出各自的Y 值,并通过各个地区的Y 值反算其对应的标准正态累积概率值,若概率值大于或等于0.5,即被判入第一类即表示该地区统计数据存在质量问题的类,记为1;否则被判入第二类即表示该地区统计数据不存在质量问题的类,记为0,由此得到2000-2008年各省GDP 数据质量问题的分类。

(2)预测

各省GDP 数据质量问题分类后,代入Probit 模型进行回判,数据质量分类结果如表4:

表4 Parameter Estimates

我们运用probit 模型,将预先已经分过类的数据代入到模型中去,采取税收与能源作为协助变量,得到的结果如上表所示,效果能够说明一定的问题,较为理想,虽然影响GDP 总量的因素较为复杂多变,但是税收和能源能够解释其中的较大一部分,p 值也较为可观,说明模型较好。

表5 Chi-Square Tests

上表是对该模型的检验结果,其中卡方的数值较大,远远大于临界值,而且p值很小,这些都从一个侧面说明了模型的效果较为理想,这为我们下一步运用模型进行检验奠定了基础。我们将运用模型来验证其准确性。

我们将数据回带到建成的probit模型中,利用每个数据得出的期望概率与之前假设的概率0.5进行对比(回带得出的期望概率见附录),发现结果有16个数据可能为异常值,占所有被调查数据的5.926%,分别是:2008广东、2008河南、2008山东、2008浙江、2008江苏、2007广东、2007广东、2007浙江、2007江苏、2006广东、2006山东、2006江苏、2005广东、2005山东、2005江苏、2004广东。

(三)层次分析法与模糊综合评价方法

1.对政府统计数据的对数正态分布检验

对于识别统计数据中的异常点,因为数据本身并不符合一些特殊的数学分布如多维正态等,因而对异常值的检验带来了较大困难。在所有社会经济统计指标中,一些反映总体规模大小的指标却近似服从对数正态分布。由此,利用对数正态检验法就能够对统计数据质量进行检查。对数正态分布检验法的突出特点是利用数据在分布上的规律性,对数据的准确性和可靠性给出评价。它具有较好的甄别作用,虚假的统计数据难以通过检验,而且未通过检验的统计数据也难以通过对虚假数据的修改而使之通过。此外,该方法在使用上简易、方便,可直接采用于一些常用的统计软件。

本文在对政府统计数据进行数据统计质量的对数正态分布和准确性检验之后,将试图综合考虑影响统计数据质量的十个被普遍关注的因素,对政府统计数据质量进行整体拟合优度检验。

下面首先对政府统计数据进行对数正态分布检验。

社会经济指标是对社会经济进行描述、考核的指标,是反映社会经济系统各种状态的特征量,它的内容包括国内生产总值、国民总收入、财政收支、价格指数、城乡居民家庭收支等,在此它们均被称为“总量指标”。下面我们需要做的是用对数正态分布来描述系统规模大小的指标x(w),也就是说lnx(w)近似服从正态分布。GDP不但可反映一个国家的经济表现,更可以反映一国的国力与财富。所以,接下来我们以2008年全国30个省市的GDP指标值在各个地区的分布为例来说明社会经济总量指标近似服从对数正态分布的规律。

由中国统计年鉴资料可知,2008年,在所选择的全国30个省市的GDP值最高为广东省35696.46亿元,最低为青海省961.53亿元,对各省市的GDP指标值x取自然对数lnx,则lnx在6.87–10.48的范围内变化。表6表示的是国内生产总值(GDP)的对数形式lnx在各省市中分布频率表,这些数据反映了各省市GDP 的规模结构。如果以表6的lnx为横坐标,把对应的地区数(或比例)作为纵坐标,可得到图5。

表6 GDP的对数形式在各地区中分布频率表

图5 GDP的对数形式在各省市的分布

从上面的表6和图5可以看出,这种分布结构具有以下特征:

(1)GDP值大部分地区是处在中间状态,GDP值比较大或比较小的地区只是占少数部分,所以它呈现出的是中间大两头小的状态,从统计角度来讲,是正常的。

(2)此类图形会相对于某一lnx0完全对称,就此例而言,lnx的均值为8.96972,设x0使得lnx0=8.96972,则相应的x0=7861.40亿千元。此时,lnx0称为lnx的均值,记为μ。

(3)设该例的标准差并记为σ,它和均值一起共同决定它所对应曲线的形状,在此例中,计算可知σ=0.7952。

(4)根据数理统计知识可知,σ的实际意义是:有50%的省市,其GDP值x的lnx值处于μ±0.67σ的范围内;有68.3%的省市,其GDP值x的lnx值在μ±σ的范围内;有95.4%的省市,其GDP值x的lnx值在μ±2σ内。对于本例,以μ和σ的实际值代入计算,可以发现,虽然30个省市的GDP值在961.53-35696.46亿元,即lnx在6.87–10.48范围内,但有17个地区,其lnx在8.44-9.50,即x在4614.40–13393.22亿元范围内;有20个地区,其lnx在8.17–9.76,即x在3549.35–17412.09元范围内;有29个地区,其lnx在7.38–10.56,即x在1602.50–38565.76亿元范围内。

客户数据质量评价的原则与方法

客户数据质量评价的原则与方法 admin 2013-10-12 关于客户数据质量的困惑 “什么样的客户数据质量是比较好的?”“为什么我们的客户数据看起来很不错,可是在进行电话营销时,客户接触率和营销效果确差强人意,与期望大相径庭?”在进行数据库营销的讨论和交流中,经常有人问到这样的问题。 这些问题反映出了很多在从事数据库营销或直复营销过程中的营销策划人员和运营管理人员经常面临的问题和困惑。 几乎所有的组织都需要数据,一些行业严重依赖于客户数据,如银行、电信、保险公司等。毫无疑问,较差的数据质量给企业营销带来的损失非常巨大!试想一下,如果你的呼叫中心正在试图向非目标客户进行大规模电话营销活动,或是你的企业正向那些早已过期的邮寄地址寄出了数以万计的促销宣传资料。这些给公司带来的损失有多少?不幸的是,这样的情况几乎经常发生,而企业的数据库营销策划人员也经常面临着数据选择和评价的挑战。 理解关于质量的涵义 首先,让我们简单探讨一下“质量”的涵义。

在服务营销和服务管理中,通常将“质量”定义为:“满足不同客户的个性化需求的能力”。这样的定义有着一定的主观特征,也就是说不同的企业会根据其对客户需求和竞争环境的理解,来定义其产品与服务的质量特征。这可以用来解释为什么对于不同等级的客户提供的服务质量标准有所差异的原因,这也是为什么同样是提供点对点的航空运输服务,某些航空公司的服务质量和客户体验要好于其他一些竞争者的原因。 国际标准组织将质量定义为:“产品或服务所具备的满足明确或隐含需求能力的特征和特性的总和”。这样的定义虽然更明确,但对于大多数的人来说,过于专业和抽象。 一个比较通俗且受到多数人认可的对质量的直观定义是“适合使用需求”。这也是我们本文的一个主旨,没有质量绝对完美的数据,对于数据质量的评价也是要根据数据的使用需求来进行评价的。只要能够适合使用的需求,我们就认为数据的质量是符合要求的。企业也应当本着有取有舍的原则,选择那些为企业所能利用的数据。 了解了质量的定义,接下来就可以进入客户数据质量的评价话题了。 数据质量评价的基本原则

医院统计数据质量考核制度

医院统计数据质量考核制度 第一条:为加强我院统计工作及数据质量管理,保障统计数据的真实性和准确性,按照《中华人民共和国统计法》、《四川省统计管理条例》、《统计执法检查规定》和《统计违法违纪行为处分规定》等的要求,特制定本制度。 第二条:数据统计必须按照卫生统计调查制度、调查方案和统计标准的要求,真实、准确、完整、及时地报送统计资料。 第三条:统计数据质量实行分级负责、分级管理。信息科统计室对统计数据质量统一管理,负责各部门统计数据质量的监督、检查和评估等工作;各科室指定专人对本科室统计数据质量进行管理,负责本科室统计数据质量的监督、检查和评估工作。 第四条:统计数据质量考核期间,统计员要充分发挥工作职责,执行统计法规和统计制度,各部门积极配合,综合协调和处理与统计相关的问题。 第五条:各科室数据核查落实到责任人,从统计数据的填报、汇总、整理的每个阶段,分项分解按期完成相关工作,各科室每次上报的统计数据报表都要由科室负责人审核签字以示负责。 第六条:结合各部门统计工作考核管理办法,信息科统计员对各科室所提供数据进行初步核对,按照一定比例科学合理进行抽查,将所要核对的数据查验完毕后汇总形成报表备案。 第七条:各统计员要建立健全统计台帐和原始记录,使数据来源取之有据,保障资料完整可靠,并定期对各类报表整理排序,便于查询、对比,做到统计工作规范化。

第八条:各统计员或负责人应认真研究报表制度、以及统计指标的各种变化和要求,注意经验总结,及时向各专业科室反馈意见。 第九条:对统计数据出现错误、瞒报、拒报、伪造篡改统计资料的,在查清事实、分清责任的基础上,对责任人扣发当月适当绩效奖金,同时科室负责人承担连带责任。情节严重、造成重大后果或不良影响的,依据医院相关处理办法进行处理。

银行监管统计数据质量管理良好标准试行银监发

银行监管统计数据质量管理良好标准试行银监 发 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

附件一: 银行监管统计数据质量管理良好标准 (试行) 本标准适用范围为根据《银行业监管统计管理暂行办法》(2004年第6号主席令)开展监管统计工作的全部银行业金融机构(下文简称“银行”)。标准的总体框架包含5方面要素,分别为:组织机构及人员,制度建设,系统保障和数据标准,数据质量的监控、检查与评价,数据的报送、应用和存储。5方面要素下共有15项原则,每项原则下有若干具体标准,共61条标准。 (一)组织机构及人员 原则1 组织领导 银行董事会和高级管理层高度重视并积极推动本行数据质量管理和监管统计工作,明确政策和目标,建立机制和流程,落实各环节责任。 具体标准: 银行董事会制定明确的政策,将本行数据质量管理纳入内控合规体系和战略规划之中,并定期对其有效性和执行情况进行评估。

银行高级管理层确立数据质量管理的目标,建立机制和流程,明确职权和责任,定期对本行数据质量管理水平进行评估,并有效落实数据质量问责制。 银行法定代表人或主要负责人对本行监管统计数据的真实性负责,亲自或委派领导班子成员(以下简称“主管领导”)组织领导监管统计工作,对制度性变革等重大监管统计事项能够及时研究部署,在资源调配方面予以充分支持和保障。 原则2 归口管理 银行对监管统计工作实行统一管理、分级负责的管理体制,确定归口管理部门组织管理本机构的监管统计工作。 具体标准: 银行总行确定监管统计归口管理部门,授权其负责全行监管统计领导、组织、协调和管理工作。 总行归口管理部门根据授权负责制定全行监管统计工作制度和流程,提出监管统计数据质量管理措施,协调和督促其他相关业务部门,共同做好监管统计工作,定期检查并发现监管统计数据质量存在的问题,提出合理化建议,向主管领导报告。 银行各级分支机构确定相应的归口管理部门,负责本级机构监管统计工作,在总行归口管理部门统一领导下,有效履行监管统计相关职责。 原则3 岗位设置

如何提高统计调查数据的质量

如何提高统计调查数据的质量 摘要:本文通过对国际上统计数据质量的研究现状进行汇总分析,结合我国的实际情况,对我国统计工作提出建议。 关键词:统计数据质量 Abstract: This article is going to put forward some suggestions for China’s statistical work through analyzing the studies on quality of statistical data. Key words: statistical data quality. 统计数据的质量是一个国家统计机构的“生命”。数据质量的好坏,不仅影响 到一个国家统计机构的形象,而且对以此数据为决策依据的后果起着至关重要的 作用。随着经济全球化进程的加快,特别是随着信息化网络技术的逐步普及,社 会各界对统计信息的需求越来越广泛,一方面对统计数据质量提出更高的要求, 赋予其更广泛的内涵,另一方面一些辅助技术的发展也为提高统计信息的质量提 供了所需的条件和技术设备。近20年来,国际统计界一直就如何提高统计数据 质量的问题开展深入的讨论与研究。关于统计数据质量问题的研究呈现了两个新 的趋势:一是数据质量的概念从狭义向广义方向发展,提出了多维的、全方位的 数据质量概念;二是建立一套全面的、系统的统计数据质量评价和管理体系,以 提高统计数据的质量。下面将全面系统地阐述统计数据质量的概念和衡量标准, 介绍国外数据质量评价和管理的方法和经验,并在此基础上,提出加强我国统计 数据质量管理的建议。 一.统计数据质量的涵义 由于统计是对某一事物现象总体的估算而不是精算,这种估算的准确性如 何,成为有关人士长期关注的焦点。在人们的一般观念中,准确性是统计数据质 量的同义词,统计误差越小,数据质量就越高。在20世纪80年代以前,国际 统计界基本上是以提高数据准确性为出发点,从数理统计和抽样技术角度,大量 研究如何缩小统计误差、提高数据质量。在这一时期,数理统计和抽样技术理论 方法得到较大的发展,并在统计实际工作中被广泛应用。然而,随着人们质量观 念的变化,质量不仅仅单纯是指产品或服务的使用性能,还包括产品或服务对用

软件质量评估办法

软件系统质量 记分办法,可以按照月,季或者年进行记分合计,每分对应相应的价格进行奖惩。 上线前 ;95%需求覆盖率,至少 ;5%问题遗留率,最高 BUG严重;10%比率,最高 试运行过程 内(一般以软件交付给用户后的三个月内为初期故障期)指软件在初期故障期初期故障率: 可以用它来评价交付使用的软件质小时的故障数为单位。100一般以每单位时间的故障数。 量与预测什么时候软件可靠性基本稳定。检查项目初期故障率的大小取决于软件设计水平、 数、软件规模、软件调试彻底与否等因素 偶然故障率:指软件在偶然故障期(一般以软件交付给用户后的四个月以后为偶然故障期) 小时的故障数为单位,它反映了软件处于稳定状态下1000内单位时间的故障数。一般以每 的质量 运维过程 )MTBF平均失效间隔时间(

通MTBF指软件在相继两次失效之间正常工作的平均统计时间。在实际使用时, 次失效之间的平均统计时间。n+1次失效与第n很大时,系统第n常是指当 小时左右。1000大体在MTBF国外一般民用软件的则对于可靠性要求高的软件, 小时之间。1000~10000要求在 分;10小时,记1000考核办法:小于 分;20小时,记500小于 分;30小时,记200小于 分并记严重缺陷。50小时,记100小于 易用性指标 分;极差10易用性可通过多方评审来确定,分优秀、良好、一般、较差、极差;较差,记 分并需进行整改。20记 性能质量 吞吐率 。软件必须具有处理海量数据的能单位时间软件的信息处理能力(即各种目标的处理批数) 力。吞吐率就是体现该能力的参数。随着信息的泛滥,要求软件的吞吐率应该达到数百批 最大并发用户数 也可由用户指定,需要通过测试确定,系统在用户使

关于统计数据质量问题的探讨

关于统计数据质量问题的探讨 发表时间:2010-11-23T10:48:48.213Z 来源:《中小企业管理与科技》2010年7月下旬刊供稿作者:高梅英 [导读] 统计数据的质量主要指统计数据的准确性。统计数据质量的优与劣,关系到科学决策和科学管理的成与败 高梅英 (哈尔滨东安发动机(集团)有限公司) 摘要:统计数据的质量主要指统计数据的准确性。统计数据质量的优与劣,关系到科学决策和科学管理的成与败。针对目前有些统计数据质量不可靠的现象,本文就作者的理解对该现象产生的原因进行了简要的分析,并提出了提高统计数据质量的措施。 关键词:统计数据质量准确性 1 绪论 随着社会的经济高速发展,社会对经济的关注度不断提升,统计数据所反映的社会热点及经济发展的有效程度,对人们对统计数据的质量越发开始关注,今就统计数据质量问题进行探讨。 统计数据质量的含义 统计数据的质量主要是指统计数据的准确性。准确可靠的统计数据,是进行科学决策和科学管理的重要依据;但是,有些统计指标有其自身的特殊性,需要丰富的经验及大量的数据进行估计判断,因此,在这种指标面前,估计判断的误差是衡量指标准确性的有效方式。统计数据质量包括统计数据的准确性、时效性、有效性、客观性几方面。我国历史上就有“五八”年大干生产,数据“浮夸”的现象,给国家带来巨大的历史性灾难。由此可见,提高统计数据质量是有其重要意义的。 2 我国统计数据质量现状及存在问题 建国以来,我国在统计制度方面不断完善,在统计标准、指标体系、调查方法、数据报送与处理方式等方面不断进行改革,满足社会经济对统计信息的需求,带动了统计事业的持续发展。但是,我国部分地区、部门和企业片面追求“形象工程”的现象仍然存在,这些都违背了统计工作的基本原则,使得统计数据的真实性受到质疑,严重阻碍了统计工作的健康发展,影响了统计数据对社会经济的正确导向,影响了国家正确地了解地方情况及制定相关政策。目前,我国统计数据质量方面存在的主要问题有: 2.1 法制观念不强。建国以来,国务院先后颁布了《统计工作试行条例》和《中华人民共和国统计法》,但由于落实不利,执法不严等客观因素导致,一些地方或单位或个人为了局部利益,虚报、篡改、伪造统计数据,为国家制定政策、企业制定规划、个人事业发展都带来了不利影响。虚假的统计数据严重的践踏了统计工作的严肃性,同时也反映出了法制观念不强,影响了统计数据质量。 2.2 基础工作不规范。普遍存在对统计工作不重视,使得从事统计工作的人员对本职工作也存在心理阴影,导致基础工作不扎实。统计工作和统计的主要区别在于,统计的职责主要是记录数据,而统计工作则不仅是记录数据,还存在数据之间的相互关联性的管理上。相关性不仅表现在数据记录的时间、地点、类型和名称等原始属性上,还会在数据的转移过程中产生再生的相关性。因此,统计工作仅就原始的记录等工作,显然已经不能满足统计工作的需要,统计数据的分析整理才是统计工作的灵魂。 2.3 指标概念存在差异。相同的统计指标名称由于所处的统计时期或是统计报表的不同而不同,为此,大大降低了统计工作的效率,给统计人员造成了一定的困扰;这对指标的准确填报带来了一定难题,因此导致数据的可靠性差,指标所反映的当前经济现象的真实性则难以确定。 2.4 数据质量监管缺失。基层的数据质量监控主要还是人为管理,数据间的逻辑关系往往在不经意间被忽视。小单位可能就是2个人就实施完了制作和审核多个步骤;多数单位都在数据的准备阶段、数据录入阶段,缺乏数据审核阶段的有效监管;还有一些单位在做重要统计指标时采取自己审核加互相审核的方法。缺少科学的统计数据质量评估和监管,造成统计数据质量不同层次脱离实际的偏差,给最终决策带来极大不便。 2.5 从业人员素质不高。基层统计从业人员不稳定,存在专兼职共存的状态,缺乏有效的业务培训,业务素质低,统计指标的理解不到位,统计方法不一致,责任心不强,都影响了统计数据的质量。 3 统计数据质量问题的对策和建议 为适应社会经济的快速发展,实现统计数据质量的不断提升,国家统计局一直在不断探索、努力,奋力提高国家统计的数据质量和公信力。抓住影响统计数据质量的关键,采取有效措施,最大限度地保证数据质量。 3.1 加强统计制度宣传和学习力度。大力宣传学习《统计法》,他为统计事业持续稳定发展提供了根本保障,是现代信息技术为统计工作提供了强有力的技术支撑。就如国家统计局党组书记、局长马建堂在干部任职培训班上指出的“进一步增强统计法治意识,认真学习领会《统计法》,高度敬畏《统计法》,模范遵守《统计法》,严格执行《统计法》”。使得统计人员真正了解《统计法》的内容及原则,以便可以更好的去有法可依,按法办事。 3.2 加强统计基础工作。首先要端正统计人员自身态度,认真开展本职工作;其次,理解统计报表中各指标间的逻辑关系,设计报表的原始意义及统计指标的涵义、范围、计算口径等;再次,做好原始记录。原始记录是业务核算、统计核算的基础,只有这样才能使核算结果相互衔接,口径一致,从而保证核算数字的准确性,要求核算的数字来源,都有真实的原始记录为依据。只有这样,数字的准确性才有确切的保证。 3.3 加强统计指标的解释指导工作。随着社会经济的不断发展,许多统计指标的原始范围、口径发生了根本性的变化,这就需要统计主管部门及时更新统计指标的涵义,做好指标的解释指导工作;以便基层的统计人员工作时,能明确指标涵义,确保统计数据质量。 3.4 加强统计数据质量的监管。定期或不定期开展统计数据质量检查,不一定检查都要进行强有力的处罚,主要是从发现问题、解决问题的角度出发,不断完善统计数据质量的检查和监管。对于,多次只错仍犯错的单位或部门,进行必要的处罚,以警示监管的力度和决心。 研究应用新的统计技术软件,提高统计数据质量。计算机技术软件不仅清晰明了的反映统计指标的种类,实现数据的高速计算、存储、传输等功效,降低统计数据在人为计算、存储、传输等环节上的技术性误差和逻辑性差错,还能从机制上形成强有力的统计质量管理体系,维护统计数据管理相对独立性,有效地遏止不法事件发生的机会。 此外,可以建立考评机制,对统计数据质量不到位单位,进行专项的检查机制,责成进行学习或再教育,以加强统计数据的质量。

数据质量管理

数据质量管理 定义: 是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。 目录 1数据质量管理 2数据质量管理评估维度 3分析影响数据质量的因素 4MTC-DQM 数据质量管理的方法与步骤 一数据质量管理 数据质量管理是循环管理过程,其终极目标是通过可靠的数据提升数据在使用中的价值,并最终为企业赢得经济效益。 二数据质量管理评估维度 由于数据清洗(DataCleaning)工具通常简单地被称为数据质量(Data Quality)工具,因此很多人认为数据质量管理,就是修改数据中的错误、是对错误数据和垃圾数据进行清理。 这个理解是片面的,其实数据清洗只是数据质量管理中的一步。数据质量管理(DQM),不仅包含了对数据质量的改善,同时还包含了对组织的改善。针对数据的改善和管理,主要包括数据分析、数据评估、数据清洗、数据监控、错误预警等内容;针对组织的改善和管理,主要包括确立组织数据质量改进目标、评估组织流程、制定组织流程改善计划、制定组织监督审核机制、实施改进、评估改善效果等多个环节。 任何改善都是建立在评估的基础上,知道问题在哪才能实施改进。通常数据质量评估和管理评估需通过以下几个维度衡量。

1 数据质量评估维度 完整性Completeness:完整性用于度量哪些数据丢失了或者哪些数据不可用。 规范性Conformity:规范性用于度量哪些数据未按统一格式存储。 一致性Consistency:一致性用于度量哪些数据的值在信息含义上是冲突的。 准确性Accuracy:准确性用于度量哪些数据和信息是不正确的,或者数据是超期的。 唯一性Uniqueness:唯一性用于度量哪些数据是重复数据或者数据的哪些属性是重复的。 关联性Integration:关联性用于度量哪些关联的数据缺失或者未建立索引。 2 管理质量评估维度 配置管理Config Management:此维度用于度量数据在其生命周期内的一切资源是否得到了控制和规范,即数据的计划、产生、变更直至消亡的过程中,与数据相关的计划、规范、描述是否收到控制。评估指标包括:评估配置项的细化粒度、评估基线准确度和频度以及变更流程是否合理完善等。 培训 Training:此维度用于度量数据的生产和使用者在数据生命周期内的一切活动中是否经过了知识和技能的培训、培训效果是否满足岗位需要;受训的知识和技能是否经过审核和确认,受训的内容是否与企业文化和价值观一致;培训流程是否合理完善等; 验证和确认Verify & Validation:此维度用于度量数据在其生命周期内是否得到验证和确认。评估内容包括是否通过验证流程确保工作产品(数据)满足指定的要求、是否通过“确认”流程保证工作产品(数据)在计划的环境中满足使用的要求;“验证”和“确认”的流程是否完善; 监督和监控Monitoring:此维度用于度量产生和使用数据的流程在数据的整个生命周期内是否真正受控。脱离监控的信息、技术、计划、流程、制度,会导致数据质量低下。监督和监控的流程是否完善。 三分析影响数据质量的因素 影响数据质量的因素主要来源于四方面:信息因素、技术因素、流程因素和管理因素

浅析统计数据质量控制问题

浅析统计数据质量控制问题 统计数据质量控制统计 统计数据质量是对整个统计工作最为公正的评价,是统计工作核心的内容。保证统计数据的质量,确保统计数据的有效、准确,能够更好地满足政府和社会公众多方的需求。综合来看,我国统计数据质量问题表现为……,需要有效的控制措施加以解决。 一、当前的统计数据质量主要问题表现 (一)质量控制规范缺位 由于质量控制的规范缺位,导致统计机构与用户及社会之间很难实现有效沟通,很多数据用户和社会各界对于统计工作的复杂性和不可避免的统计误差没有认识,关于统计对数据的质量采取的控制方法、控制的程度以及控制结果缺乏了解。因此,即使我国的统计一直非常重视统计数据的质量,也为此做了大量工作,但是统计数据的用户和社会各界对统计数据的质量仍然非常不满。 (二)统计数据质量控制工作片面化 统计数据的全过程控制取得较大成功的经验和措施往往集中在几个项目领域,应用范围狭窄。多数统计数据质量缺少全程控制,很多环节出现疏漏。对调查环节的质量控制要求较高,但是在设计环节对数据需求考虑较少,数据的相关性得不到控制。而在人员方面,对于统计系统内部人员控制比较到位,但是对于统计系统以外的,占统计工作人员的基层人员却缺少控制。 (三)统计数据的质量控制系统不完善 统计数据的质量控制技术在统计工作和研究实践中应用并不广泛,而经常性的数据质量控制在实际的操作中也偏于事后分析评估,事前工作做得不到位,分类预防控制措施不足,对误差模型的应用也很少。统计调查制度上对于事先控制措施,比如将填表要求中的逻辑审核关系、平衡关系应用于质量设计等内容比较少,而在统计数据的质量评估工作中,对于将评估的结果或者结论应用在下一次调查方案的设计和改进方面,也没有充分的体现,事后的质量控制技术和数据的质量控制组织活动不能实现较好的结合。数据质量控制评估方法虽然已经制定,但是缺少具体的支持措施,比如部门职责划分不明确,职权、义务不清晰,数据质量控制评估方法的具体应用不规范等。

教学质量评价方法

教学质量考核评价办法 第一章总则 第一条教学质量工作是我院教学的中心工作。为了进一步深化教学改革,提高系(部)教学质量,建立科学、规范的教学质量评价体系,调动各系(部)教学管理的积极性与主动性,全面提高学院的教育教学水平,特制定本办法。 第二章指导思想与原则 第二条系(部)教学质量的考核评价以《大同煤炭职业技术学院教学质量监控与保障制度》为依据。遵循教育规律,结合学院实际,坚持以评促建、以评促改、重在建设的指导思想,充分调动各系(部)教学工作的积极性、主动性和创新性,促进教学工作健康、有序地进行,切实提高系(部)教学管理的质量与水平。 第三条系(部)教学质量的考核评价坚持客观、公正、公平的原则,实行条件、过程、效果相结合;定性考核与定量考核相结合;科学性与导向性相结合的方法,合理利用必要的行政和经济手段,引入竞争和激励机制,逐步推进系(部)教学管理的规范化,制度化和科学化,以适应新世纪对高等教育的发展要求。 第三章组织领导

第四条学院专门成立系(部)教学质量考核评价领导小组,组长由主管教学副院长担任,教务处处长为副组长,其他成员为教务处副处长、教务督导组专家及教务处干事等。 第五条教学质量考核评价办公室设在教务处,负责考核资料的收集、整理和汇总等日常工作。 第四章考核评价程序 第六条系(部)教学质量的考核评价工作每月进行一次(与学院考核办考核相结合),结果报考核办汇总。 第七条考核工作首先由各系(部)按照考核评价办法规定的考核评价内容和要求,进行相关材料、信息的准备并提供有关背景资料,然后由学院考核评价领导小组成员按照考核评价办法查阅有关背景资料,给出评价结果,报学院考核办汇总。 第五章考核办法 第八条系(部)教学工作考核分为六个方面,即工作状态、教学基本建设、教学任务、教学效果、教科研成果和特色项目六个方面的内容。 第九条工作状态考核(100分) 工作状态考核分为:岗位职责(20分),计划管理(10分),教学状态(20分),教学研究(15分),教学档案管

中国统计数据质量分析

摘要:改革开放以来,随着人们对统计数据质量重要性的认识逐步加深,中国统计数据质量存在的各种问题也越来越受到关注。现在,中国统计数据质量依然面临诸多挑战,包括如何与国际接轨、建立有效的质量管理体系等。从统计数据质量内涵、存在的问题、产生的原因、改进办法等几个方面加以了论述。 关键词:统计数据;质量;问题;改进办法 1 背景 随着社会对统计数据的关注度越来越高,公共政策和公共治理对统计数据的依赖越来越重,公众对统计数据的要求也越来越高的同时,对统计数据的质疑之声此起彼伏。 湖北省统计局副局长、中南财经政法大学财税学院教授、博士生导师,叶青指出:房价、地方gdp之和大大高出全国核算数据、城镇职工平均工资统计范围太窄、城镇登记失业率不反映真实失业率等,都让老百姓对统计数据心生迷雾。 为了加强对政府统计数据质量的研究,推动统计数据质量的提高,在2011年7月份,中国统计学会召开政府统计数据质量专题研讨会。 大会征集论文内容以政府统计数据质量为主题,主要涉及统计数据质量内涵、质量评估、影响因素、改进途径、数据质量控制方法等不同角度。大会专家学者分别从理论研究成果、工作经验介绍以及前人研究成果的系统总结等各个方面对中国政府统计数据质量进行了探讨。 2 文献回顾 金勇进(2010)从统计数据质量控制与评估技术方法、统计数据质量管理体系建立等方面进行了理论研究。技术方法包括:测量误差的统计分布和检验研究,抽样误差以及非抽样误差理论研究,缺失数据的统计处理方法研究,汇总数据的误差理论研究等。 中国从1993年改用sna国民经济核算体系,以及2002年加入gdds以来,中国统计数据质量标准越来越与国际接轨,但是差距也是存在的。imf的数据质量评估框架(qdaf)为统计数据质量进行定性评估提供了一种方法,其主要内容包括五个维度:质量的先决条件、诚信的保证、方法的健全性、准确性与可靠性、适用性。在我国,统计数据质量除了受到统计制度、核算水平等方面因素的影响外,缺少一个全面适用的统计数据的质量评估标准也是不可忽视的原因(常宁,2004)。 3 统计数据质量内涵 国家统计局总统计师鲜祖德认为,从国际经验来看,政府统计数据质量主要应从准确性、适用性、可比性、及时性、衔接性、可获得性、透明度和有效性等八个方面进行评价。金勇进(2010)认为,统计数据质量就是要符合标准,首先要能够准确反映客观现象,即准确性;其次要能满足使用者的需求,即适应性;以及由此发展而来的准确性、及时性、可比性、适用性、经济性、可得性和保密性等。 4 统计数据质量存在的问题 4.1 数据主观失真 (1)数据采集环节。 采集到的数据符不符合要求,准确性怎样,误差有多大,有没有主观编造等会对统计数据质量产生直接影响。这些采集到的第一手资料是进行分析的基础,它们的准确性与否直接关系到分析是否有意义。国家统计局江西调查总队的周献华认为,登记误差是当前影响农村调查数据质量的主要原因。而且,数据采集环节产生的数据失真是很难修复的,即使更正,也需要大量人力物力。 (2)台账、记录不全。 基层统计部门的原始记录和台账不健全也是造成统计数据失真的又一大原因。原始记录可以有效监督数据产生过程,因而一旦缺失,就无法保障记账笔数的正确性和及时性,造成数据监管不力的局面。其次,台账缺失,在进行数据汇总的时候可能造成漏记,堆记,从而

数据质量具体评测指标及方法说明

数据质量具体评测指标及方法说明 一、主要评测内容 重点评测个案库的数据完整性、逻辑关系准确性。评测内容及指标计算方法会根据需要作适当调整。 二、具体评测指标及方法 (一)主要数据项完整情况 1、评测内容:重点评测个案库中的基本情况表,具体数据项包括姓名、性别、现居住地代码、户籍所在地代码、公民身份号码、出生日期、婚姻状况、户口性质等8项必填内容。 其中:每条个案记录中,只要任意一项主要数据项缺失,即认定为该条记录的主要数据项不完整。 2、评测指标:主要数据项完整率 3、计算公式: 主要数据项完整的人口总数 —————————————×100% 个案信息库包含的人口总数 其中: 主要数据项要通过单项逻辑校验,没有通过单项逻辑校验的视为数据项缺失。校验规则如下: (1)性别、户口性质、婚姻状况数据项均不能为空错值;

(2)姓名:7岁以上(含7岁)“姓名”不含“未取名”、阿拉伯数字、英文字母等不符合规范的文字,不少于两个汉字。7岁以下人口不做此单项逻辑校验。 (3)公民身份号码:7岁以上(含7岁)“公民身份号码”不含空格、性别码与性别匹配、长度为15或18位、校验码正确。7岁以下人口不做此单项逻辑校验。 (4)出生日期:不大于汇总数据时点。 (5)现居住地代码:不为空错值,当人员类别为外出时,现居住地代码不应为本地 (6)户籍地代码:不为空错值,当人员类别为外来时,户籍地代码不应为本地 (二)逻辑关系准确情况 1、评测内容:分为单表审核、表间审核两种类型,共计7个审核内容。 其中,每条个案记录中,只要任意一项逻辑关系不准确,即认定为该条记录的逻辑关系不准确。 (1)若总人口数据“婚姻状况”为已婚(代码为20 – 23 29),则与配偶有关的信息项目配偶姓名、配偶身份证(配偶身份证错误也视为空)项均不为空; (2)育妇卡片“育龄妇女初婚日期”加15年不能小于“育龄妇女出生日期”;

从统计流程谈统计数据质量控制

从统计流程谈统计数据质量控制 作为一名基层统计工作者,自己从事规模工业统计2年多的时间不算长,但是这两年却是规模工业统计发生深刻变革的两年,统计范围的变化,计算方法的变更,能源统计的变革。每一次制度改革,都关乎统计数据的质量,改革的好坏对于统计数据质量有着至关重要的影响。作为一名统计改革的亲历者,抱着抛砖引玉态度,提几点自己对数据质量控制的思考,希望引起大家的共鸣,甚至引出前辈、专家的大思考,对以后规模工业统计改革也能有所裨益。 统计数据质量是统计事业的生命,我想从基层统计工作的流程入手,只有每个流程的质量都得到保证,统计数据质量才会有保障,通过流程解剖统计数据质量存在的问题,寻求解决问题的办法。 笔者从事的是规模工业统计,就以规模工业统计为例。就规模工业来说,一张报表的完成基本上要经历报表收集—录入审核—反馈修改—汇总上报四个流程,规模工业最重要和最常态的报表是产值报表和财务报表,也就是我们行业通常所称的201表和202表,我就以此为例谈谈报表的四个流程,以此来揭示工作中存在的问题。 第一个流程是报表收集。201表省统计局要求的上报时间是下个月的4号中午12点之前,为了能够顺利收集各区

县和企业报表,我们市统计局要求他们分别在2号和1号之前上报,县统计局收集报表就更加靠前了,通常都安排在月底之前上报。然而企业断帐的时间却不尽一致,部分企业要到下个月的上旬才能出初步数据,有些集团公司或总厂由于要收集下面分公司或分厂的数据,就难免还要晚一点。这里问题就暴露出来了,一方面催着要报表,另一方面数据出不来,企业怎么办?要么先报个预计数应付一下,要么迟报或者拒报,但是迟报或拒报就会违犯《统计法》,面临处罚,所以通常企业都选择预计上报。众所周知,企业上报数据是我们统计数据的源头,源头上的数据把握不准,势必影响统计数据质量。但是如果要保证数据质量就要牺牲一些时效性,如何既保证准确性又不失时效性呢?这是当前基层统计工作面临的两难抉择。 统计报表的第二个流程是录入审核。这是保证统计数据质量的重要一环,县市和企业上报的数据准不准确,报表内有没有逻辑错误,报表与报表之间有没有互相匹配和验证,都要靠我们这个流程来发现和纠正。这个流程的数据质量如何控制?就要靠我们的基层统计工作者的业务素养和工作责任心。有些人认为,现在的报表处理都是通过电脑软件来进行,有电脑审核还会有什么错误审核不出来吗?统计工作者只要根据审核错误修改就是了,不需要太高的业务素养。其实不然,电脑并不是万能的,它只能根据程序中的公式来

关于统计数据质量问题的研究

关于统计数据质量问题的研究

【摘要】我国政府于2002年4月15日正式加入了数据公布通用系统。统计虽然“入世”了,但不论是与社会各界对统计信息的需求相比,还是对统计核算和统计数据公布的国际准则的运作要求相比,我国的统计数据质量目前都还有一定差距。为了更好地满足社会经济发展过程中社会各界对统计数据的需求,使我国统计进一步与国际接轨,有必要对我国统计数据质量管理进行研究。 【关键词】统计数据;质量问题;国家统计局 统计数据质量问题是衡量统计工作的核心指标。尤其是我国加入WTO,与世界经济接轨的今天,社会各界对统计信息的需求量越来越大,对统计信息质量的要求也越来越高。统计信息质量的高低直接影响和决定着统计信息的可利用性。统计数据质量低下将会直接导致错误的决策。因此,努力提高统计数据的质量,实现统计信息的准确、有效、全面、有着重要的意义。 一、统计数据质量的含义 传统的统计数据质量仅仅指其准确性,通常

用统计估计中的误差来衡量。但如今“质量”的概念被拓宽了,“统计数据质量”的概念也有必要拓宽。目前各国统计机构和有关国际组织对统计数据质量含义的解释和理解仍存在一定的分歧,对统计数据质量应涵盖哪几个方面,还没有统一的标准。各国从本国的实际情况以及对数据质量含义的理解出发,确定了不同的数据质量标准。如英国政府统计数据质量标准是准确性、时效性、有效性、客观性;韩国的质量标准则是适用性、准确性、时效性、可索取性、可比性、有效性。在我国,统计数据质量主要包括统计数据的核心质量、形式质量及延伸质量三大方面。 二、我国统计数据质量管理现状及存在问题 改革开放以来,我国统计人员大胆探索,辛勤实践,在指标体系、调查方法、统计标准、技术手段、数据报送与处理方式等方面进行改革,较好地满足了社会各界对统计信息的需求,推动了统计事业的发展。但是,浮夸风以及片面追求假、大、空现象仍然存在,这些都违背了统计工作的基本要求,阻碍了统计工作的发展。目前我国统计数据质量管理上存在的问题主要有: 1. 统计数据失真。统计制度不够完善是造

数据质量评价的原则与方法

仅供参考! 目前,基于数据仓库的商业智能应用已经成为国内许多企业的IT规划项目,并受到企业管理层的关注。作为商业智能的基础,数据质量的好坏是影响商业智能应用效果的关键,但由于企业的信息化经过长期的积累和发展,数据质量参差不齐,脏数据的存在阻碍了商业智能应用的进程,下面将重点谈谈如何让脏数据改头换面。 数据的“往事” 脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。 脏数据的存在主要是由于源系统的设计不够严密造成的。主要表现为:数据格式错误,数据不一致,数据重复、错误,业务逻辑的不合理,违反业务规则等。例如,未经验证的身份证号码、未经验证的日期字段等,还有账户开户日期晚于用户销户日期、交易处理的操作员号不存在、性别超过取值范围等。此外,也有因为源系统基于性能的考虑,放弃了外键约束,从而导致数据不一致的结果。 目前,大多数的银行业务系统的输入界面是采用COBOL语言或C语言开发的,界面处理功能不是很强,一些要素被设计成“输入”而不是“选择”,如企业客户的信用等级被设计成输入,输入的正确与否完全由操作员的理解决定,这也是脏数据产生的原因之一。例如,如果被设计成“选择”就不会出现把AAA输成“1”或其他了。 转换与清洗的实例 下面以银行业务系统的客户的惟一标识—客户号为例来讲解如何转换与清洗数据。 客户信息的处理是整个数据抽取、转换、清洗和装载(ETL)工作中最复杂的部分。目前业务系统中常见的客户信息处理的难点主要有以下两个方面。 客户的惟一标识混乱 银行的客户号一般由证件类型与证件号组成,这里就有一个问题,如果客户有多种证件怎么办?或者说某个客户办了移民,有了新的身份,系统中怎样体现出他是同一个客户?这些问题,除了少部分是由于发证机关造成的(如身份证重号),大部分是由于操作人员的操作不规范造成的。主要表现在以下三个方面。 A、客户身份证号问题 最常见的问题是客户的身份证从15位更换为18位。首先操作人员只要能输入新的客户号,就认为是一个新的客户;其次,即使操作员知道客户的身份证升位了,但在银行的客户信息中,客户号是惟一标识,如果对惟一标识进行更新,作为增量反映到目标系统中,但没有记录原客户号,对于目标系统来说就是一条新记录,而删除原有的客户信息在实际操作中可能是不允许或做不到的,因为在这个客户号上可能还挂了许多账户,即便物理删除了这条客户

统计数据质量控制问题研究-最新范文

统计数据质量控制问题研究 摘要:随着社会主义市场经济的不断发展,统计失实的的现象日渐严重,统计工作者应当本着对本职工作高度负责的精神,进行全过程的、全员参加的、以预防为主的统计数据质量控制。要尽可能采用计算机处理统计资料,最大限度的减少人工参与,加强对统计人员的职业道德和专业水平培训以及加大统计执法力度等,以保证源头数据的准确性,使我们的统计工作更好的地为现代社会经济服务。 正文 现代经济正步入以世界统一市场为标志的世界经济一体化轨道,企业的成败,取决于信息获取、识别、处理、转换、传递的准确性、效率与速度。因此,信息在企业经营管理中的重要作用也将愈来愈显著。随着我国改革开放,确立市场经济体制,和加入WTO,企业要能在国际国内激烈的市场竞争中求得生存与此同时发展,一个重要的条件就是--必须要有一个健全的高效的信息系统,以满足企业经营管理决策所需的各种内外信息。因此,作为提供信息的企业统计必将在其中扮演重要角色,发挥重要作用。特别是对我们***系统来说,随着”大企业、大市场、大品牌”的形成,以行政区划为单一的卷烟市场割据将很快被打破,搬掉门槛推倒墙是大势所趋。再下一步就有可能是***专卖法的取消,所有这些都告诉我们,***行业也将马上面临着国际国内激烈的市场竞争。想在这种激烈的竞争中生存发展,必须要有一支能够为企业的决策和管理者提供准确数据的素质过硬的统计队伍。

近年来,我国统计工作取得了比较显著的成绩。从总体上来看,我国现有的统计数据,基本上还是能够反映客观实际的。但是,随着社会主义市场经济的不断发展,经济结构复杂化,利益主体多元化,再加上体制转化过程中经济秩序混乱,人为干扰增多,因而搞准统计数据的难度也就日益增大,统计失实的潜在危险性也就日渐严重,并将逐步暴露。对此,我们必须要有清醒的认识,要始终不渝地把提高统计数据质量问题,摆到统计工作的首要位置,并采取综合治理措施,切实抓紧抓好。下面就统计数据质量问题谈谈自己一些粗浅的看法。 一、统计数据质量控制的意义 企业统计的目的是为企业经营决策管理提供统计信息。在市场经济条件下,企业经营决策极具风险性,风险产生于不确定性并由不确定性程度决定风险的大小,而不确定性又与信息的准确和及时程度直接相关,信息愈准确及时,不确定性愈低,反之,亦然。所以,准确性和及时性是对统计资料的两项基本要求。其中,准确性的要求是第一位的,是统计工作的生命。它确定着统计资料是否有效和价值的高低,是衡量统计数据质量的根本标志。准确可靠的统计数据,便于决策和管理者正确地把握形势,客观地剖析问题,从而作出科学的决策。反之,有水分的、失实的统计数据,相互矛盾的统计数据,给决策者以错误的信号,将会误导决策和调控,对企业的发展将会造成重大损失。因此,统计工作者必须以对本职工作高度负责的精神,以统计数据为对象,以消除统计数据的差错为目标,千方百计搞准统计数据,达到强化统计数据质量控制的目的。

统计数据报送及质量检查审核评估制度

陵县工商行政管理系统 统计数据报送及质量检查审核制度 为保证统计数据质量,依据省、市局有关规定,制定本制度。 第一条全县工商行政管理统计报表编制必须严格执行《国家工商行政管理系统统计报表制度》,按照“分级负责、集中汇总、逐级上报”的办法进行管理。 第二条编制、报送各类统计报表必须全面、及时、准确,做到表种不缺、指标不漏、时间不拖、数字不错。 第三条各种统计报表采取逐月定案法,即统计报表报出一个月为定案期,逾期为定案数。 县局各业务科室、所、直属局报表于每月26日前报县局办公室。季报、半年报、年报按规定时间上报,统计报表时间另有规定的,按规定的时限上报。 第四条业务报表必须经统计人员核对无误后,报科室、所负责人签字并加盖公章,上报本局综合统计机构,由综合统计机构进行汇总,经填表人审核签字、统计负责人和局领导审核签字,并加盖公章后报上级机关综合统计机构。 第五条综合统计员要在统计数据填报、汇总、整理的每个

阶段,从基础数据收集和各专业主要统计数据之间的衔接,到最后数据的确定,对数据质量进行认真审核,确保统计数据客观真实。 第六条报表上报实行双轨制,即在报送电子版的同时报送报表打印件。原则上,上报电子版采用网络传输方式,报表打印件采用专人送达的方式。 统计报表报出后,如发现差错,应在更正期内立即申请更正。上报单位在报出报表的同时,留存一份归档管理。 第七条统计数据质量实行分级负责、分级管理。县局综合统计机构对全县系统统计数据质量统一管理,负责全县系统统计数据质量的监督、检查和评估等项工作;各科室、所、直属局对本级统计数据质量进行管理,负责本级统计数据质量的监督、检查和评估工作。 各单位统计负责人是统计数据质量第一责任人,专(兼)职统计员是统计数据质量直接责任人。 第八条各单位要在建立健全统计台帐和原始记录的基础上,做好统计数据的评估工作。由业务科室统计人员结合工作实际写出统计评估分析,经分管领导审批后,上报上一级综合统计机构。 第九条统计数据的评估分析要本着客观、真实的原则,确

常用的质量评价统计方法

常用的质量评价统计方法 1.分层法 分层法是质量管理中整理数据的重要方法之一。分层法是把收集来的原始质量数据,按照一定的目的和要求加以分类整理,以分析质量问题及其影响因素 的一种方法。 2.调查表法 调查表是为收集数据而设计的图表。调查表法就是利用统计表进行整理数据和粗略分析原因的一种工具。其格式多种多样,可根据调查的目的不同,使 用不同的调查表。 3.排列图法 排列图法又称主次因素分析图,是把影响质量的因素进行合理分类,并按影响程度从大到小的顺序排列,做出排列图,以直观的方法表明影响质量的主 要因素的一种方法。 排列图的基本结构:1个横坐标,2个纵坐标,几个直方形和一条曲线构成。 (1)针对某一问题收集一定时期的资料。 (2)将数据按一定分类标志进行分类整理,从大到小依次排列,并计算出 各类项目的频数、累计频率。 (3)按一定的比例画出两个纵坐标和一个横坐标。横坐标表示影响质量的因素,左边纵坐标表示频数,右边纵坐标表示累计频率。 (4)按种类影响因素的程度的大小,依次从左到右在横坐标上画出直方块,其高度表示该项目的频数,并写在直方块上方。 (5)按右纵坐标的比例,在直方块中问的上方标出累计频率,从原点开始 连接各点,画出的曲线就是巴雷特曲线。 应用排列图的注意事项: (1)通常把因素分为A、B、C三类。在累计频率80%与90%两处画2条横线,把图分成三个区域,累计频率在80%以内的诸因素是主要因素(A类),累计频率在80%~90%的是次要因素(B类),90%以上的为一般因素。 (2)主要因素不能太多,一般找出主要因素一二项为宜,最多不超过三项。 若找出主要因素过多,须考虑重新进行因素的分类。 (3)适当合并一般因素。不太重要因素可以列出很多项,为简化作图,可把这些因素合并为“其他”项,放在横坐标的末端。

统计数据质量问题探讨

统计数据质量问题探讨 统计数据质量问题是衡量统计工作的核心指标。尤其是我国加入WTO,与世界经济接轨的今天,社会各界对统计信息的需求量越来越大,对统计信息质量的要求也越来越高。统计信息质量的高低直接影响和决定着统计信息的可利用性。统计数据质量低下将会直接导致错误的决策。 一、统计数据质量的含义 传统的统计数据质量仅仅指其准确性,通常用统计估计中的误差来衡量。但如今“质量”的概念被拓宽了,“统计数据质量”的概念也有必要拓宽。目前各国统计机构和有关国际组织对统计数据质量含义的解释和理解仍存在一定的分歧,对统计数据质量应涵盖哪几个方面,还没有统一的标准。各国从本国的实际情况以及对数据质量含义的理解出发,确定了不同的数据质量标准。如英国政府统计数据质量标准是准确性、时效性、有效性、客观性;韩国的质量标准则是适用性、准确性、时效性、可索取性、可比性、有效性。在我国,统计数据质量主要包括统计数据的核心质量、形式质量及延伸质量三大方面。 二、我国统计数据质量管理现状及存在问题 改革开放以来,我国统计人员大胆探索,辛勤实践,在指标体系、调查方法、统计标准、技术手段、数据报送与处理方式等方面进行改革,较好地满足了社会各界对统计信息的需求,推动了统计事业的发展。但是,浮夸风以及片面追求假、大、空现象仍然存在,这些都违背了统计工作的基本要求,阻碍了统计工作的发展。目前我国统计数据质量管理上存在的问题主要有: 1.统计数据失真。统计制度不够完善是造成统计数据失真的内在因素,表现在:统计部门内部各专业在统计方法、指标涵义、口径上还存在一定程度上的不统一;专业间统计方法改革不同步;统计范围、口径的理论值与实际值出入有时还比较大;统计与财会在核算周期上还存在一些差异,并且在统计数据质量管理上各级统计管理部门在统计执法过程中力度不够,对统计过程缺少制约与监督,对统计数据缺乏校验与复查的有力措施。 2.设计时需求不明确,缺乏远见。数据库与文件管理系统的重要区别之一在于不仅存放数据,而且存放数据之间的相关性。相关性不仅表现在数据依存的

相关主题