搜档网
当前位置:搜档网 › 实验数据误差分析与数据处理

实验数据误差分析与数据处理

实验数据误差分析与数据处理
实验数据误差分析与数据处理

第一章实验数据误差分析与数据处理

第一节实验数据误差分析

一、概述

由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验测量值和真值之间,总是存在一定的差异,在数值上即表现为误差。为了提高实验的精度,缩小实验观测值和真值之间的差值,需要对实验数据误差进行分析和讨论。

实验数据误差分析并不是即成事实的消极措施,而是给研究人员提供参与科学实验的积极武器,通过误差分析,可以认清误差的来源及影响,使我们有可能预先确定导致实验总误差的最大组成因素,并设法排除数据中所包含的无效成分,进一步改进实验方案。实验误差分析也提醒我们注意主要误差来源,精心操作,使研究的准确度得以提高。

二、实验误差的来源

实验误差从总体上讲有实验装置(包括标准器具、仪器仪表等)、实验方法、实验环境、实验人员和被测量五个来源。

1.实验装置误差

测量装置是标准器具、仪器仪表和辅助设备的总体。实验装置误差是指由测量装置产生的测量误差。它来源于:

(1)标准器具误差

标准器具是指用以复现量值的计量器具。由于加工的限制,标准器复现的量值单位是有误差的。例如,标准刻线米尺的0刻线和1 000 mm刻线之间的实际长度与1 000 mm单位是有差异的。又如,标称值为1kg的砝码的实际质量(真值)并不等于1kg等等。

(2)仪器仪表误差

凡是用于被测量和复现计量单位的标准量进行比较的设备,称为仪器或仪表.它们将被测量转换成可直接观察的指示值。例如,温度计、电流表、压力表、干涉仪、天平,等等。

由于仪器仪表在加工、装配和调试中,不可避免地存在误差,以致仪器仪表的指示值不等于被测量的真值,造成测量误差。例如,天平的两臂不可能加工、调整到绝对相等,称量时,按天平工作原理,天平平衡被认为两边的质量相等。但是,由于天平的不等臂,虽然天平达到平衡,但两边的质量并不等,即造成测量误差。

(3)附件误差

为测量创造必要条件或使测量方便地进行而采用的各种辅助设备或附件,均属测量附件。如电测量中的转换开关及移动测点、电源、热源和连接导线等均为测量附件,且均产生测量误差。又如,热工计量用的水槽,作为温度测量附件,提供测量水银温度计所需要的温场,由于水槽内各处温度的不均匀,便引起测量误差,等等。

按装置误差具体形成原因,可分为结构性的装置误差、调整性的装置误差和变化性的装置误差。结构性的装置误差如:天平的不等臂,线纹尺刻线不均匀,量块工作面的不平行性,光学零件的光学性能缺陷,等等。这些误差大部分是由于制造工艺不完善和长期使用磨损引起的。调整性的装置误差如投影仪物镜放大倍数调整不准确,水平仪的零位调整不准确,千分尺的零位调整不准确,等等。这些误差是由于仪器仪表在使用时,未调整到理想状态引起的。变化性的装置误差如:激光波长的长期不稳定性,电阻等元器件的老化,晶体振荡器频率的长期漂移,等等。这些误差是由于仪器仪表随时间的不稳定性和随空间位置变化的不均匀性造成的。

2.环境误差

环境误差系指测量中由于各种环境因素造成的测量误差。

被测量在不同的环境中测量,其结果是不同的。这一客观事实说明,环境对测量是有影响的,是测量的误差来源之一。环境造成测量误差的主要原因是测量装置包括标准器具、仪器仪表、测量附件同被测对象随着环境的变化而变化着。

测量环境除了偏离标准环境产生测量误差以外,从而引起测量环境微观变化的测量误差。

3.方法误差

方法误差系指由于测量方法(包括计算过程)不完善而引起的误差。

事实上,不存在不产生测量误差的尽善尽美的测量方法。由测量方法引起的测量误差主要有下列两种情况:

第一种情况:由于测量人员的知识不足或研究不充分以致操作不合理,或对测量方法、测量程序进行错误的简化等引起的方法误差。

第二种情况:分析处理数据时引起的方法误差。例如,轴的周长可以通过测量轴的直径d,然后由公式:L=πd计算得到。但是,在计算中只能取其近似值,因此,计算所得的L也只能是近似值,从而引起周长L的误差。

4.人员误差

人员误差系指测量人员由于生理机能的限制,固有习惯性偏差以及疏忽等原因造成的测量误差。由于测量人员在长时间的测量中,因疲劳或疏忽大意发生看错、读错、听错、记错等错误造成测量误差,这类误差往往相当大是测量所不容许的。为此,要求测量人员养成严格而谨慎的习惯,在测量中认真操作并集中精力,从制度上规定,对某些准确性较高而又重要的测量,由另一名测量人员进行复核测量。

5.测量对象变化误差

被测对象在整个测量过程中处在不断地变化中。由于测量对象自身的变化而引起的测量误差称为测量对象变化误差。

例如,被测温度计的温度,被测线纹尺的长度,被测量块的尺寸等,在测量过程中均处于不停地变化中,由于它们的变化,使测量不准而带来误差。

三、误差的分类

误差是实验测量值(包括间接测量值)与真值(客观存在的准确值)之差别,误差可以分为下面三类:

1. 系统误差

由某些固定不变的因素引起的。在相同条件下进行多次测量,其误差的数值大小正负保持恒定,或误差随条件按一定规律变化。单纯增加实验次数是无法减少系统误差的影响,因为它在反复测定的情况下常保持同一数值与同一符号,故也称为常差。系统误差有固定的偏向和确定的规律,可按原因采取相应的措施给予校正或用公式消除。

2. 随机误差(偶然误差)

由一些不易控制的因素引起,如测量值的波动,肉眼观察误差等等。随机误差与系统误差不同,其误差的数值和符号不确定,它不能从实验中消除,但它服从统计规律,其误差与测量次数有关。随着测量次数的增加,出现的正负误差可以相互抵消,故多次测量的算术平均值接近于真值。

3.过失误差

由实验人员粗心大意,如读数错误,记录错误或操作失误引起。这类误差与正常值相差较大,应在整理数据时加以剔除。

四、实验数据的真值与平均值

1.真值

真值是指某物理量客观存在的确定值,它通常是未知的。虽然真值是一个理想的概念,但对某一物理量经过无限多次的测量,出现的误差有正、有负,而正负误差出现的概率是相同的。因此,若不存在系统误差,它们的平均值相当接近于这一物理量的真值。故真值等于测量次数无限多时得到的算术平均值。由于实验工作中观测的次数是有限的,由此得出的平均值只能近似于真值,故称这个平均值为最佳值。

2.平均值

油气储运实验中常用的平均值有:

(1)算术平均值

设x1,x2,.,x n 为各次测量值,n 为测量次数,则算术平均值为:

算术平均值是最常用的一种平均值,因为测定值的误差分布一般服从正态分布,可以证明算术平均值即为一组等精度测量的最佳值或最可信赖值。

(2)均方根平均值

(3)几何平均值

五、误差的表示方法

1.绝对误差

测量值与真值之差的绝对值称为测量值的误差,即绝对误差。在实际工作中常以最佳值代替真值,测量值与最佳值之差称为残余误差,习惯上也称为绝对误差。

设测量值用x 表示,真值用X 表示,则绝对误差D 为

D=|X-x|

如在实验中对物理量的测量只进行了一次,可根据测量仪器出厂鉴定书注明的误差,或取测量仪器最小刻度值的一半作为单次测量的误差。如某压力表精(确)度为1.5 级,即表明该仪表最大误差为相当档次最大量程的1.5%,若最大量程为0.4MPa,该压力表的最大误差为:

0.4×1.5%=0.006MPa

如实验中最常用的U 形管压差计、转子流量计、秒表、量筒等仪表原则上均取其最小刻度值为最大误差,而取其最小刻度值的一半作为绝对误差计算值。

2.相对误差

绝对误差D 与真值的绝对值之比,称为相对误差:

式中真值X 一般为未知,用平均值代替。

3.算术平均误差

算术平均误差的定义为:

x i——测量值,i=1,2,3, .,n ;

d i——测量值与算术平均值(x )之差的绝对值,d i= x x i . 。

4.标准误差(均方误差)

对有限测量次数,标准误差表示为:

标准误差是目前最常用的一种表示精确度的方法,它不但与一系列测量值中的每个数据有关,而且对其中较大的误差或较小的误差敏感性很强,能较好地反映实验数据的精确度,实验愈精确,其标准误差愈小。

六、精密度、正确度和准确度

1、精密度

精密度是指对同一被测量作多次重复测量时,各次测量值之间彼此接近或分散的程度。它是对随机误差的描述,它反映随机误差对测量的影响程度。随机误差小,测量的精密度就高。如果实验的相对误差为0.01%且误差由随机误差引起,则可以认为精密度为10-4。

2、正确度

正确度是指被测量的总体平均值与其真值接近或偏离的程度。它是对系统误差的描述,它反映系统误差对测量的影响程度。系统误差小,测量的正确度就高。如果实验的相对误差为0.01%且误差由系统误差引起,则可以认为正确度为10-4。

3、准确度

准确度是指各测量值之间的接近程度和其总体平均值对真值的接近程度。它包括了精密度和正确度两方面的含义。它反映随机误差和系统误差对测量的综合影响程度。只有随机误差和系统误差都非常小,才能说测量的准确度高。若实验的相对误差为0.01%且误差由系统误差和随机误差共同引起,则可以认为精确度为10-4。

七、实验数据的有效数与记数法

任何测量结果或计算的量,总是表现为数字,而这些数字就代表了欲测量的近似值。究竟对这些近似值应该取多少位数合适呢?应根据测量仪表的精度来确定,一般应记录到仪表最小刻度的十分之一位。例如:某液面计标尺的最小分度为1mm,则读数可以到0.1mm。如在测定时液位高在刻度524mm 与525mm 的中间,则应记液面高为524.5mm,其中前三位是直接读出的,是准确的,最后一位是估计的,是欠准的,该数据为4 位有效数。如液位恰在524mm刻度上,该数据应记为524.0mm,若记为524mm,则失去一位(末位)欠准数字。

总之,有效数中应有而且只能有一位(末位)欠准数字。

由上可见,当液位高度为524.5mm 时,最大误差为±0.5mm,也就是说误差为末位的一半。在科学与工程中,为了清楚地表达有效数或数据的精度,通常将有效数写出并在第一位数后加小数点,而数值的数量级由10 的整数幂来确定,这种以10 的整数幂来记数的方法称科学记数法。例如:0.0088 应记为8.8×10-3,88000(有效数3 位)记为8.80×104。应注意科学记数法中,在10 的整数幂之前的数字应全部为有效数。

有效数字进行运算时,运算结果仍为有效数字。总的规则是:可靠数字与可靠数字运算后仍为可靠数字,可疑数字与可疑数字运算后仍为可疑数字,可靠数字与可疑数字运算后为可疑数字,进位数可视为可靠数字。

对于已经给出了不确定度的有效数字,在运算时应先计算出运算结果的不确定度,然后根据它决定结果的有效数字位数。

加减运算规则:

A.如果已知参与加减运算的各有效数字的不确定度,则先算出计算结果的不确定度,并保留1-2位,然后确定计算结果的有效位数。

B.如果没给出参与加减运算的各有效数字的不确定度,则先找出可疑位最高的那个有效数字,计算结果的可疑位应与该有效数字的可疑位对齐。

乘除运算规则

若干个有效数字相乘除时,计算结果(积或商)的有效数字位数在大多数情况下与参

与运算的有效数字位数最少的那个分量的有效位数相同。

乘方、开方运算规则

有效数字在乘方或开方时,若乘方或开方的次数不太高,其结果的有效数字位数与原底数的有效数字位数相同。

对数运算规则

有效数字在取对数时,其有效数字的位数与真数的有效数字位数相同或多取1位。

第二节 实验数据处理基本方法

数据处理是指从获得数据开始到得出最后结论的整个加工过程,包括数据记录、整理、计算、分析和绘制图表等。数据处理是实验工作的重要内容,涉及的内容很多,这里仅介绍一些基本的数据处理方法。

一、列表法

对一个物理量进行多次测量或研究几个量之间的关系时,往往借助于列表法把实验数据列成表格。其优点是,使大量数据表达清晰醒目,条理化,易于检查数据和发现问题,避免差错,同时有助于反映出物理量之间的对应关系。所以,设计一个简明醒目、合理美观的数据表格,是每一个同学都要掌握的基本技能。

列表没有统一的格式,但所设计的表格要能充分反映上述优点,应注意以下几点:

1.各栏目均应注明所记录的物理量的名称(符号)和单位;

2.栏目的顺序应充分注意数据间的联系和计算顺序,力求简明、齐全、有条理;

3.表中的原始测量数据应正确反映有效数字,数据不应随便涂改,确实要修改数据时,应将原来数据画条杠以备随时查验;

4.对于函数关系的数据表格,应按自变量由小到大或由大到小的顺序排列,以便于判断和处理。

二、图解法

图线能够直观地表示实验数据间的关系,找出物理规律,因此图解法是数据处理的重要方法之一。图解法处理数据,首先要画出合乎规范的图线,其要点如下:

1.选择图纸 作图纸有直角坐标纸(即毫米方格纸)、对数坐标纸和极坐标纸等,根据作图需要选择。在物理实验中比较常用的是毫米方格纸,其规格多为cm 2517?。

2.曲线改直 由于直线最易描绘,且直线方程的两个参数(斜率和截距)也较易算得。所以对于两个变量之间的函数关系是非线性的情形,在用图解法时应尽可能通过变量代换将非线性的函数曲线转变为线性函数的直线。下面为几种常用的变换方法。

(1)c xy =(c 为常数)。令x

z 1=,则cz y =,即y 与z 为线性关系。 (2)y c x =(c 为常数)。令2x z =,则z c

y 21=,即y 与z 为线性关系。 (3)b ax y =(a 和b 为常数)。等式两边取对数得,x b a y lg lg lg +=。于是,y lg 与x lg 为线性关系,b 为斜率,a lg 为截距。

(4)bx ae y =(a 和b 为常数)。等式两边取自然对数得,bx a y +=ln ln 。于是,y ln 与x 为线性关系,b 为斜率,a ln 为截距。

3.确定坐标比例与标度 合理选择坐标比例是作图法的关键所在。作图时通常以自变量作横坐标(x 轴),因变量作纵坐标(y 轴)。坐标轴确定后,用粗实线在坐标纸上描出坐标轴,并

注明坐标轴所代表物理量的符号和单位。

坐标比例是指坐标轴上单位长度(通常为cm 1)所代表的物理量大小。坐标比例的选取应注意以下几点:

(1)原则上做到数据中的可靠数字在图上应是可靠的,即坐标轴上的最小分度(m m 1)对应于实验数据的最后一位准确数字。坐标比例选得过大会损害数据的准确度。

(2)坐标比例的选取应以便于读数为原则,常用的比例为“1∶1”、“1∶2”、“1∶5”(包括“1∶0.1”、“1∶10”…),即每厘米代表“1、2、5”倍率单位的物理量。切勿采用复杂的比例关系,如“1∶3”、“1∶7”、“1∶9”等。这样不但不易绘图,而且读数困难。

坐标比例确定后,应对坐标轴进行标度,即在坐标轴上均匀地(一般每隔cm 2)标出所代表物理量的整齐数值,标记所用的有效数字位数应与实验数据的有效数字位数相同。标度不一定从零开始,一般用小于实验数据最小值的某一数作为坐标轴的起始点,用大于实验数据最大值的某一数作为终点,这样图纸可以被充分利用。

4.数据点的标出 实验数据点在图纸上用“+”符号标出,符号的交叉点正是数据点的位置。若在同一张图上作几条实验曲线,各条曲线的实验数据点应该用不同符号(如×、⊙等)标出,以示区别。

5.曲线的描绘 由实验数据点描绘出平滑的实验曲线,连线要用透明直尺或三角板、曲线板等拟合。根据随机误差理论,实验数据应均匀分布在曲线两侧,与曲线的距离尽可能小。个别偏离曲线较远的点,应检查标点是否错误,若无误表明该点可能是错误数据,在连线时不予考虑。对于仪器仪表的校准曲线和定标曲线,连接时应将相邻的两点连成直线,整个曲线呈折线形状。

6.注解与说明 在图纸上要写明图线的名称、坐标比例及必要的说明(主要指实验条件),并在恰当地方注明作者姓名、日期等。

7.直线图解法求待定常数 直线图解法首先是求出斜率和截距,进而得出完整的线性方程。其步骤如下:

(1)选点。在直线上紧靠实验数据两个端点内侧取两点),(11y x A 、22,(y x B ),并用不同于

实验数据的符号标明,在符号旁边注明其坐标值(注意有效数字)。若选取的两点距离较近,计算斜率时会减少有效数字的位数。这两点既不能在实验数据范围以外取点,因为它已无实验根据,也不能直接使用原始测量数据点计算斜率。

(2)求斜率。设直线方程为bx a y +=,则斜率为

1

212

x x y y b --= (1-5-1) (3)求截距。截距的计算公式为

11bx y a -= (1-5-2)

三、逐差法

当两个变量之间存在线性关系,且自变量为等差级数变化的情况下,用逐差法处理数据,既能充分利用实验数据,又具有减小误差的效果。具体做法是将测量得到的偶数组数据分成前后两组,将对应项分别相减,然后再求平均值。

例如,在弹性限度内,弹簧的伸长量x 与所受的载荷(拉力)F 满足线性关系

kx F =

实验时等差地改变载荷,测得一组实验数据如下表:

求每增加1Kg 砝码弹簧的平均伸长量x ?。

若不加思考进行逐项相减,很自然会采用下列公式计算

[])(7

1)()()(7118782312x x x x x x x x x -=-++-+-=? 结果发现除1x 和8x 外,其它中间测量值都未用上,它与一次增加7个砝码的单次测量等价。若用多项间隔逐差,即将上述数据分成前后两组,前一组),,,(4321x x x x ,后一组),,,(8765x x x x ,然后对应项相减求平均,即

[])()()()(4

4148372615x x x x x x x x x -+-+-+-?=? 这样全部测量数据都用上,保持了多次测量的优点,减少了随机误差,计算结果比前面的要准确些。逐差法计算简便,特别是在检查具有线性关系的数据时,可随时“逐差验证”,及时发现数据规律或错误数据。

四、最小二乘法

由一组实验数据拟合出一条最佳直线,常用的方法是最小二乘法。设物理量y 和x 之间的满足线性关系,则函数形式为

bx a y +=

最小二乘法就是要用实验数据来确定方程中的待定常数a 和b ,即直线的斜率和截距。

我们讨论最简单的情况,即每个测量值都是等精度的,且假定x 和y 值中只有y 有明显的测量随机误差。如果x 和y 均有误差,只要把误差相对较小的变量作为x 即可。由实验测量得到一组数据为),2,1;,(n i y x i i =,其中i x x =时对应的i y y =。由于测量总是有误差的,我们将这些误差归结为i y 的测量偏差,并记为1ε,2ε,…,n ε,见图1-5-2。这样,将

实验数据),(i i y x 代入方程bx a y +=后,得到

??

?

????

=+-=+-=+-n n n bx a y bx a y bx a y εεε)()()(222111 我们要利用上述的方程组来确定a 和b ,那么a 和b 要满足什么要求呢?显然,比较合理的a 和b 是使1ε,2ε,…,n ε数值上都比较小。但是,每次测量的误差不会相同,反映在1ε,2ε,…,n ε大小不一,而且符号也不尽相同。所以只能要求总的偏差最小,即

min 21

→∑=i n

i ε

令 2121)(i i n i i n i bx a y S --==

∑∑==ε

使S 为最小的条件是 0=??a S ,0=??b

S ,022>??a S ,022>??b S

y

由一阶微商为零得

???

????=--∑-=??=--∑-=??==0)(20)(211i i i n i i i n i x bx a y b S bx a y a S 解得 2

12112111)(i n i i n i i n

i i n i i i n i i n i x n x y x y x x a ======∑-??

? ??∑∑∑-∑∑= (1-5-3)

21211

11)(i n i i n i i i n i i n i i n i x n x y x n y x b =====∑-??

? ??∑∑-∑∑= (1-5-4) 令111x n x n i =∑=,i n i y n y 11=∑=,21121??

? ??∑==x n x n i ,2121i n i x n x =∑=,)(111i n i y x n xy =∑=,则 x b y a -= (1-5-5)

22x

x xy y x b --?= (1-5-6)

如果实验是在已知y 和x 满足线性关系下进行的,那么用上述最小二乘法线性拟合(又称一元线性回归)可解得斜率a 和截距b ,从而得出回归方程bx a y +=。如果实验是要通过对x 、y 的测量来寻找经验公式,则还应判断由上述一元线性拟合所确定的线性回归方程是否恰当。这可用下列相关系数r 来判别

))((2222y y x x y x xy r --?-= (1-5-7) 其中2

1121??

? ??∑==y n y n i ,2121i n i y n y =∑=。 可以证明,||r 值总是在0和1之间。||r 值越接近1,说明实验数据点密集地分布在所拟合的直线的近旁,用线性函数进行回归是合适的。1||=r 表示变量x 、y 完全线性相关,拟合直线通过全部实验数据点。||r 值越小线性越差,一般9.0||≥r 时可认为两个物理量之间存在较密切的线性关系,此时用最小二乘法直线拟合才有实际意义。

相关主题