
2.2 实验数据处理的基本方法
数据处理是化学工程与工艺专业实验报告的重要组成部分,实验数据处理就是将实验测得的一系列数据经过计算整理后用最适宜的方式表示出来,在化学工程与工艺专业实验中常用列表法、作图法、图解法、最小二乘法直线拟合等几种形式表示。
2.2.1 列表法
将实验数据按自变量与因变量的对应关系而列出数据表格形式即为列表法。列表法具有制表容易、简单、紧凑、数据便于比较的优点,也是绘制曲线和整理成为方程的基础。
实验数据表格可分为实验数据记录表(原始数据记录表)和实验数据处理结果整理表两类。实验数据记录表是根据实验内容为记录待测数据而设计的表格,记录不同实验的原始数据通常需设计不同的表格。在本教材中,为方便读者记录原始数据,提供了一些原始数据记录的表头,可供大家参考使用。
实验数据处理结果整理表是实验数据经计算整理间接得出的表格,要尽量清楚地表达主要变量之间的关系和实验结论。
根据实验内容设计拟定表格时应注意以下几个问题。
①表格设计要力求简明扼要、一目了然、便于阅读和使用,记录、计算项目应满足实验要求。
②表头应列出变量名称、符号、单位,同时要层次清楚、顺序合理。
③表中的数据必须反映仪表的精度,应注意有效数字的位数。
④数字较大或较小时应采用科学记数法,例如Re=25500可采用科学记数法记作Re=2.55×104,在名称栏中记为Re/×104,数据表中可记为2.55。
⑤在实验数据处理结果整理表格下边,必须附以具有代表性的一组数据进行计算示例,表明各项之间的关系,以便阅读或进行校核。
2.2.2 作图法
作图法是在坐标纸上用图线表示物理量之间的关系,揭示物理量之间的联系。作图法具有简明、形象、直观、便于比较研究实验结果等优点,它是一种非常常用的数据处理方法。
作图法的基本规则如下。
①根据函数关系选择适宜的坐标纸(如直角坐标纸、单对数坐标纸、双对数坐标纸、极坐标纸等)和比例,画出坐标轴,标明物理量符号、单位和刻度值,并写明测试条件。
②坐标的原点不一定是变量的零点,可根据测试范围加以选择。坐标分格最好能使最低数字的一个单位可靠数与坐标最小分度相当。纵、横坐标比例要恰当,以使图线居中。
③描点和连线。根据测量数据,用直尺和笔尖使其函数对应的实验点准确地落在相应的位置。一张图纸上画几条实验曲线时,每条图线应用不同的标记如“+”、“×”、“·”、“Δ”等符号标出,以免混淆。连线时,要使曲线光滑(含直线),并使数据点均匀分布在曲线(直线)的两侧,且尽量贴近曲线。个别偏离过大的点要重新审核,属于过失误差的应剔去。
④标明图名,即作好实验图线后,应在图纸下方或空白的明显位置处,写上图的名称,有时还要附上简单的说明,如实验条件等,使读者一目了然。作图时,一般将纵轴代表的物理量写在前面,横轴代表的物理量写在后面,中间用“-”连接。
⑤最后将图纸固定在实验报告的适当位置,便于教师批阅实验报告。
2.2.3 图解法
在实验数据处理时,实验图线作出以后,可以由图线求出经验公式及相应的参数。图解法就是根据实验数据作好的图线,用解析法找出相应的函数形式。实验中经常遇到的图线是直线、抛物线、双曲线、指数曲线、对数曲线等。特别是当图线是直线时,采用此方法更为方便。
(1)由实验图线建立经验公式的一般步骤
①根据解析几何知识判断图线的类型。
②由图线的类型判断公式的可能特点。
③利用半对数、对数或倒数坐标纸,把原来的曲线改为直线。
④确定常数,建立起经验公式的形式,并用实验数据来检验所得公式的准确程度。
(2)用直线图解法求直线的方程
如果作出的实验图线是一条直线,则经验公式应为直线方程:
y=kx+b (2-36)
要建立此方程,必须由实验直接求出k和b,通常用斜率-截距法进行求解:在图线上选取两点P1(x1,y1)和P2(x2,y2),注意不要用原始数据点,而应从图线上直接读取,其坐标值最好是整数值。所取的两点在实验范围内应尽量彼此分开一些,以减小误差。由解析几何知,上述直线方程中,k为直线的斜率,b为直线的截距。k可以根据两点的坐标求出:
(2-37)
其截距b为x=0时的y值。若原实验中所绘制的图形并未给出x=0段直线,可将直线用虚线延长交y轴,则可量出截距。如果起点不为零,也可以由式:
(2-38)
求出截距,将求出的斜率和截距的数值代入方程中就可以得到经验公式。
(3)曲线改直,曲线方程的建立
在很多情况下,函数关系是非线性的,但可通过适当的坐标变换化成线性关系,在作图时用直线表示,这种方法称为曲线改直。作这样的变换不仅是由于直线容易描绘,更重要的是很多时候直线的斜率和截距所包含的物理内涵是我们所需要的。例如:
①函数关系形如y=axb时,式中a、b为参数,可变换成lgy=blgx+lga,lgy为lgx的线性函数,斜率为b,截距为lga。
②函数关系形如y=abx时,式中a、b为参数,可变换成lgy=(lgb)x+lga,lgy为x的线性函数,斜率为lgb,截距为lga。
③函数关系形如PV=C时,式中C为参数,要变换成P=C(1/V),P是1/V的线性函数,斜率为C。
④函数关系形如y2=2px时,式中p为参数,,y是x1/2的线性函数,斜率为
。
⑤函数关系形如y=x/(a+bx)时,式中a、b为参数,可变换成1/y=a(1/x)+b,1/y为1/x的线性函数,斜率为a,截距为b。
2.2.4 最小二乘法直线拟合
作图法虽然在数据处理中是一个很便利的方法,但在图线的绘制上往往会引入附加误差,尤其在根据图线确定常数时,这种误差有时会很明显。为了克服这一缺点,在数理统计中研究了直线拟合问题(或称一元线性回归问题),常用一种以最小二乘法为基础的实验数据处理方法。由于某些曲线的函数可以通过数学变换改写为直线,例如对函数y=ae-bx取对数得lny=lna-bx,lny与x的函数关系就变成直线型了。因此这一方法也适用于某些曲线型的规律。
下面就数据处理问题中的最小二乘法原则进行简单介绍。
设某一实验中,可控制的物理量取x1,x2,…,xn值时,对应的物理量依次取y1,y2,…,yn值。我们假定对xi值的观测误差很小,而主要误差都出现在yi的观测上。显然如果从(xi,yi)中任取两组实验数据就可得出一条直线,但这条直线的误差有可能很大。直线拟合的任务就是用数学分析的方法从这些观测到的数据中求出一个误差最小的最佳经验公式y=a+bx。按这一最佳经验公式作出的图线虽然不一定能通过每一个实验点,但是它能以最接近这些实验点的方式平滑地穿过它们。很明显,对应于每一个xi值,观测值yi和最佳经验式的y值之间存在一偏差,我们称它为观测值yi的偏差,即
(2-39)
最小二乘法的原理就是:如各观测值yi的误差互相独立且服从同一正态分布,则当yi的偏差的平方和最小时,可得到最佳经验式。根据这一原则可求出常数a和b。
设以S表示的二次方和,它应满足:
(2-40)
式(2-40)中的各yi和xi是测量值,都是已知量,而a和b是待求的,因此S实际是a和b的函数。令S对a和b的偏导数为零,即可解出满足式(2-40)的a、b值:
即
其解为:
(2-41)
将得出的a和b代入直线方程,即得到最佳的经验公式y=a+bx。
上面介绍了用最小二乘法求经验公式中的常数a和b的方法,是一种直线拟合法。它在科学实验中的运用很广泛,特别是有了计算机后,计算工作量大大减小,计算精度也能保证,因此它是很有用又很方便的方法。用这种方法计算出的常数值a和b是“最佳的”,但并不是没有误差,它们的误差估算比较复杂。一般地说,一列测量值的大(即实验点对直线的偏离大),那么由这列数据求出的a、b值的误差也大,由此定出的经验公式可靠程度就低;如果一列测量值的
小(即实验点对直线的偏离小),那么由这列数据求出的a、b值的误差就小,由此定出的经验公式可靠程度就高。
为了检验实验数据的函数关系与得到的拟合直线之间的符合程度,数学上引进了线性相关系数r来进行判断。r定义为:
(2-42)
式中。r的取值范围为-1≤r≤1。从相关系数的这一特性可以判断实验数据是否符合线性。如果r很接近于1,则各实验点均在一条直线上。实验中r如达到0.999,就表示实验数据的线性关系非常良好,各实验点聚集在一条直线附近。相反,相关系数r=0或趋于零,则说明实验数据很分散,基本无线性关系。因此一般情况下,用直线拟合法处理数据时要计算相关系数,尤其是在绘制某仪器的工作标准曲线时,计算相关系数更为重要,因为它关系到所绘制的工作标准曲线的可靠程度。