1、第七章 回归分析前几章所讨论的内容,其目的在于寻求被测量的最佳值及其精度。在生产和科学实验中,还有另一类问题,即测量与数据处理的目的并不在于获得被测量的估计值,而是为了寻求两个变量或多个变量之间的内在关系,这就是本章所要解决的主要问题。表达变量之间关系的方法有散点图、表格、曲线、数学表达式等,其中数学表达式能较客观地反映事物的内在规律性,形式紧凑,且便于从理论上作进一步分析研究,对认识自然界量与量之间关系有着重要意义。而数学表达式的获得是通过回归分析方法完成的。第一节 回归分析的基本概念一、函数与相关在生产和科学实验中,人们常遇到各种变量。从贬值辩证唯物主义观点来看,这些变量之间是相互联系、互
2、相依存的,它们之间存在着一定的关系。人们通过实践,发现变量之间的关系可分为两种类型:1. 函数关系(即确定性关系)数学分析和物理学中的大多数公式属于这种类型。如以速度 v 作匀速运动的物体,走过的距离 s 与时间 t 之间,有如下确定的函数关系:s=vt若上式中的变量有两个已知,则另一个就可由函数关系精确地求出。2. 相关关系在实际问题中,绝大多数情况下变量之间的关系不那么简单。例如,在车床上加工零件,零件的加工误差与零件的直径之间有一定的关系,知道了零件直径可大致估计其加工误差,但又不能精确地预知加工误差。这是由于零件在加工过程中影响加工误差的因素很多,如毛坯的裕量、材料性能、背吃刀量、进给
3、量、切削速度、零件长度等等,相互构成一个很复杂的关系,加工误差并不由零件直径这一因素所确定。像这种关系,在实践中是大量存在的,如材料的抗拉强度与其硬度之间;螺纹零件中螺纹的作用中径与螺纹中径之间;齿轮各种综合误差与有关单项误差之间;某些光学仪器、电子仪器等开机后仪器的读数变化与时间之间;材料的性能与其化学成分之间等等。这些变量之间既存在着密切的关系,又不能由一个(或几个)变量(自变量)的数值精确地求出另一个变量(因变量)的数值,而是要通过试验和调查研究,才能确定它们之间的关系,我们称这类变量之间的关系为相关关系。一般讲,多考虑一些变量会减少所考察的因变量的不确定性,但不是绝对的。应该指出,函数
4、和相关关系虽然是两种不同类型的变量关系,但是它们之间并无严格的界限。一方面由于测量误差等原因,确定性的关系在实际中往往通过相关关系表现出来。例如尽管从理论上物体运动的速度、时间和运动距离之间存在着函数关系,但如果我们做多次反复地实测,每次测得的数值并不一定满足 s=vt 的关系。在实践中,为确定某种函数关系中的常数,往往也是通过试验。另一方面,当对事物内部的规律性了解得更加深刻的时候,相关关系又能转化为确定性关系。事实上,实验科学(包括物理学)中的许多确定性的定理正是通过对大量实验数据的分析和处理,经过总结和提高,从感性到理性,最后才能得到更能深刻地反映变量之间关系的客观规律。二、回归分析的主
5、要内容回归分析(Regression Analysis)是英国生物学家兼统计学家高尔顿(Galton)在 1889年出版的自然遗传一书中首先提出的,是处理变量之间相关关系的一种数理统计方法。上面已经提到,由于相关变量之间不存在确定性关系,因此,在生产实践和科学实验所记录的这些变量的数据中,存在着不同程度的差异。回归分析就是应用数学的方法,对大量的观测数据进行处理,从而得出比较符合事物内部规律的数学表达式。概括地说,本章主要解决以下几方面的问题:1)从一组数据出发,确定这些变量之间的数学表达式 回归方程或经验公式。2)对回归方程的可信程度进行统计检验。3)进行因素分析,例如从对共同影响一个变量的
6、许多变量(因素)中,找出哪些是重要因素,哪些是次要因素。回归分析是数理统计中的一个重要分支,在工农业生产和科学研究中有着广泛的应用。当今在实验数据处理、经验公式的求得、因素分析、仪器的精度分析、产品质量的控制、某些新标准的制定、气象及地震预报、自动控制中的数学模型的制定及其他许多场合中,回归分析往往是一种很有用的工具。三、回归分析与最小二乘的关系回归分析是基于最小二乘原理,回归方程系数的求解,特别是一元线性回归方程的求解与最小二乘法有一定的相似性,两者主要不同的是,最小二乘法对研究事物内部规律的数学表达式经验公式,得到该公式待求参数估计量后,只对其精度进行评价,而不研究所拟合的经验公式整体质量
7、。回归分析求解回归方程系数后,还需进一步对所得的回归方程经验公式的整体精度进行分析和检验,以确定回归方程的质量水平,并定量地评价回归方程与实际研究的事物规律的符合程度,即进行回归方程的方差分析与显著性检验等。由此表明,最小二乘原理是回归分析的主要理论基础,而回归分析则是最小二乘原理的实际应用与扩展。它不仅研究一元回归分析,还有多元回归分析等内容。第二节 一元线性回归一元回归是处理两个变量之间的关系,即两个变量 x 和 y 之间若存在一定的关系,则可通过试验,分析所得数据,找出两者之间关系的经验公式。假如两个变量之间的关系是线性的就称为一元线性回归,这就是工程上和科研中常遇到的直线拟合问题。(1
8、 ) 回归分析研究的内容及应完成的任务 回归分析是处理变量间相关关系的一种数理统计方法,相关时变量之间不存在确定性的关系。回归分析是以数理统计方法为工具对大量测量数据进行数据处理以求得一个比较符合变量客观实际规律的表达公式。换句话说,就是从已获得的数据里,寻求或设想出一个函数 (x)来逼近未知的函数 y(x),且其效果呈现为最佳。(2 ) 回归直线 变量中的因变量与自变量是回归直线制定者对变量深入了解后自行拟定的,一般说来,自变量 x 是易于测定且可精确测定(x 误差一般可忽略)的量,x 称受控情况。纵坐标 y 表示具有某种性质的量,称因变量。将测量后的 N 对点(x i,y i),i 1,2
9、,,N ,直接作图后,观其大致走向,测量者考虑成熟后,划出一条直线(实验点一般都不在该直线上) 。这条直线在统计学上称作回归直线。(3 ) 最佳回归直线 最佳回归直线,画出什么样的直线才是最佳的直线呢?仅凭直官感觉很难作出判断,因为画出的直线具有很大的主观性,较好的处理方法是用最小二乘法来判别,即用二乘原理对数据进行回归分析后所确定的回归方程,该方程对所有实验点剩余误差平方和呈现最小,是最佳的回归直线,其意义是在二乘意义上的最佳。(4 )一元线性回归的数学模型y 与 x 的函数真关系为 ,x 属受控情况。测量 N 次后,y 理应得到xy0,但经实际测量后,y i 与 xi 的关系却以相关关系体
10、现出来,即iixy0式中 1, 2, N 表示由于随机因素对 yi 值测量结果的总效应(误差) 。现在的问题是:恰当地选取 0, 1 值,使各直接测量值与回归直线值的差方和为最小。显然,根据最小二乘原理建立起来的回归方程应是最佳的选择,应是能够反映各实验点客观情况的。回归分析在实验后的数据处理,实验方程的确定,因素分析,标准的制订,仪器的定标及产品质量控制等方面,有着广泛的应用。其他如气象、地震的预报、自动控制中数模的建立等,回归分析也是一种常用的方法。(一)一元线性回归1、 定义一元回归是处理两个变量之间的关系,自变量只有一个,故称一元回归。若两变量间呈线性关系时,则称一元线性回归。2、 回
11、归系数 b0,b 的计算若 y= 0+ x,经 N 次测量后存在如下结构,即yi= 0+ xi+ i, i=1,2,N假设 b0,b 分别是 0 与 用最小二乘原理求得之最佳值,则一元线性回归方程是b0, b 称回归方程的回归系数,每一 xi 都可由上式求得其回归值 ,直接测量的 yi 值与iy存在着一定的误差剩余误差,即iyiib0上式描述了全部测量值 yi 与回归值 之间的偏离程度,令全部 yi 与 偏离程度的平i 方和称作差方和或剩余误差差方和,用 Q(b 0,b)表示,即回归系数 b0,b 应这样选择:使 Q(b 0,b)为最小时所求得之值,即由 中可以得到0bQ由 中可以得到 0bQ
12、将 b0 代入上式后,则可得到由上述讨论可以得出结论:回归系数 b0,b 的计算,可由样本统计量 , 及测量值xyxi,y i 求得,其计算过程很有规律并可使之规格化。3、回归系数规格化计算表回归系数的计算是二乘运算规律的计算,为使其有序进行且易于检查,可制作规格化表,该表也不过是二乘运算的另外一种计算方式。令于是,回归系数又可写成 bxylxby00回 归 方 程 则 为 ,可以看出, ,说明 一定通过 点,记yi 时 , 则当 ),(yx住它很有必要,因为再取任一对点(x 0,y0)或(x N,yN) ,回归直线的配制便完成了。最小二乘的运算也就是最小差方和的运算,计算方法在前面已研究过了
13、,不过本章中的书写格式、运算程序方面与系数列表法不同,但计算结果是完全相同的,回归分析时若采用本章中的规格化计算方法,对回归系数的计算、精度分析、显著性检验等方面,都具有灵活、方便的优点。4、 回归分析研究的内容(1 )根据测量数据,配制回归方程。(2 )配制出的回归方程有无指导性实践意义,可信赖程度如何,须进行统计检验。(3 )在众多的影响因素里,判断出哪个因素的影响是显著的,使对 y 有影响的变量不遗漏,而对 y 影响不显著的因素或变量不参与到回归方程中去,这就涉及到最优回归选择的问题了。(4 )研究回归方程,可对产品质量进行预报和控制。(5 )寻求试验点少且具有较好统计性质的回归设计方法
14、。本章主要研究前 4 项内容。二、回归方裎的精度分析方差分析(一)回归方程的特点(1 ) 点 。),(一 定 通 过y所 以 回 归 直 线 ,时当回 归 直 线 00yxyxbb(2 )按最小二乘原理配制出的回归直线,实际上并不通过各试验点,各试验点玄或戈对夕!值的剩余差方和仍属最小。因此,夕是一条最佳、最可信赖的一条直线,夕最能反映所有试验点的客观实际情况。(二) 回归直线的因素分析1、为什么要进行因素分析回归方程中变量 y 与 x 的关系是相关关系,知道 x 值后并不能准确地计算出 y 值。那么回归方程建立后,根据自变童 x 值如何预报 y 值呢,预报的效果如何?也就是说,该回归直线预报
15、的把握性、精度究竟如何呢?这需要对 x,y 进一步分析,看看 y 与 x 是否确实存在线性关系还是其他关系。换句话说,应对该回归直线进行统计性检验。 2、导致 y 产生差异的因素(1 )试验点 x 取值不同时 y 值亦不同,这是 y 与 x 内部规律性引起的现象。(2 )其他因素的影响,包括测量时随机误差的影响,x 对 y 的非线性影响。欲检验出哪一因素是主要的,就必须把它们引起的差异(变差)从 y 的总差异(总变差)中分解出来。3、差方和的分解S 总 ,u 回 及 Q 剩(1 )总差方和 S 总定义 N 个测量值 yi 之间的差异,可用测量值 yi 与其算术平均值 偏差的平方和来表示,y称作
16、总的偏差平方和,简称总差方和,记作 S 总 。计算公式 S 总 的计算公式将 s 总的计算公式展开后,可得回归直线的正规方程应满足故知上式 x 与 y 的交叉项中为这样,就将 S 总 中分解成了两部分,即(2 )回归差方和 u 回定义 N 个回归值 之间的差异,可用 与平均值 的偏差平方和来表示,称作回归偏iyiy差平方和,简称回归差分和,记作 u 回 。含义 当 xi 取值不同时, y 与 x 内部确实存在着线性关系,故而引起 y 的变化。因此,u 回就是考虑了 y 与 x 之间线性相关部分在总差方和中所占的比重。这样,u 回 便从数量与 Q 剩区分开来了。计算公式由于 b=lxy/lxx,
17、故所以 u 回 值又可写成(3 )剩余差方和 Q 剩定义 Q 剩 是所有测试点 yi 与回归值 的偏差平方和,简称剩余差方和,记作 Q 剩 。i含义 Q 剩 是排除了 x 对 y 线性因素影响之外,其他一切因素的影响,它包括实验时的随机误差及其他尚未控制的因素等引起对 y 的变差,它的大小反映了实验误差及其他尚未能控制因素(线性因素除外)对实验测量结果的影响,其数值的大小,决定了回归效果的优与劣。(4 )计算公式小结上述三种差方和,可由规格化形式 lyy,lxx,lxy 来表示,运算过程中完全可用回归系数计算时的某些计算结果,十分方便。三、自由度分解定理每一差方和(S 总 ,u 回 ,Q 剩
18、)都是 2 变量,都有一个与自身的 “自由度”相联系。如果某差方和是由几部分的差方和组成的,则总的自由度就等于各部分的自由度之和。现今,总的差方和在数值上已分解成回归差方和与剩余差方和,则总的差方和的自由度 fs 就应等于回归差方和的自由度 fu 与剩余差方和的自由度 fQ 之和。即f3=fu+fQ在一元线性回归分析中:S 总 是由 N 个实验点 yi(或 Mi)与平均值 比较后的平方和y来评定的,故其自由度为 N-1;S 回 仅受线性因素的影响,其自由度为 1;由自由度分解定理可知,Q 剩 的自由度为 N2 。4、剩佘方差 定义:某差方和除以自身自由度就是某方差。据此可知,Q 剩 除以(N
19、2 )后的商,就是剩余差方和的方差,记作 ,由此可知Q2剩余方差 的大小可以看成是在排除了 x 对 y 的线性因素后,衡量 y 值随机波动特性Q2大小的一个估计值。换言之, 的大小是评定所有随机因素(线性因素除外)对 yi 任)(Q一次测量结果离散程度大小的一个量度,其数值为回归效果的优劣取决于 u 回 在 S 总 中所占的比重,u 回 与 S 总 值愈接近愈好,这时的 Q 剩值就会很小, 小时回归效果优良。)(Q例 101 依据播种后小麦发芽后的基本苗数进行产量预报的数学模型的建立问题:在探索小麦增产过程中,总结出一种根据小麦基本苗数估计小麦成熟期有效穗数的方法,进而可预报产量,某年某生产队
20、在五块实验田里进行对比试验,在同样施肥及管理水平条件下,取得如下数据,试确定其回归方程。解 将基本苗数 xi 作横坐标,有效穗数 yi 作纵坐标,直接作图后可以发现:各数据点大致落在一条直线附近,变量 y 与 x 之间的关系大致可看作是线性关系;各数据点又不都在一直线上,这表明 x 与 y 的关系并没有确切到给定 x 就可唯一地确定 y 的程度。事实上,还有其他因素对 y 值产生影响。诸如气候的影响,月平均温度、湿度、降雨量等等,它们都是影响 y 取什么值的随机因素,诸因素中,基本苗数 xi 是影响有效穗数 yi 的主要因素,可以假设有如下的结构形式 Nixii ,210上式称作一元线性回归的
21、数学模型, 0 与 是待定常数。 1, 2, N 分别表示其他因素对有效穗数 yi 影响的总和,一般假设它们是一组相互独立且服从同一正态分布n(0 , 2)的随机变量,即满足E( )=0D( )= 2变量 x 可以是随机变量也可以是一般变量,本节只讨论它是一般变量情况,即 x 是可以精确测量、严格可控的变量(其误差可忽略不计) 。解法 1 利用已学过的知识 系数列表法,对回归方程中的 b0,b 值求解,见表 10.1。列出求解两待求量的正规方程为解法 2 利用规格化计算公式,有应该指出,配制出的回归方程 是在五块试验田、播种量为xy294.034(2545 )斤/亩范围内得出的结果,播种量为
22、100 斤/亩甚至 1000 斤/亩并未提及,若将该回归方程推广到试验田之外,将会冒很大风险,甚至会得出谬误的结论。b=0.2924 表明每增加一亩地,增加的基本苗数为 0.2924 万株。四、 回归方程的显著性检验回归方程 建立后:如果 x 与 y 不存在线性关系,那么在数学模型bxy0中的一次项系数 应等于零,即 0;如果 y 与 x 存在线性关系,ii0那么, 0。所以,检验 x 与 y 是否存在着线性关系,归根到底是检验 是否为零的问题。而这一点可通过比较 u 回 与 Q 剩 来实现。现已知:s 总 2(N1) ,u 回 2(1 ) ,Q 剩 2(N 2 ) ,且其自曲度的关系为 fs
23、=fu+fQ,故知 u 回 与 Q 剩 之间必相互独立。于是在 =0 条件下,就定义了一个新的统计量,即 QuF/剩回对于一元线性回归,则有 2,12-N1剩 回 NF其中,F(1,N 2)表示第一自由度为 1,第二自由度为(N2)的 F 分布。2、一元线性回归方程的 F 检验在假设 0 条件下建立的 F 变量,在给定的显著水平 下,统计量 F 应有),P这表明事件“F 大于 F(1,N2) ”是个小概率事件,它在一次试验中不应发生。若由测量披据里计算后获得的 F 值确实大于 F (1,N2)值,则说明原“假设 0”不能成立,这意味着线性回归模型中 x 的一次项 是必要的,是不可缺少的,这时,
24、称该回归方程在 水平上是显著的。反之,如果计算后的 F 小于 F (1,N-2)时,原假设 0 成立,说明 x 与 y 线性关系不显著,计算结果可归纳如下:(1 )若 FF 0.01(1,N-2)时,认为是高显著度的,或称在 1显著水平上显著.(2 )若 F0.05(1,N-2)FF 001(1,N-2)时,则称是中等显著度的,或称在 5显著水平上显著,(3 )若 F0.10(1,N-2)FF 0.05(1,N-2)时,称是低显著的,或称在 10显著水平上显著。 (4 )若 FF 0.10(1 ,N-2 )时,则认为 x 与 y 没有明显的线性关系,所配制的回归方程不显著,说明 x 与 y 的
25、线性关系不密切。由此可知,所配制回归方程为 xbxy087.9140列出其回归方程的方差分析表,见下表。由于 ,所以吸光度与硼的浓度之间的相关关系是高2.14,10.201.2FF显著的。例 10 6 某地区为了探求山上积雪融化后对下游灌溉的影响,在山上建立了一个观测站,测量了最大积雪深度(x)与当年灌概面积(y )之间的关系,得到连续 10 年的数据,见下表。试建立其回归方程。解 (1)直接作图后,观其大致走向为了研究数据间蕴含的规律性,把各年最大积雪深度作横坐标,相应的灌溉面积作纵坐标,将这些数据点画在直角坐标纸上,如图所示,该图又称作散点图。观之,近于一条直线,故可用 作其数学模型。ii
26、xy0(2 )计算回归系数 b0,b 值所配制出的回归方程为图画出了该回归方程的直线,可以看到 与 10 个测量数据点都很接近。y对回归方程显著性的 F 检验五、重复试验情况回归方程拟合优劣的评定一、 重复试验的必要性应该指出,用剩余差方和检验回归差方和所作出的“回归方程显著性”这一判断,只是说明相对于其他因素及试验误差来说,因素 x 取值不同时一次项系数 对指标 y 的影响是主要的,说明 S 总 中 u 回 占的比重是主要的,但它并没有说明影响 y 除 x 因素外是否还有一个或几个不可忽略的其他因素也影响 y。换言之,在 FF (1,N-2)下的显著性并不表明这个回归方程拟合得是很好。原因在
27、于,在 Q 剩 中除实验误差外,还包含 x 与 y 线性关系以外的其他尚未控制因素的影响。为了检验一个回归方程拟和得是好还是差,还需作一些童复性的试验,用误差平方和对“失拟差方和”进行 F 检验,就可以确定该回归方程拟合程度上的好与差。二、重复试验的最简单情况重复试验可以对部分试验点进行,也可以对全部试验点进行,对部分试验点进行重复试验时,又可以对一个或几个试验点进行重复试验。由最简单情况人手,假设仅对 N 号试验点进行了 m 次重复试验,得到(N+m-1)个数据,即其中前(N-1)个试验点没有重复,后 m 个试验是在第 N 号试验上重复的。记 为这(N+m-1) 个数据的算术平均值。y1、各
28、种差方和及其自由度对这(N+m-1)个数据,可以分别求出各种差方和及自由度,即此外,在 N 点重复的 m 个数据,可算出其误差平方和,即 的 算 术 平 均 值 。,是 121mNNNyy如前所叙,剩余差方和反映了试验误差与其他尚未能控制的因素的影响。可以设想,QL 就只反映了其他未能控制的因素的影响,Q L 称作失拟差方和,用 QL 评定回归方程拟合得好与差的程度,这时总的差方和为 EL回总 QuS2、用统计量 F1 和 F2 进行显著性检验类同 F 检验时所做的那样,可以证明在“假设 =0”成立的条件下 )1()/(,2)/(,)/( 22回 mQNEL 并且它们之间相互独立,于是可以用统
29、计量来检验回归方程拟合得是好还是差。(1 )在给定显著水平 下,如果计算值 F1F (f L,f E) ,说明 F 检验结果不显著,表明失拟差方和基本上是由试验误差等随机因素引起的,这时可把 QL 与 QE 合并用来检验 u 回 ,即如果第二次 F 检验的结果显著,那么就称该回归方程拟合得好,如果 F2 检验结果不显著,那么这时有如下两种可能:有什么因素对 y 有系统的影响;试验误差过大。当然,这时所求得的回归方程是不够理想的。(2 )在给定显著水平 下,如果计算值 F1F (f L,fE) ,即第一次 F 检验结果显著,则说明在失拟差方和中除含有试验误差影响外,还有其他一些因素的影响,这时有
30、如下几种可能: 响 y 的变化除 x 因素外,至少还有一个不可忽略的因素;y 与 x 是曲线关系,不是直线关系; y 与 x 线性无关。这时,即使用 QE 对 u 回 进行第二次 F 检验的结果显著,表明所得的一元线性回归方程仍有一定作用,但也不能说该方程拟合得是好的,仍需要查明原因,或改变数学模型,作更进一步地研究。三、 对全部试验点进行重复试验情况 下面研究对全部试验点进行重复试验时的参数估计及统计检验问题。1、回归方程的建立如果对全部 N 个试验点各进行 m 次重复试验,共获得 Nm 个数据,这 Nm 个数据的结构形式是其中 i 是相互独立且服从同一正态分布 n(0, 2)的一组随机变量
31、。 在重复试验情况下,同样可用最小二乘法求得参数 0, 的最小数点二乘估计值,只不过公式的表现形式略有不同罢了。可以看出,只要把 yi 用 y 代替,就可得到上式,这就是说,用每个试验上的算术平均值所配制出的回归方程与用原来的 Nm 个测量值配制出的回归方程是完全一致的。例 10 7 合成纤维抽丝工段第一导丝盘的速度,对纤维质量是个重要参数。今发现它和电流频率(周波)有密切关系,由生产记录得试问,x 与 y 能否建立回归方程?解 将数据点标在直角坐标纸上,如图所示。从图上可以看出,近于一条直线,其数学模型结构形式为回归方程可由规格化计算表建立,见下表。2、总差方和的分解及其自由度为了对该回归方
32、程进行统计检验,就应把总差方和,即进行如下分解上式等号能够成立,皆因所有交叉项乘积之和均为零的缘故。其中回归差方和为U 回 是由于 x 的变化而引起 y 的变化,故称作回归差方和。误差差方和为QE 反映了重复试验所引起的 y 的变化,故称作误差差方和。当 m=2 时,Q E 可用下式计算( )21yy失拟差方和为QL 是由于其他各种未能控制原因引起的 y 的变化,称作失拟差方和。综上所叙,总差方和分解公式为3、用统计 F1 及 F2 进行显著性检验在所有试验点都进行 m 次重复试验下,回归方程的统计检验可按如下步骤进行。(1 )第一步:首先作统计量 )1(,2/NfQEL用误差差方和对失拟平方
33、和进行 F 检验。在给定显著水平 下,如果有 ,说明失拟不显著,失拟1,21mNF平方和 QL 基本上是由试验误差因素引起的,这时可把 QL 和 QE 合并,并用来检验 u 回 。(2 )第二步:作统计量 2,1/回 NmffuFELEL 将失拟差方和与误差差方和合并在一起后检验回归差方和。(3 ) F 检验后几种可能出现的情况在给定 条件下有 ,说明失拟不显著,失拟差方和 QL 所占1,21mNF的比重不大,基本上是由随机试验误差引起的,此时可将 QL 与 QE 合并起来检验 u 回 ,就是用剩余误差检验回归方差。若 时,说明 是显著的,该回归方程 拟合Quf2yy得令人满意。当 情况时,表
34、明配制的 不够理想,尽管QuELFfF,21 ,失拟情况并不显著,但由于 ,说明中 引人 x 的一次QufF,2y项系数没有多大作用,故回归效果不显著,拟合得自然不会理想; 时,表明在给定 条件下,第一次 F 检验结果失拟QuELfFfF,21显著,说明在 QL 中除试验误差外,还存在着其他因素的影响,需查明原因,作进一步研究。这时,即便是 )检验后的效果显著,所配制出的回归方程还是有一定指Qu2导意义的,但不能说该回归方程拟合的效果是好的。 时,表明失拟差方和所占的比重很大,同时又说明QuELfFfF,21中引人 x 的一次项系数没有多大作用,也可能是变量中不存在对 y 有显著影响的因素,y
35、所配制出的回归方程没有实践意义。精密测量中,通常以失拟平方和与仪器的原理误差相对应,因此可用上述检验方法对仪精密度进行分析,了解误差来源及采用何种措施以提高精度,无疑是会有很大帮助的。事情总是一分为二的,重复试验也会受时间、设备、经费等条件的制约,有时重复试验甚至是不可能的,这时就只能用 Q 剩 对 u 回 进行检验了。应当注意,回归方程拟合后的优与劣的真正含义应是 F1,F2 检验的全部内容,而不仅是 Q 剩 对 u 回 作 F 检验这一单一结果。例 10 8! 试对例 108 所建立的回归方程 作 F 检验。 xy34.01827解:将测量数据列成回归直线计算表格,见下表。为了对回归方程进行统计检验,须先计算出各类差方和,即 用误差平方和对失拟平方和进行 F 检验,即检验结果说明:失拟差方和基本上是试验误差等随机因素引起的。于是,可把失拟差方和与误差差方和合并对回归差方和再进行 F 检验,即96.410,26.784/0251.4387/ 5.回2 FfQuFELEL 由于 ,检验结果表明:一元线性回归数学模型与测量的1,6405.205.1F数据拟合得是很好的。