1、回归直线方程的推导设 x 与 y 是具有线性相关关系的两个变量,且相应于样本的一组观测值的 n 个点的坐标分别是: 123(,),(,),()nxyx ,下面给出回归方程的推导。设所求的回归方程为 ba,其中 b是待确定的参数,那么:iiyx, ( 1,23,in ) ,样本中各个点的偏差是 ()iii, ( ,i )显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分, ,因此他们的和不能代表 n 个点与回归直线在整体上的接近程度,而是采用 n 个偏差的平方和 Q来表示 n 个点与相应直线(回归直线)在整体上的接近程度。即 2211()()ni iii iQyybxa 222
2、23()()nbxa ybxa求出当 取最小值时的 ,b的值,就求出了回归方程。(一) 先证明两个在变形中用到的公式:公式(1) 2211()nniiixx 其中 12nxx因为 222211()()()()ni ni 222nnxxx 2221)nxxx 221()n 21ni所以 2211()iii公式() 11()niiiixyxy因为 121()()()()nii ni xyxy 212(n nxyxyyx 12121()()ni nnxyxyyx 12121 nnni y 1nixyxy 1nixy所以 11()nniiiixxy(二)推导:将 Q的表达式的各项先展开,再合并、变形2
3、2221 3()()()()nQybxaybxaybxaybxa21221 ()()()nn -展开 2 2211111nnnniiiiiybxyabxa-以 a,b 为同类项,合并 2 2 211111()nniinnniiiyxabbxy-以 a,b 的次数为标准整理 22 2111()nnniiinyxxy-将数据转化为平均数 ,xy2222111()()nnniiiabby-配方法2222111() nnniiinyxnyxxb-展开2 22111()()()()nni i iabbyy-整理22 2111()()()()nnni iiii i inyxxx-用公式(一) 、(二)变形
4、22 2121 1()()()()niin nii ii iiixynaybxxby -配方222 2 2111 1()()()() ()nnii iin ni ii ii ii ii ixyxynaybxb y 在上式中,共有四项,后两项与 a,b 无关,为常数;前两项是两个非负数的和,因此要使得 Q区的最小值,当且仅当前两项的值都为 0。所以12()niiiiiaybxy或 12niiyxb-用公式(一)、 (二)变形得(三)总结规律:上述推倒过程是围绕着待定参数 a,b 进行的,只含有 ,ixy的部分是常数或系数,用到的方法有(1)配方法,有两次配方,分别是 a 的二次三项式和 b 的二次三项式;(2)变形时,用到公式(一) 、 (二)和整体思想;(3)用平方的非负性求最小值。(4)实际计算时,通常是分步计算:先求出 ,xy,再分别计算 1()niiixy, 21()niix或1nixy, 21nix的值,最后就可以计算出 a,b 的值。小练习:(1)验证当样本数据只有两个点时的回归方程;(2)当样本数据有三个点,是( 1,xy) , ( 2,) , ( 3,xy)时,试推导回归方程。