1、一元回归分析,一元线性回归数学模型,例如:今有某品种大豆脂肪含量 X(%)与蛋白质含量Y(%),的测定结果如下表,试分析这些数据蕴含的关系。,将每一对观察值在同一直角坐标系中描出,得散点图如右:,从散点图看出, 与具有线性相关关系。,一般地,设随机变量 Y 与变量 X 有相关关系,作 次独立试验,得 n 对观测值:,用试验数据对作出散点图,若如下图,则显示 Y 与 X 有线性关系的趋势。,这里,,若每一确定的 ,有数学模型:,则称之为一元线性回归模型,可知,其中 是与 无关的常数,,在回归分析中,我们假定X非随机变量,没有测量误差,对每一确定的 ,建立数学模型:,(回归模型),即有,(回归方程
2、、经验公式),回归分析的任务是,找出回归方程,并检验方程有效与否,当方程有效时对 Y 的值作预测与对 X 作控制。,可知,(回归函数),由此得出变量 Y 与 X 的近似表达式:,最小二乘法,考察,我们希望求出的 能使 最小,分别求 对 的偏导,,并令各偏导为零,得方程组,可解得:,设 Y 与 X 的一元线性回归方程是,设 Y 与 X 的一元线性回归方程是,可得:,设 Y 与 X 的一元线性回归方程是,可得:,例1、为研究一种过敏新药的施药剂量 X 与过敏症状消除 时间 Y 的相关关系,对 10 个个体的临床试验数据如下 表,试确定其一元线性回归方程。,解:,所求线性回归方程,一般地,对测定出来
3、的数据,但变量 X 与 Y 是否真有线性相关的关系?,用最小二乘法总是可以求出一条回归直线:,也就是说回归直线方程有没有意义?有没有效?,一元线性回归方程的方差分析(F 检验),把 Y 的观测值的总离差平方和,分解成两部分:,即:,回归平方和,剩余平方和,反映了自变量 X 对随机变量 Y 的影响,,反映了试验误差和其它因素对 Y 的影响。,中,,我们就来检验这个假设。,若假设 H0 : 成立:则,若变量 X 与 Y 没有线性关系,即回归方程 中,记为,将 的自由度分别记作,显然有:,若假设 H0 : 成立:则,从而统计量,对给定的检验水平 ,,H0 的拒绝域为:,“拒绝”就是认为回归方程在很大
4、程度上是成立的,是有效的,或说 X 与Y 的线性相关关系是有统计意义的。,注意到:回归方程越有效的,SSE 就越小,从而 F 就越大。,总计,回归残差,F 比,均方和,自由度,偏差平方和,方差来源,B、D、F,一元线性回归的方差分析表,设有 n 组数据,则下列结论下确的是( )。,例1(续)为研究一种过敏新药的施药剂量 X 与过敏症状消除 时间 Y 的相关关系,对 10 个个体的临床试验数据如下表, 试确定其一元线性回归方程。设对于给定的 X,Y 为正态 变量,其方差与 X 无关。,解:,所求线性回归方程,选用统计量,对回归方程作方差分析:,检验假设 :,列出方差分析表:,所求线性回归方程,解
5、:. . . . . .,例2、某部门所属10个企业全员劳动生产率 与销售利润 的调查资料如下:,(1) 建立销售利润 与全员劳动生产率 变化的回归直线方程;,(2) 在显著性水平 下,检验回归直线方程是否有意义。,解:. . . . . .,回归平方和,剩余平方和,说明在 0.05 的检验水平下,此回归方程是有意义的。,因此回归直线方程为,一元线性回归方程的相关系数 R 检验,令,样本相关系数,则,显然有,|R| 越接近 1 ,则 Q 越小,X 与Y 的线性关系越密切。,设 H0 为 X 与 Y 没有线性相关关系的假设,,H0 的拒绝域为: ,(非双边检验),这时认为回归方程很大程度上是成立
6、的,是有效的,或者说 X 与Y 的线性相关关系是有统计意义的。,对给定的检验水平 ,,又因为 与 同号,当 R 0 时称 X 与 Y 正相关,,当 R 0 时称 X 与 Y 负相关。,F 检验与相关系数检验的联系:,F 越大,则|R| 越接近 1 。,一元线性回归方程的相关系数 R 检验,另外,有时 X 与 Y 未必呈现线性相关的关系,但可作适当的变换化为线性回归问题。 对 X 与 Y 关系的不同看法也许会得到多个不同的回归方程,这时可通过计算线性相关系数的办法求得最优者,系数越大者越优。,如果实测数据的散点图大致围绕下列某一曲线分布,可采取下列与之相应的变换化为线性回归问题。,1. 双曲线,
7、令 则得,2. 幂函数,可线性化的一元非线性回归分析,3. 指数函数,4. 负指数函数,可线性化的一元非线性回归分析,5. 对数函数,令 则得,6. S 型(Logistic)曲线,设 Y 与 X 的一元线性回归方程是,由 的取值状态估计 的取值范围谓之预测,,由对 的取值限制来确定 的取值范围谓之控制。,1. 点预测,对给定的 由 算出的 值为 的点预测值。,2. 区间预测,对给定的 由 求出 以置信度 的取值区间(置信区间)称作 的预测区间。,一元线性回归分析之预测与控制,考察统计量:,对给定的置信度 ,得 的预测区间:,即:,其中,例3、对例1,当 时,找出随机变量 Y 的置信度为 95
8、%,的预测区间。,解:,Y 的置信度为 95% 的近似预测区间为:,由线性回归方程得 Y 的点预测为,(所求线性回归方程 ),3. 的控制,对给定的置信度 ,若要使,令 ,解得,则 正是 所应被控制的范围。,一元线性回归分析之预测与控制,由 的近似预测区间:,令 ,解得,一般地,要求 的控制区间长度,例4、对例1,对给定的置信度为 95%,要求控制,试找出 的控制范围。,再见!,作业题,P222 1、2,P2221、,所求线性回归方程,对线性回归方程作方差分析,检验假设:,方差分析表,P2222、,所求线性回归方程,对线性回归方程作方差分析,检验假设:,方差分析表,总计,回归残差,F 值,均方和,自由度,偏差平方和,来源,F 值临介值,由此得:回归方程在检验水平 下有效的。,P2222、,线性回归方程,Y 的置信度为 95% 的近似预测区间为:,