1、2.3变量间的相关关系,一、变量之间的关系,1.确定关系 当一个量确定,另一个也确定下来时,称两个变量是确定关系。,(1)龙生龙、凤生凤、老鼠儿子打地洞(生物意义上解释) (2)y=2x+1中,y与x的关系 (3)三角形三边长与三角形面积的关系,特殊确定关系:函数关系 我们学过函数,知道两个变量之间的关系有函数关系,有时可以用明确关系是表达出来。,一、变量之间的关系,2.相关关系 两个变量是有关联的,但关系不确定,这样的关系称为相关关系。,(1)公鸡打鸣与太阳升起(2)数学成绩与物理成绩(3)父亲和儿子的身高体重,著名案例:吸烟与肺癌有关? 两个变量是有关联的,但关系不确定。 1.现象之间确实
2、存在着数量上的依存关系 2.现象之间数量上的关系是不确定、不严格的依存关系。,由于相关关系的不确定性,在寻找变量之间的相关关系的过程中,统计发挥着重要作用。我们可以通过收集大量的数据,在对数据分析统计的基础上,发现其中的规律,对它们之间的关系做出判断。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析就是寻找相关关系中非确定关系的某种确定性。,二、回归分析,线性相关最简单的相关关系,在一次对人体脂肪含量和年龄关系的研究,获得了一组样本数据:,其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.,思考1:年龄与脂肪含量有没有关系?依据是什么?思考2:有没有更加定量
3、的分析方法,进行定量研究?,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图,上例中散点图从左下角到右上角,即一个变量从小到大变化时,另一个变量小大到大变化。这种关系称为正相关关系。否则称为负相关关系。,三、散点图,但有的两个变量的相关,如下图所示:,如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。作出散点图发现,它们散布在从左上角到右下角的区域内,称它们成负相关.,练习:下列图形中两个变量具有相关关系的是( ),C,思考:当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?,这些点大致分布在一条直线附近, 像这样如果散点图中的点的分布从整体
4、上看大致在一条直线附近我们就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线, 这条直线的方程叫做回归方程,怎么求回归直线方程呢,人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:,人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:,A,B,人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:,距离之和:,越小越好,人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:,点到直线距离的平方和:,取最小值,人们经过长期的实践与研究,已经找到了计算回归方程的较为科学的方法:,以上公式的推导较复杂,故不作推导,这一方法叫最小二乘法。,
5、回归方程为,符号说明及思想,最小二乘法,上述方法称为最小二乘法回归直线方程是否过定点?你知道是哪个点吗?,线性回归方程计算步骤,第一步,计算平均数第二步,求和 第三步,计算第四步,写出回归方程,高考不允许使用计算器,为了减少计算错误,建议采用列表的方式分步计算,思考:当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?,解:1、设回归方程,2、列表,3、计算,4、代入公式求 的值,5、写出回归直线的回归方程,关于回归方程的几点思考,如果给出了 ,当某人37岁时, 代表什么?能不能说,当我到了37岁时,体内脂肪含量一定是20.90%?如果随便给出任意关系的两个变量的一组数据,能否也用上述方法
6、求出回归直线方程?有没有意义?,求回归直线方程的步骤,2、列表,3、计算,4、代入公式求 的值,5、写出回归直线的回归方程,1、设回归方程,例1、有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:,1、从散点图中发现气温与热饮销售杯数之间关系的一般规律;2、求回归方程;(已知: )3、如果某天的气温是2摄氏度,预测这天卖出的热饮杯数。,x,y,解:1、各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。2、回归方程为:,3、当x=2时, 因此,某天的气温为2摄氏度时,这天大约可
7、以卖出143杯热饮。,练习:,实验测得四组(x,y)的值如下表所示:,则y与x之间的回归直线方程为( )(参考数值: ),A,总结提升:,基础知识框图表解,变量间关系,函数关系,相关关系,散点图,线性相关,线性回归方程,课堂检测:,1、对变量x,y观测数据(xi,yi)(i=1,2,.,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,.,10),得散点图2,由这两个散点图可判断( ),图1,图2,A、变量x与y 正相关,u与v正相关;B、变量x与y 正相关,u与v负相关;C、变量x与y 负相关,u与v正相关;D、变量x与y 负相关,u与v负相关;,C,课堂检测:,2、某市居民2005-2009年家庭平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表:,家庭年平均收入与年平均支出有 线性相关关系?,正,课堂检测:,3. 假设关于某种设备的使用年限x和支出的维修费用y(万元) 有以下的统计资料,(1)求支出的维修费用y与使用年限x的回归方程;(2)估计使用年限为10年时,维修费用是多少? 参考数值:,约为12.38,备选练习:,已知变量x与变量y有下列对应数据:,则y对x的回归直线方程为,