1、10.4变量间的相关关系、 统计案例,-2-,知识梳理,双基自测,2,3,4,1,5,自测点评,1.两个变量间的相互关系变量与变量之间的关系常见的有两类:一类是确定性的 关系,另一类是带有性的相关关系.,函数,随机,-3-,知识梳理,双基自测,自测点评,2,3,4,1,5,2.相关关系的分类(1)正相关:如果一个变量的值由小变大时,另一个变量的值也,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.,由小变大,-4-,知识梳理,双基自测,自测点评,2,3,4,1,5,3.散点图在一个统计数表中,为了更清楚地看出x和y是否有相关关系,常将x
2、的取值作为横坐标,将y的相应取值作为纵坐标,在直角坐标系中描点(xi,yi)(i=1,2,n),这样的图形叫做散点图.,-5-,知识梳理,双基自测,自测点评,2,3,4,1,5,4.回归分析对具有的两个变量进行统计分析的方法叫做回归分析.其基本步骤是:()画散点图;()求;()用回归直线方程作预报.(1)回归直线:如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,相关关系,回归直线方程,一条直线,-6-,知识梳理,双基自测,自测点评,2,3,4,1,5,中心,-7-,知识梳理,双基自测,自测点评,2,3,4,1,5,(3)相关性检验计算相关系
3、数r,r有以下性质:|r|1,并且|r|越接近1,线性相关程度;|r|越接近0,线性相关程度;,表明有95%的把握认为变量x与Y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.,越强,越弱,|r|r0.05,-8-,知识梳理,双基自测,自测点评,2,3,4,1,5,5.独立性检验22列联表:(1)其中n1+=n11+n12,n2+=n21+n22,n+1=,n+2=,n=.,n11+n21,n12+n22,n11+n21+n12+n22,2,-9-,知识梳理,双基自测,3,4,1,5,自测点评,答案,1.下列结论正确的打“”,错误的打“”.(1)相关关系与函数关系都是一
4、种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)若事件X,Y的关系越密切,则统计量2的值越小,“X与Y有关联”的把握程度就越大.(),-10-,知识梳理,双基自测,自测点评,2,3,4,1,5,答案,解析,-11-,知识梳理,双基自测,自测点评,2,3,4,1,5,3.(2017辽宁葫芦岛一模)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元): 由表可得到回归方程为 ,据此模型,预测广告费为10万元时的
5、销售额约为()A.101.2万元B.108.8万元C.111.2万元D.118.2万元,答案,解析,-12-,知识梳理,双基自测,自测点评,2,3,4,1,5,4.高三年级267名学生参加期末考试,某班37名学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.,答案,解析,-13-,知识梳理,双基自测,自测点评,2,3,4,1,5,答案,解析,-14-,知识梳理,双基自测,自测点评,1.若散点图上的点大致分布在某条
6、直线附近,整体上呈线性分布,则这两个变量具有很强的相关关系.2.统计量2的值越大,“X与Y有关联”的把握程度越大.3.注意回归分析时对应的结果均是估计值,不要误认为是真实值.4.要理解回归直线方程中的参数是用最小二乘法得出的,目的是使距离的平方和最小,不是看具体某一个距离的大小,这样使用求平方和也避免了讨论绝对值和正负问题.,-15-,考点1,考点2,考点3,例1(1)(2017河南洛阳模拟)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线
7、性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值,-16-,考点1,考点2,考点3,(2)甲、乙、丙、丁四名同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪名同学的试验结果体现A,B两个变量有更强的线性相关性()A.甲B.乙C.丙D.丁思考如何判断两个变量有无相关关系?,答案,解析,-17-,考点1,考点2,考点3,解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,
8、这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,两个变量的相关性就越强,相关系数就是描述相关性强弱的.,-18-,考点1,考点2,考点3,对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r16.635,所以有99%的把握说,该地区的老年人需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两
9、层并采用分层抽样方法比采用简单随机抽样方法更好.,-32-,考点1,考点2,考点3,解题心得独立性检验就是考察两个分类变量是否有关系,利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测,并能较为准确地给出这种判断的可信度;具体做法是根据公式 ,计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.,-33-,考点1,考点2,考点3,对点训练3某学校为了研究学情,从高三年级中抽取了20名学生三次测试的数学成绩和物理成绩,计算出了他们三次成绩的平均名次如下表:,-34-,考点1,考点2,考点3,学校规定平均名次小于或等于40.0为优秀,大于40.0为不优秀.(1
10、)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,求这2名学生数学和物理都优秀的概率.(2)根据这次抽查数据,列出22列联表,并判断能否有95%的把握说,物理成绩和数学成绩有关.附:,-35-,考点1,考点2,考点3,解 (1)在序号为1,2,3,4,5,6这6名学生中随机抽取2名,共有15种情况,数学和物理都优秀的有4名学生,从中随机抽取2名有6种情况.因此这2名学生数学和物理都优秀的概率为,-36-,考点1,考点2,考点3,(2)根据条件列出列联表如下:因此根据这次抽查数据可知,有95%的把握说,物理成绩与数学成绩有关系.,-37-,考点1,考点2,考点3,2.回归分析是处理变量相
11、关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.3.根据2的值可以判断两个分类变量有关的可信程度,并用来指导科研和生活实际.,-38-,考点1,考点2,考点3,1.相关关系与函数关系的区别相关关系与函数关系不同,函数关系中的两个变量之间是一种确定性关系.例如正方形面积S与边长x之间的关系S=x2就是函数关系.相关关系是一种非确定性关系.例如商品的销售额与广告费之间的关系是相关关系.两个变量具有相关关系是回归分析的前提.2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.,