1、统计,第二章,2.3 变量间的相关关系,第二章,2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关,1在初中数学及数学必修1中,我们研究了两个变量之间的函数关系,变量之间的函数关系是一种确定性关系,当自变量x的值确定之后,都有唯一确定的y值与之对应,这种关系是一种理想的关系模型但现实生活中两个变量之间存在着另外一种关系,其中一个变量与另一个变量有关,但确定这个变量的因素不止一个,这种关系就是本节我们要学习的变量间的相关关系,学习这种相关关系要同变量间的函数关系区分开来,知识衔接,2已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是(
2、) A平均数中位数众数 B平均数中位数众数 C中位数众数平均数 D众数中位数平均数 答案 D,3某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名同学的分数登记错了,甲实际得80分却记成了50分,乙实际得70分却记成了100分,更正后平均数为_,方差为_ 答案 70 50,1相关关系 (1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的_性,那么这两个变量之间的关系,叫做相关关系 (2)两类特殊的相关关系:如果散点图中点的分布是从_角到_角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从_角到_角的区域,那么这两个变量的相关关
3、系称为负相关,自主预习,随机,左下,右上,左上,右下,归纳总结 两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系,直线,回归直线,距离的平方和,斜率,截距,破疑点 线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程因此在学习过程中,要重视信息技术的应用,1下列语句所表示的事件中的
4、因素不具有相关关系的是( ) A瑞雪兆丰年 B上梁不正下梁歪 C吸烟有害健康 D喜鹊叫喜,乌鸦叫丧 答案 D 解析 选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据,预习自测,规律总结 函数关系是一种确定性关系,相关关系是一种非确定性关系,判断两个变量间的关系是否为相关关系的关键是看这个关系是否具有不确定性,2观察下列散点图,正相关,负相关,不相关,与下列图形相对应的是( )A B C D 答案 D,规律总结 回归直线是对原数量关系的一种拟合,如果两个变量不具有线性相关关系,即使求出回归方程也是毫无意义的,而且由其得到估计和预测的值也是不可信的,(1)下列变量之间的
5、关系不是相关关系的是( ) A二次函数yax2bxc中,a,c是已知常数,取b为自变量,因变量是判别式b24ac B光照时间和果树亩产量 C降雪量和交通事故发生率 D每亩田施肥量和粮食亩产量,变量之间的相关关系的判断,互动探究,(2)现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系 探究 1.判断两个变量之间具有相关关系的关键是什么? 2利用散点图判断两个变量是否具有相关关系的依据是什么?,解析 (1)在A中,若b确定,则a,b,c都是常数,b24ac也就唯一确这了,因此,这两者之间是确定性的函
6、数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系故选A.,(2)两次数学考试成绩散点图如图所示,由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系因此,这10名学生的两次数学考试成绩具有相关关系 答案 (1)A,规律总结 两个变量x与y相关关系的判断方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响 (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法
7、:借助积累的经验进行分析判断 特别提醒 如果所有的样本点都落在某一函数曲线附近,那么变量之间就有相关关系,对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断( ),A变量x与y正相关,u与v正相关 B变量x与y正相关,u与v负相关 C变量x与y负相关,u与v正相关 D变量x与y负相关,u与v负相关 答案 C 解析 图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关,随着人们经济收入的不断增长,个人购买家庭轿车已不
8、再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如下的数据资料:,回归直线方程,解析 (1)列表:,有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童年数量,如下表:(1)画出散点图,并判定这两个变量是否具有线性相关关系;,误区警示,(2)通过计算可知这两个变量的回归直线方程为23.25x102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言
9、是否正确?,错因分析 在第(1)问中,是否具有线性相关关系,要看大部分点、主流点是否分布在一条直线附近,个别点是不影响“大局的”,所以可断定这两个变量具有线性相关关系在第(2)问中,381.15只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人,如果这个城市的污染很严重,有可能人数远远超过380,若这个城市的环境保护得得很好,则人数就有可能远远低于380.,(2012福建高考改编)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:,(2)设工厂获得的利润为L元,依题意得 Lx(20x250)4(20x250)20x2330x100020(
10、x8.25)2361.25. 当且仅当x8.25时,L取得是大值, 故当单价定为8.25元时,工厂可获得最大利润,1下列两个变量之间的关系: 角度和它的余弦值; 正n边形的边数与内角和; 家庭的支出与收入; 某户家庭用电量与电价间的关系 其中是相关关系的有( ) A1个 B2个 C3个 D4个 答案 A,2下列图形中两个变量具有相关关系的是( )答案 C,解析 A是一种函数关系,因为任给一个x都有惟一确定的y和它对应;B也是一种函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D中所有的点在散点图中没有显示任何关系,因此变量间是不相关的,答案 A,4现有5组数据A(1,3)、B(2,4)、C(4,5)、D(3,10)、E(10,12),去掉_组数据后,剩下的4组数据的线性相关性最大 答案 D,(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?,解析 (1)散点图,如图所示,