1、典题精讲【例 1】下列五个命题,正确命题的序号为_.任何两个变量都具有相关关系圆的周长与该圆的半径具有相关关系某商品的需求量与该商品的价格是一种非确定性关系根据散点图求得的回归直线方程可能是没有意 义的两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究思路解析:变量的相关关系是变量之间的一种近似关系 ,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系.例如,中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效的方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的.答案:绿色通道:相关关
2、系是一种不确定关系,但是它们之间也有一定的规律,根据回归分析可以对它们之间的关系进行估计.变式训练 两个变量之间的相关关系是一种 ( )A.确定性关系 B.线性关系C.非线性关系 D.可能是线性关系也可能不是线性关系思路解析:变量之间的相关关系是一种非确定性的关系 ,如果所有数据点都在一条直线附近,那么它们之间就是一种线性相关关系,否则不是线性相关关系.答案:D【例 2】为了考察两个变量 x 和 y 之间的线性相关性,甲、乙两个同学各自独立地做了 10次和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1 和 l2.已知两个人在试验中发现对变量 x 的观测数据的平均数都为 s,对变
3、量 y 的观测数据的平均数都是 t,则下列说法正确的是( )A.l1 与 l2 有交点(s,t) B.l1 与 l2 相交,但交点不一定是(s,t)C.l1 与 l2 必定平行 D.l1 与 l2 必定重合思路解析:回归直线 =a+bx 中的系数 ,所以,方程又可以写成: .显yxbyabxy然,当 x= 时,y= ,所以,回归直线一定通过定点( ).这里的 =s, =t,也即是说,所得回x x归直线方程恒过点(s,t),所以 ,l1 与 l2 有交点(s,t ) ,但是考虑到一般数据之间是有误差的,所以,不一定重合.答案:A黑色陷阱:回归直线是对相关关系的一种估计关系式,由于相关关系的不确定
4、性,实际上这些点不一定都在回归直线上.否则就会因为不理解相关关系的含义而导致错误.变式训练 “回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高 y 与父亲的身高 x 的回归方程 y= 中, ( )xy101A.在(-1,0)内 B.等于 0C.在(0,1)内 D.在1,+)内思路解析:根据遗传的含义,子女的身高应该逐渐接近父亲的身高,也就是一种正相关关系,所以, 应是一个正值,又子女的身高逐渐回归到父亲的身高,所以, r0.05,这说明数学入学成绩与高一期末成绩之间存在线性相关关系.设线性回归方程为 y=
5、a+bx,在两组变量具有显著的线性关系情况下:b= =0.765 56,a= =22.410 67.xyLxby因此所求的线性回归方程是 y=22.410 67+0.765 56x.(3)若某学生入学数学成绩为 80 分,代入上式可求得 y84 分,即这个学生高一期末数学成绩预测值为 84 分.绿色通道:回归直线是对相关关系的一种估计关系式,通过回归直线可对某些事物的发展趋势进行预报,但是要通过对其误差进行分析确定预报的可信度,这也是研究相关关系一种常用的思路.变式训练 某电器商经过多年经验发现本店每个月售出的电冰箱的台数 是一个随机变量, 的分布列如下: 1 2 3 12P 121212 1
6、2设每售出一台电冰箱,电器商获利 300 元,如销售不出而囤积于仓库,则每台每月需花保养费用 100 元,问电器商月初购进多少台电冰箱才能使自己月平均收益最大?思路分析:首先根据已知条件建立回归直线方程 ,再代入相应数据即可.解:设 x 为月初电器商购进的冰箱台数,只需考虑 1x12 的情况,设电器每月的收益为 元,则 是随机变量 的函数,且=.),(103,x电器商平均每月获益的平均数,即数学期望为E=300x(Px+Px+1+P12)+ 300-100(x-1)P 1+2300-100(x-1)P 2+3300-100(x-1) P3+300300-100(x-1) Pn-1= (-2x2
7、+38x).35由于 xN *,故可求出,当 x=9 或 10,也即电器商月初购进 9 台或 10 台电冰箱时,收益最大.【例 4】灯泡厂生产的白炽灯泡的寿命为 (单位:小时) ,已知 N(1 000,30 2) ,要使灯泡的平均寿命为 1 000 小时的概率为 99.7%,问灯泡的最低寿命应控制在多少小时以上?思路分析:由于 服从正态分布 ,故应利用正态分布的性质解题 .解:因为灯泡的使用寿命 N(1 000,30 2) ,故 在 ( 1 000-330,1 000+330)的概率为 99.7%,即 在(910,1 090 )内取值的概率为 99.1%,故灯泡的最低使用寿命应控制在910 小
8、时以上.绿色通道:正态分布是一种很常见的分布规律,要解决此类问题要理解正态分布的性质并加以应用.变式训练 假设某次数学考试成绩 服从正态分布 N(70,10 2).已知第 100 名的成绩是60 分,求第 20 名的成绩约是多少分?思路分析:由于成绩服从正态分布,故分数落在某范围内的概率可用两种方法即 函数或人数比来进行计算.解:由题意可知:P(60)=1-P(60)=1-( )=1-(-1)=-0.841 3,这说明数学成绩在 601076分和 60 分以上的考生(共 100 名)在全体考生中占 84.13%,因此,考生总数大致为119 名,故前 20 名考生在全体考生中的比率大约为 0.1
9、68 1.设 t 为第 20 名8413.0 1920考生的成绩,则有 P(t)=1-( )0.831 9,经查表得 0.96,于是,第 20 名学生的107t 7t数学成绩约为 79.6 分.问题探究问题 1:相关系数是相关分析中的主要参数,那么怎样理解它的意义呢?导思:相关系数是反映相关关系的一个重要因素,体现了回归方程与实际观测值的密切程度,也即是根据回归方程预报结果的准确程度,因此,是线性回归模型中一个重要的参数.探究:假设对两个相关变量 X 和 Y 作了 n 次观测,得到 n 对数据:(X 1,Y1),(X2,Y2),,(X n,Yn),如果把它们描在坐标图上即得散点图,借助散点图可
10、以观察到 X 和 Y 或者同升,或者同降,或者一升一降的共同变化趋势,也即相关关系.相关分析是用相关系数来表示两个变量间相互的直线关系,并判断其密切程度的统计方法.相关系数没有单位.在-1 +1 范围内变动,其绝对值愈接近 1,两个变量间的直线相关愈密切;愈接近 0,相关愈不密切.相关系数若为正 ,说明一变量随另一变量增减而增减,方向相同; 若为负,表示一变量增加、另一变量减少,即方向相反,但它不能表达直线以外(如各种曲线)的关系.问题 2:怎样理解回归分析的基本思想?回归分析有哪些实际的应用?导思:回归分析涉及统计学知识、建立数学模型的思路与方法,体现了数学研究问题的规律,无论从情感价值还是
11、数学本身的思维意识,都能使我们有一个全面的提高,是高中教材中极有价值的知识点.除此之外,回归分析在生产实践中也有极为广泛的应用,是数学应用能力的一种体现.探究:回归分析是统计学中一种重要的方法,体现了统计的基本思想,研究如何从样本的统计性质去推测相应总体的统计性质,即如何根据样本去探求有关总体的规律性.首先,从所收集的数据的特点,找出一条最接近的直线方程,即线性回归方程,而把其他一些不具有线性回归关系的数据用一种线性回归方程进行拟合,给出数据之间类似函数的一种关系,体现了从特殊到一般的基本思路,使对不确定关系的预报成为一种可能,进而分析预报的准确度,通过对误差的分析让我们理解回归方程所具有的可信度.回归分析的基本思想不仅体现了统计的基本思想,还提供了建立数学模型的一种基本方法,加深我们对数学应用能力的认识.而回归分析本身可以总结很多数学或者生产与生活实际中的规律,比如人的身高与体重的关系、水稻的产量与施肥量的关系等,加深我们对自然规律的认识,指导生产与实践,帮助我们改善自然,更好地为人类服务.