1、2.3.2 两个变量的线性相关阅读材料相关关系的强与弱我们知道,两个变量 x、y 正(负)相关时,它们就有相同(反)的变化趋势,即当 x由小变大时,相应的 y 有由小(大)变大(小)的趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题是:如何描述 x 和 y 之间的这种线性关系的强弱?例如,物理成绩与数学成绩正相关,但数学成绩能够在多大程度上决定物理成绩?这就是相关强弱的问题,类似的还有吸烟与健康的负相关强度、父母身高与子女身高的正相关强度、农作物的产量与施肥量的正相关强度等.统计中用相关系数 r 来衡量两个变量之间线性关系的强弱.若相应于变量 x 的取值 xi,变量 y 的观测值为
2、yi(1in),则两个变量的相关系数的计算公式为r= niiniiiii yx1212)()(.不相同的相关性可以从散点图上直观地反映出来.图 1 反映了变量 x、y 之间很强的线性相关关系,而图 2 中的两个变量的线性相关程度很弱.对于相关系数 r,首先值得注意的是它的符号.当 r 为正时,表明变量 x、y 正相关;当 r为负时,表明变量 x、y 负相关.反映在散点图上,图 1 中的变量 x、y 正相关.这时的 r 为正,图 2 中的变量 x、y 负相关,这时的 r 为负.另一个值得注意的是 r 的大小.统计学认为,对于变量 x、y,如果 r-1,-0.75,那么负相关很强;如果 r0.75,1,那么正相关很强;如果 r(-0.75,-0.30或r0.30,0.75),那么相关性一般;如果 r-0.25,0.25,那么相关性较弱.反映在散点图上,图 1 的 r=0.97,这些点有明显的从左下角到右上角沿直线分布趋势,这时用线性回归模型描述两个变量之间的关系效果很好;图 2 的 r=-0.85,这些点也有明显的从左上角到右下角沿直线分布趋势.这时用线性回归模型描述两个变量之间的关系也有好的效果.你能试着对自己身边的某个问题,确定两个变量,通过收集数据,计算相关系数,然后分析一下能否用线性回归模型来拟合它们之间的关系吗?图 1 图 2