1、在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:,相关关系问题,(1)确定性关系函数关系;,(2)非确定性关系相关关系;,相关关系表现为这些变量之间有一定的依赖关系,但这种关系并不完全确定,它们之间的关系不能精确地用函数表示出来,这些变量其实是随机变量,或至少有一个是随机变量。,5.1 直线相关,相关关系举例,例如:在气候、土壤、水利、种子和耕作技术等条件基本相同时,某农作物的亩产量 Y 与施肥量 X 之间有一定的关系,但施肥量相同,亩产量却不一定相同。亩产量是一个随机变量。,又如:人的血压 Y 与年龄 X 之间有一定的依赖关系,一般来说
2、,年龄越大,血压越高,但年龄相同的两个人的血压不一定相等。血压是一个随机变量。,农作物的亩产量与施肥量、血压与年龄之间的这种关系称为相关关系,在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量。一般在讨论相关关系问题中,可控变量称为自变量,不可控变量称为因变量。,函数关系与相关关系的区别,因此,统计学上讨论两变量的相关关系时,是设法确定:在给定自变量 的条件下,因变量 的条件数学期望,相关系数,当总体分布为正态时,相关系数确实是变量之间的相关性的合理指标,而在非正态情况则只是线性相关程度的度量。,两个随机变量X和Y之间的相关性,可由其总体相关系数(或称Pearson相关系数,亦称完
3、全相关系数)描述:,相关系数XY 是介于1和1之间的值, 没有单位. 当XY 0 ,X与Y呈正相关; 当XY 0,它表示随X增大,Y未必增大,但总体看确有X增大而Y呈直线上升的趋势。散点由左上向右下分布为负相关,此时,r t/2 时, 拒绝H0 ,认为x与y之间有直线相关关系,5.1.2 相关系数的假设检验,计量资料,散点图直线趋势,H0:总体相关系数0 H1:0,n10,SX1.6635 ,SY0.4142,XY775.3466,例1 测某地10名三岁儿童的体重X(kg)与体表面积Y(101m2),计算样本相关系数r,并检验是否来自0的总体,查统计用表19,r0.01/2(8)0.7646,双侧P0.01,按0.01水准双侧检验拒绝H0,可认为该地三岁儿童体重X与体表面积Y有正向直线相关关系,