1、1线性回归分析 (1)回归方程只适用于我们所研究的样本的总体例如,不能用普通女大学生的身高和体重之间的回归方程,描述女运动员的身高和体重之间的关系 (2)我们所建立的回归方程一般都有时间性例如,不能用20世纪80年代的身高体重数据所建立的回归方程,描述现在的身高和体重之间的关系,(3)样本取值的范围会影响回归方程的适用范围例如,回归方程是由女大学生的身高和体重数据建立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系就不恰当(即在回归方程中,变量x的样本的取值范围为155 cm,170 cm,而用这个方程计算x70 cm时的y值,显然不合适),独立性检验的基本思想类似于反证法,要确认“两个
2、分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的值很大,则在一定程度上说明假设不合理,2回归分析的方法:回归模型法 基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系; (3)由经验确定回归方程的类型;,(4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否合适等,某地大气中氰化物测定结果如下:(1)试建立氰化物浓度与污染源距离之间的回归方程; (2)求相关指数; (3)作出残差图,并求残差平方和,(3),从上述对比中可以看出,假设检验的原理和反证法原理类似不同之处:一是独立性检验中用有利于H0的小概率事件的发生代替了反证法中的矛盾;二是独立性检验中接受原假设的结论相当于反证法中没有找到矛盾 把独立性检验的基本思想具体化到独立性检验中,就可以通过随机变量K2的值的大小来研究两个分类变量是否有相关关系,为研究大气污染与人的呼吸系统疾病是否有关,对重污染地区和轻污染地区作跟踪调查,得出如下资料:请根据统计资料,作出合适的判断分析,