1、32独立性检验的基本思想及其初步应用,学习目标1.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用2了解假设检验的基本思想、方法及其简单应用,课堂互动讲练,知能优化训练,32,课前自主学案,课前自主学案,1上节学习了回归分析的基本方法线性回归模型ybxae不同于一次函数ybxa,含有_,其中x为_,y为_,样本点的中心,随机误差e,解释变量,预报变量,残差平方和,122列联表与等高条形图(1)分类变量的定义变量的不同“值”表示个体所属的_,像这样的变量称为分类变量(2)22列联表的定义一般地,假设有两个分类变量X和Y,它们的取值分别为_和_,其样本频数列联表(称为22列联表)为:
2、,不同类别,x1,x2,y1,y2,(3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用_展示列联表数据的频率特征,abcd,等高条形图,先假设两个分类变量X与Y无关系,利用上述公式根据观测数据求出K2的观测值k,再得出X与Y有关系的程度(1)如果k10.828,就有_的把握认为“X与Y有关系”;(2)如果k7.879,就有_的把握认为“X与Y有关系”;,99.9%,99.5%,(3)如果k_,就有99%的把握认为“X与Y有关系”;(4)如果k5.024,就有97.5%的把握认为“X与Y有关系”;(5)如果k3.841,就有_的把握认为“X与Y有关系”;(6)如果k2.706
3、,就有_的把握认为“X与Y有关系”,6.635,95%,90%,在判断两变量相关时,若K2的观测值k56.632,则P(K26.635)0.01和P(K210.828)0.001,哪种说法是正确的?提示:两种说法均正确P(K26.635)0.01的含义是:在犯错误的概率不超过0.01的前提下,认为两变量相关;而P(K210.828)0.001的含义是:在犯错误的概率不超过0.001的前提下,认为两变量相关,课堂互动讲练,等高条形图更加形象直观地反映两个分类变量之间的差异,进而推断它们之间是否具有关联关系22列联表中,|adbc|越小,关系越弱;|adbc|越大,关系越强,某校对学生的课外活动进
4、行调查,结果整理成下表:,试用你所学过的知识分析:能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?【思路点拨】可用表中所给的数据绘制等高条形图进行分析,也可用数据计算K2,再确定其中的具体关系,【解】其等高条形图如图所示:,由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略判断,具体判断方法如下:假设“喜欢体育还是喜欢文娱与性别没有关系”,a21,b23,c6,d29,n79,,即我们得到的K2的观测值k8.106超过7.879这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.
5、005的前提下认为“喜欢体育还是喜欢文娱与性别有关”,根据22列联表,运用独立性检验的方法进行 某省2011年高中招生不再文理分科,为了探究学生对此的赞同情况是否与性别有关某机构调查了361名高二在校学生,结果如下:男生赞同的有138人,不赞同的有98人,女生赞同的有73人,不赞同的有52人,试分析对这项政策的赞同是否与性别有关?,【思路点拨】先列出22列联表,再计算K2的值,运用独立性检验得出结论【解】列22列联表,【误区警示】计算K2的值要准确,并找准比较的值,变式训练某县城区常见在合法的广告牌上又贴有违法的黑广告,城管对此进行了清理,并下了通告一周后,城管对某街道进行了检查作了如下统计:,请你判断,城管下通告对减少黑广告数是否有效?,方法技巧1列联表与等高条形图列联表由两个分类变量之间频率大小差异可说明这两个变量之间是否有关联关系而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系如例12在列联表中,可通过|adbc|的大小粗略判断关系的强弱,失误防范P(K26.635)0.01是指在犯错误的概率不超过0.01的前提下进行变量判断,或者K26.635是指两个分类变量有关系这一结论成立的可信度为99%,不是指两个分类变量有关系的概率为99%.,知能优化训练,本部分内容讲解结束,点此进入课件目录,按ESC键退出全屏播放,谢谢使用,