1、X2检验,简单讲,卡方检验方法检验的是样本观测次数(或百分比)与理论或总体次数(或百分比)的差异性。 应用X2检验分析数据时,对计数数据总体的分布形态不作任何假设,因此,X2验被视为是非参数检验的一种。 统计原理:比较观察值与理论值的差别,如果两者的差异越小,检验的结果越不容易达到显著性水平;两者的差异越大,检验的结果越可能达到显著性水平,就可以下结论拒绝虚无假设而接受备择假设。,卡方检验的假设,分类相互排斥,互不包容; 观测值相互独立(最基本的假设):在实验研究中,让观测值的总数等于实验中不同被试的总数,要求每个被试只有一个观测值,这是确保观测值相互独立最安全的做法 期望次数的大小:一个简单
2、的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20的类别的理论次数可以小于5。,当单元格的人数过少时: 单元格合并法(如调整变量的分类方式); 增加样本数; 去除样本法(次数少的类别不具有研究价值时,但推广结论时要注意); 使用校正公式(只有两项分类的配合度检验,应用连续性校正公式计算;如果三项分类及以上时出现某一单元格内的理论次数小于5,用基本公式即可)。,卡方检验的类别,配合度检验 又称无差假说检验、是一种单因素检验,主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近。 独立性检验 用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。 同质性
3、检验 检定不同人群母总体在某一个变量的反应是否具有显著差异。检测双样本在单一变量的分布情形,如果两样本没有差异,就可以说两个母总体是同质的。,基本步骤:,提出假设 计算理论次数 计算卡方(基本公式) 计算自由度 结合自由度与显著水平找出卡方临界值 比较数据得出结论,配合度检验,实际频数(观察频数):在实验或调查中得到的计数资料。 理论次数(期望次数):是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数。 自由度的确定与两个因素有关:一是实验或调查中分类的项数;二是计算理论次数时,用观测数目的统计量的个数。,处理一个因素两项或多项分类的实际观察频数与理论频数分布是否相一致问
4、题,或说有无显著差异问题。 无差假说既是假设各项分类之间的机会均等,或概率相等因此,理论次数=总数1 分类项数,一、检验无差假说,某项民意测验,答案有同意、不置可否、不同意3种。调查了48人,结果同意的24人,不置可否的12人,不同意的12人。问持这3种意见的人数是否有显著不同?,1. H0: H1: 2.计算理论次数 3.计算卡方值 4.计算自由度 5.根据自由度和显著水平找出相应的卡方临界值 6.得出结论,二、检验假设分布的概率,假设某因素各项分类的次数分布为正态,故其理论次数的计算应按正态分布概率,分别计算各项分类的理论次数。即先按正态分布理论计算各项分类应有的概率再乘以总数,便得到各项
5、分类的理论次数。 事先分布不是理论分布而是经验分布,亦可按此经验分布计算概率,再乘以总数便可得到理论次数。,某班有学生50人,体检结果按一定标准划分为甲乙丙三类,其中甲类16人,乙类24人,丙类10人,问该班学生的身体状况是否符合正态分布?,理论次数计算方法:按正态分布概率计算 按正态分布,正负3可认为包括了全体,那么各等级所占的横坐标应该相同为2,故: 甲级: 乙级: 丙级: 因此,各等级的理论次数应为各部分理论上的概率乘以总人数。,独立性检验,独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,即研究两类变量之间的关联性和依存性问题。 可以用独立性检验解释:两个因素是否相互独立,或
6、说一因素的几项分类在另一因素的几项分类上差异是否显著(这是一个问题的两个方面) 独立性检验一般多采用表格的形式记录观察结果的计数资料,这种表格即列联表。 独立性检验的统计假设一般多用文字叙述,理论次数是直接用列联表提供的数据推算出来的。 两因素列联表自由度与两因素各自的分类项数有关。,一、四格表独立性检验,1、独立样本四格表卡方检验 当各单元格的理论次数大于或等于5时,可用简洁公式计算卡方值。 自由度为1,随机抽取90人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果如下。问男女生在学业水平上是否有关联?或男女生在学业中等以上的比率差异是否显著?,2.相关样本四格表卡方检验,A
7、,D为四格表中两次实验或调查中分类项目不同的那两个格的实计次数。,100名学生先后测验两次,结果如下:,二、RC表独立性检验,RC型列联表(二个因素:一个因素有R个分类,另一有C个分类) 自由度为(R-1)(C-1) RC表(非四格的表)卡方检验,允许有的格内的实计数为0,最小的理论次数为0.5,某校对学生的课外活动内容进行调查,结果如图,问性别与活动内容是否有关联或男女生在课外活动内容上是否存在差异?,同质性检验,一、单因素分类数据的同质性检验二、列联表形式的同质性检验,同质性检验可以分析几种因素之间是否真有实质上的差异,或者判断几次重复实验的结果是否同质。 是对两个样本同一个变量的分布状况
8、的检验,是对几个样本数据是否同质作出判断。,1.计算各个样本组的X2值和自由度 2.累加各样本组X2值,计算其总和与自由度的总和 3.将各样本组原始数据按类别合并成一个新表,并计算总表的X2值与自由度 4.计算异质性X2值各样本组的累积X2值与合并后总表X2值之差,自由度为各样本累积自由度与合并后总表自由度之差。 5.查X2表,判断X2值差是否显著。,对四所幼儿园的幼儿颜色命名能力进行了调查,调查材料是15种颜色的彩色铅笔。凡能正确命名8种颜色及其以上者为达标,低于8种颜色则未达标。调查对象分4岁组,6岁组。四所幼儿园调查的数据见下表。问这四所幼儿园儿童颜色命名能力调查结果是否同质?儿童颜色命名能力与年龄有无关系?,计数数据的合并,一、两格表及四格表数据的合并 1.简单合并 条件:分表小样本齐性;各分表某特征的相应比率接近。 2. X2相加法 即将各分表的X2值相加,查自由度为分表数目的X2表,确定显著性水平。反应不灵敏。 二、RC表数据的合并 1.简单合并法 2.分表理论次数合并法,谢谢!,