1、第五章 假设检验统计推断,是根据样本和假定模型对总体作 出的以概率形式表述的推断,主要包括假设 检验和参数估计。统计分析常常采取抽样研究的方法,即从总 体中随机抽取一定数量的样本进行研究,并 以此推测总体的特性。 由于总体中的每个个体间均存在差异,即使 严格遵守随机抽样原则,也会由于多一些数 值较大或较小的个体致使样本统计量与总体 的参数之间有所不同。 两个样本某变量的统计量不同,其差异是否 具有统计意义,它能否说明总体之间存在的 差异,这些都是研究工作中经常提出的问题 ,解决它们就需要进行显著性检验,即假设 检验。 第一节 假设检验的基本原理 1.统计假设 原假设(零假设):对研究对象的总体
2、所作的 某种假设,一般用H 0 表示。 备择假设(研究假设):与原假设相反的假设 ,一般用H A 表示。 u由于直接检验备择假设的真实性困难,假设检 验一般都是从原假设出发,通过原假设的不真 实性来证明备择假设的真实性。2.假设检验假设检验利用观察数据判断原假设H 0 是否成立 。 根据研究问题先对研究对象的全体提出某种假设 H 0,然后根据样本观察数据X 1 、X 2 X n 提供的信息 判断H 0 是否成立。3. 假设检验的基本思想 (1)小概率原理若随机事件的概率很小,例如小于0.05 、0.01、0.001,称之为小概率事件。在统计 推断中认为 ,小概率事件在一次试 验 或观 察中是不
3、可能发 生的。教育数据的显著性水平:概率小于 0.05或 0.01 ,为“弃真”错误,又称为显著性水平,用 表示。(2)假设检验的基本思想 类似于数学中的反证法: 先假设H 0 成立,如果一次抽样数据X1、X2Xn使得 小概率事件发生了,即其概率小于0.05或0.01 ,则拒绝 ,接受H A。4.假设检验的一般步骤 第一步 根据问题要求,提出零假设H 0 与备择假设H A 第二步 实际需进行检验的统计量 第三步 规定显著性水平 ,计算检验统计量的值 第四步 作判断,根据显著性水平 和统计量的分布,查 相应的统计表,查找接受域和拒绝域的临界值 。若H 0 成立 的概率小于0.05,则认为H 0
4、是小概率事件,是不可能成立 的,即H A成立。其中,若H 0 成立的概率小于0.05,则认为 差异显著;若H 0 成立的概率小于0.01,则认为差异极显著 。5.假设检验中的两类错误第类错误:假设H0本来正确,但我们却拒 绝它,这种“弃真”错误称为第类错误。 第类错误的概率为。第类错误:假设H0本来不正确,但我们却 接受它,这种“存伪”的错误称为第类错 误。第类错误的概率为。可通过提高样本含量来减少犯错误的概率 。6. 双侧检验和单侧检验 双侧检验:只强调差异而不强调方向性的检验称为 双侧检验。 单侧检验:强调某一方向的检验称为单侧检验。又 分左侧检验和右侧检验。通常适用于检验某一参数是否“大
5、于”或“ 优于”、“快于”及“小于”、“劣于”、“慢于” 另一参数等一类问题。T检验:与z检验相似,t检验不需要知道总体方差,它用样 本方差替代总体方差,得到的统计量服从t分布。实践应用 中,t检验比z检验常用,因为不容易知道总体的方差。 Z检验:用于检验正态样本均值是否等于某个假设值,不 过需要事先知道总体方差,得到的统计量服从正态分布 ,有的教材上又叫u检验。 F检验:常用于方差分析,用于检验某因素的影响显著程 度。方差分析中,组间均方与组内均方的比值F值服从F分 布。 卡方 检验:可处理一个因素两项或多项分类的实际观 察频数与理论频数分布是否相一致问题,或说有无显著差 异问题。 值服从
6、分布。 假设检验第二节 平均数差异显著性检验 一、平均数差异显著性检验的类型与条件 平均数差异显著性检验的类型 单总体平均数差异显著性检验,也叫平均数的 显著性检验。 双总体平均数差异显著性检验,也叫平均数差 异的显著性检验。 平均数差异显著性检验的前提条件 被检验的样本应是随机样本; 总体分布为正态分布。第二节 平均数差异显著性检验 二、平均数差异显著性检验的步骤: 建立假设: 根据给定条件确定抽样分布的形态,确定相应的检 验方法,并计算出统计量的值。 确定,查出理论值,从而确定出H0拒绝和接受区 域。 作出判断。如ZZ ,即p0.05P0.05不显著 不显著接受 接受 1.96 P0.01
7、 0.05 P0.01显著 显著拒绝 拒绝 Z Z 2.58 2.58P 0.05 差异不显著,接受H0,拒绝H1。 故该班数学成绩与总平均成绩的差异不显著。单侧检验的例题 例2 对某专业课在全国同类高校内进行统一测试 ,已知全体考生成绩服从正态分布,其总平均 分为64分,总标准差为8.6分,从某高校随机抽 取20份试卷,经计算得到这20份试卷的平均成 绩为70分,问该校学生的平均成绩是否 显著 地优于全体学生的平均水平?例2的计算 解:建立假设: 计算统计量: 查正态表(单侧)得: 当 判断结果:因为3.1252.33,所以P0.05P0.05不显著 不显著接受 接受 t0.05 P0.01
8、 0.05 P0.01显著 显著拒绝 拒绝 t t t0.01t0.01P 0.05,差异不显著。 故该幼儿园4岁男童平均体重与正常男童平均体 重无显著差异。例题 例4 某实验组随机选择了40名儿童作提高儿童智 力水平实验,实验结束后,对参加实验的儿童 进行韦氏儿童智力测验,结果得到这40名儿童 的智商平均值为105,标准差为12,已知韦氏 儿童智力测验的平均值为100,试问该实验是 否成功? 解:建立假设: 计算统计量:例4的计算(续) 判断结果: 故实验后的儿童智力水平极明显高于同龄儿童一 般水平,实验取得了成功。四、双总体平均数差异显著性检验 独立样本T检验两独立样本的T检验,用于检验两
9、个 样本是否来自具有相同均值的总体。 例如:检验同龄农村大学生和城市大学生的平均 身高是否具有显著差异。如果需要比较两种试验的结果,把试验单 位随机的分成两组样本,然后对它们分别随机 地施加一种处理,如此得到的两个试验样本是 相互独立的。 统计量 自由度 df=(n 1 -1)+(n 2 -1) 根据df=(n 1 -1)+(n 2 -1),确定临界 t值t 0.05 与t 0.01 ,作出 统计推断。 例:从某市城区随机抽取5岁男童30名,测得其平均体 重为20.15公斤,从该市郊区随机抽取25名5岁男童,测 得其平均体重为18.25公斤,已知该市城区5岁男童 体重的标准差为1.85公斤,郊
10、区5岁男童体重的标准差 为1.78公斤.能否根据这次抽样推断出该市城区与郊 区5岁男童平均体重的差异是否显著。2 、配对样本T检验配对样本T检验,用于检验两个相关的样本(配 对资料)是否来自具有相同均值的总体。配对数据 来源的方式有两种:自身配对与同源配对。 (1)自身配对:指同一个试验对象,在两个不同时 间上分别接受前后两次处理,用其前后两次的观测 值进行对照和比较;或者,对同一试验对象,取其 不同部分的观测值或不同方法处理后的观测值进行 自身对照和比较。 (2)同源配对:指将来源相同、性质相同的两个个 体配成一对。 统计量 自由度为df=n-1 根据df=n-1 ,确定临界 t值t 0.0
11、5 与t 0.01 ,作出统计推断 例8 某实验组选择20名儿童作智力发展实验在实验前 和实验后对实验儿童进行一次韦氏儿童智力测验, 在实验前得到平均智商为102,实验后所得平均智商 为107,已知韦氏儿童智力测验标准差为15,两次测 验相关系数为0.7,试问该实验是否取得了成功。分析以下例子该用什么检验方法例1 :某实验小组进行一项学习方法实验,在实验 前,经过精心匹配,分成两小组,一为实验组,一为对 照组,各组均为20人。实验结束后,对两组均进行 智力测验,经计算,其智商成绩分别为:实验组平 均智商为106,标准差为16;对照组平均智商为 104,标准差为15,两组测验的相关系数为0.75,试 问该学习方法对提高智力是否有显著影响。例2: 某校进行速度测验,共选择40名参加,其 中男生22人,女生18人,男生测验的平均分为72 分,标准差为8分,女生测验的平均分为70 分,标 准差为7.6分。已知该速度测验结果服从正态分布 ,试问男女生速度测验的平均结果有无显著性差 异。作业: 根据自己的学科背景分别用单样本T检验、独立样本 T检验、配对样本T检验设计一实验方法或调查方案 。