1、引例 某工厂制造的产品 从过去较长一段时间的生产情况来看 其不合格率不超过0 01 某天开工后 为检验生产过程是否稳定 随机抽取了100件产品进行检验 发现其中3件是不合格的 问这一天的生产是否稳定 分析 我们可算得 不合格品出现的频率为0 03 由于我们不可能对所有生产的产品进行检验 因此即使生产过程稳定 不合格率不超过0 01 在随机抽样检验中 不合格品出现的频率也有可能比0 01大 如果记 X 1 表示生产出来的产品为不合格品 X 0 表示生产出来的产品为合格品 我们有这里参数为不合格率 那么生产过程稳定等价于总体X的分布为0 1分布 参数 生产过程不稳定等价于总体的分布为0 1分布 参
2、数 关于生产过程是否稳定的两种假设就转化为关于总体分布的两种假设 所谓假设检验问题 就是要判断原假设是否正确 也就是要作出一个决定 是接受还是拒绝原假设 如何作出选择 需要我们从总体中抽取样本 然后根据样本的观测值作出决定 这就需要我们给出一个规则 此规则告诉我们 在有了样本观测值后 我们可以作出是接受还是拒绝原假设 我们把这样的规则称为检验 要给出一个有实际使用价值的检验 需要有丰富的统计思想 我们首先对样本进行加工 把样本中包含的关于未知参数的信息集中起来 构造出一个适合于假设检验的统计量T 上面例子中 我们取它表示所检验的100件产品中不合格品的总数 是p的充分统计量 服从参数是100
3、p的二项分布 一般说来 在为真即生产过程稳定时 T的值应比较小 而在不真即生产过程不稳定时 T的值应相对地比较大 因此 我们可以根据T值的大小来制定检验法则 对样本的每个观测值 当统计量的观测值较大时就拒绝 而当T较小时就接受 这就是说 按照规则 当时 拒绝原假设 当时 接受原假设 其中c是一个待定的常数 不同的c值表示不同的检验 如何确定c 需要有熟练的计算技巧和丰富的统计思想 我们称T为检验统计量 c为检验临界值 为拒绝域 为接受域 两类错误每一个检验都会不同程度地犯两类错误 上面例子中 原假设本来正确 由于样本的随机性 检验统计量的观测值落入了拒绝域 就拒绝原假设 这时称假设检验过程中犯
4、了第一类错误 也称 弃真错误 原假设本来不正确 由于样本的随机性 检验统计量的观测值落入了接受域 就接受原假设 这时称假设检验过程中犯了第二类错误 也称 存伪错误 一个检验的好坏可由犯这两类错误的概率来度量 常把犯第一类错误的概率记为 犯第二类错误的概率记为 由于它们常依赖于总体中未知参数 故又常记为 上面例子中 可见 犯两类错误的概率均为参数p的函数 犯第一类错误的概率是的函数 犯第二类错误的概率是的函数 犯两类错误的概率也是c的函数 c的值越大 犯第一类错误的概率就越小 而犯第二类错误的概率就越大 相反 c的值越小 犯第一类错误的概率就越大 而犯第二类错误的概率就越小 因此 犯两类错误的概
5、率是相互制约的 奈曼 Neyman 和皮尔逊 Pearson 提出 首先控制犯第一类错误的概率 即选定一个数 使得检验中犯第一类错误的概率不超过 然后 在满足这个约束条件的检验中 寻找犯第二类错误的概率尽可能小的检验 这就是假设检验理论中的奈曼 皮尔逊原则 寻找犯第二类错误的概率尽可能小的检验 在理论和计算中都并非容易 为简单起见 在样本容量n固定时 我们着重对犯第一类错误的概率加以控制 适当考虑犯第二类错误的概率的大小 称控制犯第一类错误的概率不超过的检验为显著性检验 称为显著性水平 假设检验的一般步骤 1 根据实际问题提出原假设和备择假设 2 确定检验统计量 3 取适当的显著性水平 并由显著性水平和统计量的分布确定拒绝域 使得检验中犯第一类错误的概率的最大值尽可能的接近 特别在总体为连续型总体时 往往要使它等于 拒绝域有单侧和双侧两种形式 4 由样本观测值算得统计量的观测值 并与拒绝域中临界值比较 如果观测值落入拒绝域 则拒绝原假设 否则接受原假设