1、数理统计,江苏大学 路正南,Your Site Here,第一章 绪论,一、什么是统计?统计的内涵: 1、统计工作 2、统计资料 3、统计学社会经济统计大统计数理统计统计既是一种理论,也是许多方法的总称。,Your Site Here,第一章 绪论,二、统计的题材 统计的题材包括范围极广设计生成数据的试验,数据的收集、分析、描述和解释。例如:随机抽取某市的1000个家庭的收入状况:平均收入,每个家庭收入与平均收入的离散程度。,Your Site Here,第一章 绪论,三、现代统计学发展现代统计学的精髓是:数据 推断 决策感兴趣的内容是:点估计推断全市的平均收入 区间估计,Your Site
2、Here,第一章 绪论,1、如何抽样 局部推断整体 2、如何推断3、误差多少四、学习数理统计的目的1、统计思想的熏陶2、统计推断方法,Your Site Here,第二章 数理统计的基本概念与抽样分布,一、数理统计的定义数理统计是研究大量随机现象的统计规律性的一门数学科学,它以概率论为基础研究如何以有效的方式收集、整理和分析受到随机性影响的数据,从而为随机现象选择和检验数学模型,并且在此基础上对随机现象的性质、特点和统计规律作出推断和预测,直至为决策提供依据和建议。,Your Site Here,第二章 数理统计的基本概念与抽样分布,二、数理统计主要研究两类问题1、实验的设计和研究研究如何合理
3、有效地获得数据资料的方法,并对这些方法进行分析2、统计推断研究如何利用获得的数据资料对所关心的问题,做出尽可能精确、可靠的判断。,Your Site Here,第二章 数理统计的基本概念与抽样分布,例如:1.一批灯泡的平均寿命是多少?合格率是多少?2.一批灯泡的平均寿命大于等于1000小时,合格率大于等于90%,信不信?3.温度与压力有无关系?有什么样的关系?4.一天所加工的零件的误差是否服从正态分布?5.几个地区人的血液中胆固醇的含量的平均值有无显著差异?6.某材料的处理方式A1、A2、A3及使用环境B1、B2、B3对其性能有无影响?,Your Site Here,第二章 数理统计的基本概念
4、与抽样分布,2.1 数理统计的几个基本概念 一、总体与样本有限总体总体 研究对象的全体 无限总体个体 每个研究对象 关心 与它们的性能相联 系的某个数量指标 实验前不知结果 是一个随机变量(有一个分布)。,Your Site Here,第二章 数理统计的基本概念与抽样分布,总体 一个具有确定概率分布的随机变量个体 随机变量可能取的数值研究总体,一般采取抽样(取样、采样)的方法。样本推断总体,其原因有: 1.无限总体 2.破坏性等情况,不可能对所有个体研究。,Your Site Here,第二章 数理统计的基本概念与抽样分布,抽样:抽样的代表性要强,必须遵循随机原则。 1.无限制随机抽样:纯随机
5、抽样,总体中每个个体被抽到的机会是均等的,结果为简单随机样本。 2.有限制随机抽样。总体随机变量,可能取值n个。n次重复独立观测,其结果1、2、n试验前(1、2、n)为n维随机变量。试验后(1、2、n)为一组具体的数值,n维空间Rn中的一点。N称为样本容量。样本空间:(1、2、n)可能取得值的全体。,Your Site Here,第二章 数理统计的基本概念与抽样分布,两种抽样方法:1.有放回抽样 2.无放回抽样当n充分大时,两种方法接近简单随机抽样无限总体无放回抽样;有限总 体有放回抽样。当n充分大时,都可认为是简单随机抽样简单随机样本( 1、2、n )独立同分 布, i与同分布。定义1:若F
6、(x) (P(x))称样本( 1、 2、n )来自于总体F(x)。,Your Site Here,第二章 数理统计的基本概念与抽样分布,定理:若( 1、2、n )来自于F(x)(P(x),则( 1、2、n )的联合分布密度函数 F(xi) P(xi) 例一: N(0,1),(1、2、3)是一个样本,样本空间R3。,n,i=1,n,i=1,Your Site Here,联合概率函数:,第二章 数理统计的基本概念与抽样分布,Your Site Here,第二章 数理统计的基本概念与抽样分布,二、统计量统计量样本的函数(不含未知参数)定义2:设(1、2、n)是总体的一个样本, T(1、2、n)是样本
7、(1、2、n)的一个 函数,且T(1、2、n)中不含任何未知函数, T=T(1、2、n)为一个统计量。要点:1.样本的函数;2.不含任何未知参数;3.统 计量是一个随机变量;4.统计量的分布称为抽样分 布。,Your Site Here,第二章 数理统计的基本概念与抽样分布,定义3:设(1、2、n)是来自总体的容量为 n的样本。常用的统计量有:1. 样本均值 2. 样本方差3. 样本标准差 4. 修正样本方差,Your Site Here,第二章 数理统计的基本概念与抽样分布,5. 修正样本标准差6. 样本k阶原点矩7. 样本k阶中心距(k为正整数),Your Site Here,第二章 数理
8、统计的基本概念与抽样分布,2.2经验分布函数与直方图 一、经验分布函数总体的分布函数也叫做理论分布函数,利用样本来估计和推断总体 的分布函数 ,是数理统计要解决的一个重要问题。总体 ,分布 ,样本( ),其中有 个不同的数值将它们按由小到大的次序排列为样本 , 个数 频率,Your Site Here,第二章 数理统计的基本概念与抽样分布,引入函数 当 对不出现的样本值中的其它的这个函数成为经验频率函数。 决定了样本的频率分布定义函数 : 对任意实数 , 这个函数称为总体 的经验分布函数可以证明,经验分布函数具有如下性质:(1) (2) 是单调不减函数(3) 处处右连续,Your Site H
9、ere,第二章 数理统计的基本概念与抽样分布,例:,Your Site Here,第二章 数理统计的基本概念与抽样分布,与 的关系设样本 ,对任一个 ,实际上( 恰有 个 , )由于 与 有相同分布函数,因此事件 概率为 ,而次独立抽样可看作 重贝努里试验,从而根据贝努里大数定律,(频率与概率p可以任意接近)当 时, 依概率收敛于 即 对任意给定的 ,有更深刻的结果由格列汶科于1933年作出的。,Your Site Here,第二章 数理统计的基本概念与抽样分布,格列汶科定理:是 的一个很好的近似,数理统计学中一切都以样本为依据,其理由就在于此。二、直方图 (略),Your Site Here
10、,第二章 数理统计的基本概念与抽样分布,2.3 常用统计分析 一、 分布= 独立,同分布结论:1.,Your Site Here,第二章 数理统计的基本概念与抽样分布,2.3. 4. 分布的可加性:若 为独立的随机变量,且 则5.若 则 6. 若 当 时,近似服从,Your Site Here,第二章 数理统计的基本概念与抽样分布,二、 分布、 独立,三、F分布、 独立,则,Your Site Here,第二章 数理统计的基本概念与抽样分布,四、分位数定义:设随机变量 的分布函数为 ,实数 满足0 1,若 使 ,则称 为此概率分布的 分位数或 分位点或临界值。,Your Site Here,第
11、二章 数理统计的基本概念与抽样分布,Your Site Here,第二章 数理统计的基本概念与抽样分布,关于图表(1)(2) (3),Your Site Here,第二章 数理统计的基本概念与抽样分布,2.4 抽样分布抽样分布 统计量的分布 一、正态总体的样本均值与方差的分布 定理1:设 相互独立,且则 不全为零 推论1: 样本 则不全为零,Your Site Here,第二章 数理统计的基本概念与抽样分布,2. 样本 则3. 样本两个样本独立,则,Your Site Here,第二章 数理统计的基本概念与抽样分布,Your Site Here,第二章 数理统计的基本概念与抽样分布,定理2:(
12、科赫伦Cochram分解定理)设 为独立,同分布随机变量,且 i=1,2n又设其中 是秩为 的 非负 二次型,则如下两结论:(1) 独立(2) 成立的充分必要条件为,Your Site Here,第二章 数理统计的基本概念与抽样分布,推论:设 为独立、同分布的随机变量,且i=1,2,n 而 是 的秩为 的非负二次型,且,则 其中 ,且,Your Site Here,第二章 数理统计的基本概念与抽样分布,定理3:设总体 , 为 的一个样本,则(1)样本均值 与样本方差 独立(或 与 独立)(2)定理4:设总体 , 是 的一个样本,则(1)样本均值 与样本方差 独立(2)推论1:设总体, , 是
13、的一个样本,则,Your Site Here,第二章 数理统计的基本概念与抽样分布,推论2:设 与 为两个具有相等方差(也称具有方差齐性)的正态总体,有 为 的样本为 的样本且这两个样本独立,则其中,Your Site Here,第二章 数理统计的基本概念与抽样分布,推论3:设 与 为两个正态总体为 的样本为 的样本且这两个样本独立,则例:设 来自总体证明:,Your Site Here,第二章 数理统计的基本概念与抽样分布,二、一些非正态总体的样本均值的分布结论:不管总体 服从什么分布,只要它的方差 有限(从而 也有限),那么样本均值 的期望 与方差 均有限。且有定理5:设 为任意一个总体,
14、且有有限方差 而 为 的一个样本,则当 充分大时近似服从,Your Site Here,第二章 数理统计的基本概念与抽样分布,2.5顺序统计量与样本极差 一、顺序统计量及其分布定义:设 是来自总体 的样本,由样本建 立 个函数 那么 是统计量,它的观 测值 是样本的观测值 由小到大的次序排成后的第 个数值, 则称 其中 称为第 个顺序统计量;,Your Site Here,第二章 数理统计的基本概念与抽样分布,称为最大顺序统计量;称为样本极差。当n为奇数时称为样本中值当n为偶数时例:设样本观测值(1,4,2,6,5)12456 =3.6 =4 =3.44=5 =6 =1,Your Site H
15、ere,第二章 数理统计的基本概念与抽样分布,下面简略介绍一下上述统计量的分布 (1)设总体 具有连续型概率密度函数 ,分布函数为 , (这里 , 可以是无穷大), 是来自总体 的样本,则顺序统计量 的联合概率密度函数为 例1.设总体 服从指数分布,其概率密度函数为 ,从总体 中抽取一个容量 的样本,试求第3个顺序统计量 的概率密度函数 .,Your Site Here,第二章 数理统计的基本概念与抽样分布,解: 的联合概率密度函数为 利用求边缘密度的方法,可得 的概率密度函数为,Your Site Here,第二章 数理统计的基本概念与抽样分布,(2)仿照例1的方法,可得 最小顺序统计量 的
16、概率密度函数为 最大顺序统计量 的概率密度函数为第 个顺序统计量 的概率密度函数为 (3)进一步还可得 的联合概率密度函数为,Your Site Here,第三章 参数估计,统计推断根据样本推断总体的分布或分布的数学特征 参数估计问题根据样本对总体未知参数作估计 3.1求点估计量的方法点估计的主要任务是通过样本求出总体参数的估计值。 点估计的作法:设总体 的分布为已知,但其中的参数 为 未知,对总体进行随机抽样,用样本 构造合适 的统计量作为参数 的估计量,记作 ,若一 次抽取的样本值为 ,则 就是 的估 计值。常用的点估计方法有矩法,极大似然法。,Your Site Here,一、矩法 设
17、为总体 的样本,则样本 阶原点矩为矩法就是用样本矩作为相应的总体矩的估计量。具体作法:设总体 的分布函数中包含 个未知参数。总体 的 阶矩存在,以样本矩 作为总体矩 的估计,,第三章 参数估计,Your Site Here,即 这是由 个方程构成的方程组,从中可以解出 , 它们都是用样本表示的,记为 , ; 就是 总体参数 的估计量, 此估计量称为矩估计量,对一次 具体抽取的样本值 , 叫 的矩估计量。,第三章 参数估计,Your Site Here,例1.设某总体 有期望 ,方差 ,其值未知, 为样本,求 和 的矩估计量。 解:这里而 由矩法估计得由此解出,第三章 参数估计,Your Sit
18、e Here,例2.设总体 均匀分布,其中 为未知参数,为简单随机样本,求 的矩估计量。解:均匀分布 的密度函数为已知:法1:从期望考虑,用矩法 ,法2:从方差考虑,用矩法,第三章 参数估计,Your Site Here,例3: 已知总体 的密度函数为其中 , 为未知参数, 为简单随机样本,求 和 的矩估计量 解:由矩法应有 解之,得,第三章 参数估计,Your Site Here,矩法估计的优点:1.直观,方便;2.当样本容量n无限大时,用矩法来估计总体各参数可达到任意精确程度;3.一般情况下矩法不依赖于总体分布的具体形式,因而适用性广。 矩法估计的缺点:1.矩法估计要求总体的原点矩存在,如
19、柯西分布的一阶原点 矩不存在,就不能用矩法了;2.矩法太一般化了(如例1),未能充分利用 所具有 的特点,所以对一些特定的分布可能不如用其他方法得到 的估计量好;3.矩法估计量不具有唯一性,例如泊松分布的参数,第三章 参数估计,Your Site Here,第三章 参数估计,二、极大似然法 1似然函数:设样本 为来自分布密度 的总体 (离散型 表示 ), 为参 数,其联合分布密度称为似然函数,记为(连续型)(离散型),Your Site Here,第三章 参数估计,2. 极大似然估计量如果在 时, 则称 分别 是参数 的极大似然估计量. 3极大似然估计法极大似然估计法用样本估计总体的参数值时,
20、使得当各数取这些值时,所观察到的样本出现的概率最大。极大似然原理:概率最大的事件最容易发生(小概率原理的逆否形式),Your Site Here,第三章 参数估计,例1 设一袋中盛有两种球,白球和黑球,已知黑球比白球多,试估计二者数量之比。摸得白球的概率作放回抽样,摸球 次故似然函数若 ,其中有9个 等于1,其余为零,则求 ,使得,Your Site Here,第三章 参数估计,求 ,使得令 ,得 一般地, ,样本若 则 为 的极大似然估计量。 求解由于 是 的增函数,可以求解 ,j=1,2,k,Your Site Here,第三章 参数估计,例2:设 服从指数分布样本 ,求 的极大似然估计。
21、解:令 得,Your Site Here,第三章 参数估计,例3 . 设 ,样本 ,求 与 的极大似 然估计量。解:似然函数,2,Your Site Here,第三章 参数估计,解得,Your Site Here,第三章 参数估计,例4 设总体 服从 上的均匀分布求 的极大似然估计量。解:设样本由于样本来自总体所得结果与矩估计不同。,Your Site Here,第三章 参数估计,三、顺序统计量法定义:设总体 ,样本 为顺序统计量, 记称 为样本中位数。为总体中位数的估计量若总体 连续型对称分布,则 ,称为数学期望的顺序统计量法。,Your Site Here,第三章 参数估计,其优点:(1)
22、简便。(2)不需利用 的分布。(已知分布时,设有充 分利用总体分布所提供的有用信息)(3)不易受个别异常数据的影响。(4)寿命试验中,只需得到超过半数的试验结果。 ( 个试验同时进行),Your Site Here,第三章 参数估计,定义: 极差估计法:(1)简单;(2)不如 ,且 越大,可靠性越差正态总体稳健估计,Your Site Here,第三章 参数估计,3.2 估计量的评选标准例: ,其中哪个“最佳”?“最佳”的准则?,Your Site Here,第三章 参数估计,分别为 的三个估计量分别为相应的密度函数“各方面都好”,Your Site Here,第三章 参数估计,一、无偏估计(
23、1)定义:设 是未知参数 的估计量, 若 ,则称 为 的无偏估计。无偏估计 准确无误的估计(2)同一个参数可以有很多无偏估计 例:设 为来自期望为 的总体,判断下列统计 量是否为 的无偏估计。 、都是 的无偏估计量不是 的无偏估计( 不为零时)。,Your Site Here,第三章 参数估计,(3) 是 的无偏估计 是 的无偏估计是线性函数除外,例 设 是来自具有限期望 的总体的一个样 本,则 是 的无偏估计。结论:样本均值 是总体均值 的无偏估计。 但 不是 的无偏估计。 例如,,Your Site Here,第三章 参数估计,例:设总体 的期望为 ,方差为 ,样 本 ,则样本方差 是 的
24、无偏估计。 事实上,,Your Site Here,第三章 参数估计,结论: 是 的无偏估计不是 的无偏估计一般也不是 的无偏估计例如,,Your Site Here,第三章 参数估计,(4)渐近无偏估计量为 的渐近无偏估计量是 的渐近估计量。,Your Site Here,第三章 参数估计,(5)一个有明显弊病的无偏估计量 例: 为 的一个样本,则是 的无偏估计量。这是因为,应用无偏性:(1)数学上;(2)心理上,Your Site Here,第三章 参数估计,1有效性及最小方差无偏估计的两个无偏估计量 ,如果 较 更密集在 附近,则认为 较 理想或有效。 设 , 是 的两个无偏估计量,若
25、,则称 较 有效。如果对于给定的 ,在 的所有无偏估计量中, 的值 最小,则称 是 的最小方差无偏估计。 (1) (2) 任一估计,Your Site Here,例:比较总体期望 的两个无偏估计, ,的有效性。 解:,Your Site Here,第三章 参数估计,所以 比 有效。,Your Site Here,第三章 参数估计,2.罗克拉美不等式设 是从分布密度函数 的总体中抽取的一个样本, 是 的一个无偏估计,在一些正则条件下有其中,Your Site Here,第三章 参数估计,特别当 时,有(1)应用此不等式,证明 的 ,二项分布的 ,泊松分布的 ,它们的最小方差无偏估计都是 。 例:
26、设 是来自于贝努里分布总体 的一个样本,试求 的无偏估计的下界。 解:对,Your Site Here,第三章 参数估计,所以而 得 是 的最小方差无偏估计(2)克拉美不等式的方差下界不一定能达到 例:设 是来自正态总体 的一个样本,求 和 的无偏估计的方差下界。 解:,Your Site Here,第三章 参数估计,所以的方差下界 ,而所以, 是 的最小方差无偏估计。 同样,,Your Site Here,第三章 参数估计,的方差下界是是 的无偏估计,由于但用其他方差可以证明 确实是 的最小方差无偏估计。 三、有效估计定义:如果 是参数 的一个无偏估计量,它的方差达到 给出的下界,则称 是参
27、数 的有效估计。,Your Site Here,第三章 参数估计,定义:对 的任一无偏估计 ,记称 为无偏估计 的有效率。例如: 的 是 的有效估计,则当然是最小方 差无偏估计; 是 的最小方差无偏估计,但不是有效估计,它的效率是定义:渐近有效率 若 , 则称 是 的渐近有效估计。,Your Site Here,第三章 参数估计,四、相合估计(一致估计)定义:设 为未知参数 的一列估计,如果 依概率收敛于 ,即对 ,有则称 为 的相合估计。 例:若 , 存在,证明 是 的相合估计。证:利用切比雪夫不等式以及得,Your Site Here,第三章 参数估计,3.3 区间估计 定义:设 、 为两
28、个统计量,如果成立,则称 为 的区间估计, 称为置信下限, 称为置信上限, 称为置信水平, 称为置信区间。* 以 的概率套住* 以 的概率落入 “最好”的置信区间:在给定的较大的置信水平 下,使 长度最小的区间估计。,Your Site Here,第三章 参数估计,一、正态总体均值的区间估计1 已知,求 的置信区间设总体 ,样本的点估计取 使得 的置信水平为 的置信区间为,Your Site Here,第三章 参数估计,例:某车间生产滚珠, 从长期实践中知,滚珠直径 服从正态分布,现从某天产品中抽取6个,测得直径为(mm) 14.6 15.1 14.9 14.8 15.2 15.1若已知方差为
29、0.06,试求平均值的置信区间。 解: 查表,Your Site Here,第三章 参数估计,即 的置信区间为(14.75,15.15) 当 不是服从正态分布时,只要 足够大,仍可用作为 的置信区间。2 未知,求 的置信区间用 来代替,Your Site Here,第三章 参数估计,例:为确定某种溶液中的甲醛浓度,取样得4个独立测定值的平均值 ,样本方差 ,并设被测总体近似地服从正态分布,求总体均值 的95置信区间。 解:(8.292%,8.388%) 二、正态总体方差的区间估计总体 ,样本的点估计,Your Site Here,第三章 参数估计,的置信区间则可取为上述置信限的平方根。当总体均
30、值 已知,也可以用样本函数,Your Site Here,第三章 参数估计,三、两个正态总体的均值差的区间估计1. 都已知,求 的置信区间,Your Site Here,第三章 参数估计,2 未知,求 的置信区间3 且都未知,求 的置信区间(1) 很大( )(2) 并不大, 的近似置信区间。,Your Site Here,第三章 参数估计,四、两个正态总体方差比的区间估计,Your Site Here,第三章 参数估计,五、正态总体的 与 的联合区间估计总体与 独立 与独立,Your Site Here,第三章 参数估计,六、(0-1)分布的参数的区间估计充分大时, 近似服从平方后整理,得,Y
31、our Site Here,第三章 参数估计,七、单例置信限定义:总体 未知为 的 单侧置信区间, 单侧下限类似有,Your Site Here,第四章 假设检验,一、问题的提出例1:洗衣粉装包机在正常工作时,装包量服从正态分布。根据多年的观测,其 (克)。现在调整控制开关,令其装包量均值为500克,在装好的洗衣粉中任取一袋,测出 (克),试问装包量的均值是500克吗?例2:设甲、乙两车间生产的电灯泡的寿命都服从正态分布,抽样测得其寿命数据为甲车间 (小时) (小时)乙车间 (小时) (小时)问两个车间的灯泡寿命可以认为是相同吗?,Your Site Here,第四章 假设检验,例3:自动车床
32、加工中轴,从成品中轴抽取11根,测量它们的直径(单位:mm),数据如下:10.41 10.32 10.18 10.64 10.77 10.82 10.67 10.59 10.38 10.49问这批零件的直径服从正态分布吗? 二、假设检验的基本原理以例1为例。样本与均值的偏差508-500=8(克)是 的4倍。正态分布中, 落入 内的概率为99.73,一次抽样 的小概率事件发生了,只能怀疑“均值 克”的假设。假设检验是某种带有概率性质的反证法。,Your Site Here,第四章 假设检验,三、两类错误原假设; 备择假设例1中,一般地,总体 ,样本若 为真,应该在0的附近,若 远离0,则拒绝
33、。给出显著性水平 ,,Your Site Here,第四章 假设检验,双侧拒绝域犯第一类错误的概率 成立 犯第二类错误的概率 成立,Your Site Here,第四章 假设检验,例:设对某正态总体 的均值 进行假设检验。; 。已知 ,取样本容量 ,取用样本均值 作检验统计量的 的接受域为 。(1)若 ,求犯第一类错误的概率 ;(2)若 不正确, 正确,问此时犯第二类 错误的概率 。 解:,Your Site Here,第四章 假设检验,与 的关系。 若 已知, 只可能取二个值 或 ,抽一个样本 , 成立时, 来自左边的总体, 成 立时, 来自右边的总体,这时有 偏大的趋势。拒绝域 即固定 ,
34、 与 不能同时变小。 最佳检验法:固定 ,能使 达到最小的检验法。,Your Site Here,第四章 假设检验,四、检验结果的含义1拒绝 是有说服力的,接受 是没有说服力的。和 不是对称的,一般将要说明的结论记作 。 例:(1)两个总体 , ,问两个总体 的均值有否显著差别?(2)问(1)中 的均值比 的均值大吗?;(3)总体 ,经抽样后算出 ,问能否断言 比某已知数 大吗?,Your Site Here,第四章 假设检验,2检验水平 选取 五、假设检验的步骤1根据问题的目的和要求提出 和 2构造一个合适的统计量 ,在 为真时, 的分布函数不含任何未知参数。3给出显著性水平 ,在 为真时,
35、通过等式或 ,确定双侧临界值 与 ,或单侧临界值 ,从而得双侧拒绝域 或单侧拒绝域 。 4由样本算出统计量 的值 ,若 或 ,则拒绝 ,反之,接受 。,Your Site Here,第四章 假设检验,六、总体均值的检验 (一)总体为正态分布且方差已知( 检验)假设 统计量(1)(2)(3)检验规则(1) 拒绝 ; 接受(2) 拒绝 ; 接受(3) 拒绝 ; 接受,Your Site Here,第四章 假设检验,(二)总体为正态分布但方差未知( 检验)假设 统计量(1)(2) (3)检验规则(1) 拒绝 ; 接受(2) 拒绝 ; 接受(3) 拒绝 ; 接受,Your Site Here,第四章
36、假设检验,(三)总体为非正态分布 大样本下,统计量取 或 七、两个总体均值之差的检验假设(1)(2) ; (3) ; (一)两个总体方差已知( 检验)统计量,Your Site Here,第四章 假设检验,(二)两个总体方差未知但相等 ( 检验)统计量(三)两个非正态总体统计量 或,Your Site Here,第四章 假设检验,八、总体成数的检验假设(1)(2) ;(3)、 都大于5时,统计量,Your Site Here,第四章 假设检验,九、两个总体比例之差的检验假设(1)(2) ;(3)当 都大于5时统计量,Your Site Here,第四章 假设检验,十、单个正态总体方差的假设检验
37、( 检验) 假设 统计量 (1) (2) (3)检验规则 (1) 或 时,拒绝时,接受(2) 时拒绝 , 时接受,Your Site Here,第四章 假设检验,(3) 时拒绝 , 时接受 十一、两个正态总体方差比的假设检验假设: (1) (2) (3)统计量注: 只需查,Your Site Here,第四章 假设检验,例:要比较甲、乙两种橡胶轮胎的耐磨性,现从甲、乙两种轮胎中各抽取8个,各取一个组成一对,再随机选取8架飞机,将八对轮胎随机配给8架飞机,作耐磨试验,飞行了一定时间的起落后,测得轮胎磨损量(单位:mg)数据如下:试问这两种轮胎的耐磨性有无显著性的差异?取 ,假设甲、乙两种轮胎的磨
38、损量分别为 、 又,Your Site Here,第四章 假设检验,解:(一)数据配对记 则:-30 320 360 320 230 780 720 -140所以拒绝 ,即认为这两种轮胎的耐磨性能有显著差异。,Your Site Here,第四章 假设检验,(二)样本独立4.5 分布拟合检验拟合检验法总体 未知,样本 ,检验办法:(1)建立假设(2)在数轴上选取 个分点 ,将实数 轴分为 个区间,Your Site Here,第四章 假设检验,在 下,记 为分布函数为 的总体 在第个 区间取值的概率,即称为第 组的理论频数。记 为 个样本观测值 中落在第 个区间中的个数, 称为第 组的观测频数
39、。分点的选取应使 个区间中每个区间内都有样本观察值,一般要,Your Site Here,第四章 假设检验,在 下,为 中需要用样本进行估计的未知参数的数目。 (3)对给定的 ,确定 ,使 (4)由样本值 计算 的值 。 (5)若 ,则拒绝 ,即不能认为总体分布函 数是 ,否则,接受 例:从维尼纶厂正常生产的报表上,随机抽取100个维尼 纶纤度的数据如下。 1.36 1.49 1.43 1.41 1.37 1.40 1.32 1.42 1.47 1.391.42 1.34 1.43 1.42 1.41 1.41 1.44 1.48 1.55 1.37,Your Site Here,第四章 假设
40、检验,试以显著水平 检验维尼纶纤度是否服从正态分布? 解:由直方图可看出它近似服从正态分布其中 是 的分布函数。在 下,在数轴上选取6个分点1.35,1.38,1.41,1.44,1.47,1.50将数轴分为7个区间,,Your Site Here,第四章 假设检验,,由 ,查表,Your Site Here,第四章 假设检验,接受 ,即认为维尼纶纤度服从正态分布,Your Site Here,第四章 假设检验,例:抛掷一枚硬币100次,“正面”出现了60次,问这枚 硬币是否匀称? 解: 表示出现“正面” 表示出现“反面”取一个分点0.5,将数轴分为两部分: 在 下,拒绝 ,即认为这枚硬币不是匀称的。,Your Site Here,第四章 假设检验,4.6 两个总体相等性检验 一、符号检验法设 、 连续型随机变量,独立样本样本水平 下,检验,Your Site Here,第四章 假设检验,在样本中去掉 的点,仍记样本容量为 。 若 记 的个数为若 记“”,“”的个数为1 查表若 ,拒绝 ,认为 与 有显著差异若 ,接受 。,Your Site Here,第四章 假设检验,二、秩和检验法设总体 的分布函数为 ,样本设总体 的分布函数为 ,样本不妨设 ,水平将 在混合后的数据中,排在第 个位置,即 则称 的秩为 ,记为记 称 为秩和统计量,Your Site Here,