1、第三节 区间估计,譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数 N 的极大似然估计为1000条.,若我们能给出一个区间,在此区间内我们合理地相信 N 的真值位于其中. 这样对鱼数的估计就有把握多了.,实际上,N的真值可能大于1000条, 也可能小于1000 条.,也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值., ,这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.,一. 置信区间与置信度,区间估计要求根据样本给出未知参数的范围,,并保证真参数以指定的较大概率属于这个范围。,定义:设总体,含一待估参数,对于样本,找出两个统计
2、量,使得:,称区间,为该区间的置信度,是一个随机区间;,给出该区间,可能性。,区间,通常, 采用95%的置信度, 有时也取99% 或 90%.,即置信度为,这时重复,抽样 100次, 则在得到的100个区间中包含,真值,的有95个左右, 不包含,真值的有5个左右。,例如 若,具体的计算方法,,其中只含有一个未知参数,不等式,是的置信度为,的置信区间。,二 、正态总体均值与方差的区间估计,设,为总体,的一个样本,设已知方差,且,一个无偏点估计,,又,对于给定的置信度,查正态分布表,找出,临界值,使得:,由此可找出无穷多组,通常我们取对称,使:,且,区间,由上 点的定义式,推得,随机区间:,查正态
3、分布表,所以的置信水平为1-的置信区间为,简记为,例 若取,查表得,值算得样本均值的观察值,则得到一个置信度为0.95的的置信区间,,若由一个样本,注: 的置信水平1的置信区间不唯一。,上例中同样给定,可以取标准正态分,布上分位点-Z0.04和Z0.01,则也有,则的置信度为0.95的置信区间为,但对称时的区间长度,最短。194页,例1:,已知幼儿身高服从正态分布,现从56岁的幼,儿中随机地抽查了9人,其高度分别为:115, 120,131, 115, 109, 115, 115, 105, 110 cm; 假设标准差,置信度为95%; 试求总体均值,的置信区间,解:已知,由样本值算得:,查正
4、态分布表得,由此得置信区间:,例2:,从一批零件中随机抽取16个, 测得长度(单,位:厘米) 为 2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13,2.10, 2.15, 2.12, 2.14, 2.10, 2.13, 2.11, 2.14, 2.11设,零件长度,平为 0.90 的置信区间。,解:,查表得,所以,的置信水平为0.90的,置信区间为,即:,例3:,设总体,问需要抽取容量为多,大的样本,才能使,的置信水平为0.95 的置信区间,的长度不大于 0.49 ?,解: 设需要抽取容量为,的样本, 其样本均值为,查表得,于是,的置信水平为0.95的置信区间为
5、,该区间长度,要使,只要,即,取,所以的置信水平为1-的置信区间为,简记为,例4:,用仪器测量温度, 重复测量7次, 测得温度分,别为:115, 120, 131, 115, 109, 115, 115cm; 设温度,在置信度为95%时, 试求温度的真,值所在范围。,解:设,是温度的真值,,是测量值,已知,由样本值算得:,得区间:,查表,例5:,对某种型号飞机的飞行速度进行15次试验, 测,得最大飞行速度(单位: 米/秒)为,420.3, 425.8, 423.1, 418.7, 438.3, 434.0, 412.3, 431.5,最大飞行速度服从正态分布. 求飞机最大飞行速度,422.2,
6、 417.2, 425.6,413.5, 441.3, 423.0, 428.2,根据长期经验, 可以认为,的期望值的置信水平为 0.95 的置信区间。,解: 以,表示该飞机的最大飞行速度, 则,查表得,由于总体方差,未知, 因此,的置信水平为0.95,的置信区间为:,即:,由,3) 方差的区间估计,设,并且样本函数:,即:,置信区间:,即,标准差的一个置信水平为,的置信区间,注意:在密度函数不对称时,如,习惯上仍取和对称类似的分位点,但其置信区间,的长度并不最短。,例6:,在某班级中, 随机抽取25名同学测量其身高,算得平均身高为170cm,标准差为12cm. 假设所测,身高近似服从正态分布
7、, 求该班学生平均身高,解:设身高,由题设得,(1),的0.95置信区间为,(2),即:,的0.95置信区间为,即:,设某机床加工的零件长度,16个零件,测得长度(单位:mm)如下:,12.15, 12.12, 12.01, 12.08, 12.09, 12.16, 12.03, 12.01, 12.06, 12.13, 12.07, 12.11, 12.08, 12.01, 12.03, 12.06,在置信度为95%时,试求总体方差 的置信区间,例7:,今抽查,解: 已知,查,得,由此得置信区间:,三 、两个正态总体均值与方差的区间估计,设,为总体,的一个样本,为总体,的一个样本, X与Y,
8、相互独立。,且,是,的,一个无偏估计,,因为X与Y 相互独立,所以,所以,的置信水平为1-的置信区间为,所以,的置信水平为1-的置信区间为,所以,的置信水平为1-的置信区间为,本章知识小结,1.重点:矩估计、最大似然估计、无偏性、有效性、单个正态总体参数的区间估计,2. 难点:最大似然估计,作业,210页 14、15、1819、20,分布参数的区间估计,若总体 X 的分布律,由中心极限定理,(近似),整理,从中解得,的范围,上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.,例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.,这时,
9、可将置信上限取为+,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.,五、单侧置信区间,于是引入单侧置信区间和置信限的定义:,又若统计量 满足,由于方差 未知,,解: 的点估计取为样本均值,选取统计量为,对给定的置信水平 ,确定分位数,使,即,于是得到 的置信水平为 的单侧置信区间为,将样本值代入得,的置信水平为0.95的单侧置信下限是,1065小时,例9 为估计制造某种产品所需要的单件平均工时(单位:小时),现制造5件,记录每件所需工时如下10.5 11.0 11.2 12.5 12.8假设制造单位产品所需工时,试求平均工时的置信水平为0.95的单侧置信上限.,解 由于,其中,未知,因此,对于给定的, 由,分布的,分位点的定义,存在,使得,而, 所以,即,故,的单侧置信区间为,单侧置信上限为, 经计算得, 由,得,可得单侧置信上限,因此, 加工这种产品的平均工时 不超过12.55小时的可靠程度是95%.,