1、第七章 参数估计,参数:反映总体某方面特征的量,3,4,7.1 参数的点估计,5,(一)矩估计法,6,基本步骤,7,8,9,10,11,13,最大似然估计的原理介绍考察以下例子:假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用放回抽样方法从罐中取5个球,观察结果为:黑、白、黑、黑、黑,估计取到黑球的概率p.,15,16,18,20,22,23,25,29,31,(三)贝叶斯估计,32,33,35,36,37,38,39,7.2 估计量的优良性准则,从前一节看到,对总体的未知参数可用不同方法求得不同的估计量,如何评价好坏?四条评价准则:无偏
2、性准则,有效性准则,均方误差准则和相合性准则,40,1.无偏性准则,43,45,46,纠偏方法,47,2.有效性准则,48,50,51,3.均方误差准则,52,53,54,4.相合性准则,55,57,59,7.3 区间估计,60,61,(一)置信区间的定义,62,单侧置信限,64,单侧置信限和双侧置信区间的关系:,67,Neyman原则:在置信度达到一定的前提下,选取精确度尽可能高的区间。同等置信区间:,69,枢轴量和统计量的区别:(1)枢轴量是样本和待估参数的函数,其分布不依赖于任何未知参数;(2)统计量只是样本的函数,其分布常常依赖于未知参数。,具体步骤:,75,76,77,78,7.4
3、正态总体参数的区间估计,80,81,83,85,86,87,区间短,区间长,例 某制药商从每批产品中抽取一个样本进行分析, 以确定该产品中活性成分的含量. 通常情况下,化学分析并不是完全精确的, 对同一个样本进行重复的测量会得到不同结果, 重复测量的结果通常近似服从正态分布. 根据经验, 活性成分含量的标准差为0.0068(克/升),假设化学分析过程没有系统偏差, 设活性成分的含量的真值为对每个样本进行三次重复测量结果如下: 0.8403 0.8333 0.8447. 求真值 的置信水平为95% 的置信区间.,89,在Execl中的实现利用AVERAGE函数求均值, CONFIDENCE 函数
4、求方差已知时的误差限.,本例的计算步骤如下: (1) 将样本观察值输入Execl 表中,设数据区域为A1到A3; (2)下拉菜单“插入”选项卡单击“函数” 选择“统计” 选”AVERAGE”; (3) 在“Number1”文本框中输入“A1:A3” 点击Enter键,即显示均值为“0.840433”;,(4)重新下拉菜单“插入”选项卡单击“函数” 选择“统计” 选”CONFIDENCE”;(5)在“Alpha”文本框中输入“0.05”,“Standard-dev”文本框中输入“0.0068”,“Size”文本框中输入“3”,点击Enter键,即显示误差限为“0.007695”; (6) 的置信
5、水平为0.95的置信区间为(0.840433-0.007695,0.840433+0.007695)=(0.8327,,08481),93,94,95,96,在Execl中的实现 本例的计算步骤如下: (1) 将上述 数据值输入Execl 表中,设数据区域为A1到A8; (2)在Execl 表中选择任一空白单元格输入”=AVERAGE(A1:A8)”;点击Enter键,即显示均值 为“13.625”;,(3)在Execl 表中选择任一空白单元格 输入”=STDEV(A1:A8)” 点击Enter键,即显示样本标准差 为“7.744814”; (4)在Execl 表中选择任一空白单元格 输入”=
6、TINV(0.05,7)”; 点击Enter键,即显 示分位数 为 “2.364624”;(5)代入公式得所求区间估计为(7.149,20.101),99,102,105,106,107,108,109,110,例4:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这些滚珠得直径(毫米)如下: 甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0,111,112,113,116,117,118,正态总体均值、方差的置信区间与单侧置信限,7.5非正态总体参数的区间估计,(一)0-1分布参数的区间估计,(二)其他总体均值的区间估计,思考题,1.未知参数的估计量与估计值有什么区别?,5.给出求解参数的矩估计和极大似然估计的主要步骤.并写出0-1分布、二项分布、泊松分布、均匀分布、指数分布和正态分布中有关参数的矩估计和极大似然估计. 6.给出估计量的四个评价标准并说明其统计意义.,7.如何理解置信度的含义是什么?置信度、精确度和样本容量的关系怎样?,8.说明枢轴量和统计量的区别.,