1、第7章 参数估计,总体所服从的分布类型已知/未知,估计总体中未知的参数,参数 估计,抽样,参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数.,参数估计,估计废品率,估计新生儿的体重,估计湖中鱼数,点估计,7.1,点估计,将 代入估计量,得到 的估计值,矩估计,样本k阶原点矩,总体k阶原点矩,矩估计基本思想: 用样本矩估计总体矩 .,大数定律:,K.皮尔逊,设总体的分布函数中含有k个未知参数,(1)它的前k阶原点矩都是这k个参数的函数,记为:,(2)用样本i阶原点矩替换总体i阶原点矩,(3) 解方程组,得i=hi (X1, X2, Xn) (i=1,2,k);,则以hi (X1, X2
2、, Xn)作为i 的估计量 ,并称hi(X1, X2, Xn)为i 的矩法估计量,而称hi(x1, x2, xn) 为i 的矩法估计值。,总体期望、方差的矩估计量分别是样本均值和样本二阶中心矩。,例1. 设总体X的数学期望和方差分别是, 2 ,求 , 2的矩估计量。,例2: 已知某产品的不合格率为p, 有简单随机样本X1 ,X2 , Xn 求p的矩估计量。,解:E(X)=p.,例3:设电话总机在某段时间内接到呼唤的次数服从参数未知的泊松分布,现在收集了如下42个数据:,求未知参数 的矩估计。,例4. XU(a,b),由简单随机样本X1 ,X2 , Xn求a,b的矩估计量。,解:E(X)=(a+
3、b)/2, D(X)=(b-a)2/12.,矩法的优点是简单易行,并不需要事先知道总体是什么分布 .,缺点是,当总体类型已知时,没有 充分利用分布提供的信息 .,矩法特点分析:,极大似然估计,例: 设一箱中装有若干个白色和黑色的球,已知两种球的数目之比为3:1或1:3,现有放回地任取3个球,有两个白球,问:白球所占的比例p是多少?,如果只知道0p1,并且实测记录是X=k (0 k n),又应如何估计p呢?,若总体分布已知,对于样本值,选取适当的参数,使样本值出现的概率最大,这种估计方法就是极大似然估计法。,极大似然估计法,设总体X的分布律或概率密度为f(x; ), =(1, 2, k)是未知参
4、数, X1,X2, ,Xn是总体X的样本,则称X1,X2, ,Xn的联合分布律或概率密度函数,为样本的似然函数,简记为L()。,对于固定的样本观测值x1,x2,xn。如果有,例1. 设总体XN(,2),其中,2是未知参数。求,2的极大似然估计。,求极大似然估计量的步骤:,(1) 根据f(x; ),写出似然函数,(2) 对似然函数取对数,(3) 写出方程,若方程有解,,求出L()的最大值点,例3. 已知某产品的不合格率为p,有简单随机样本 X1 ,X2 , Xn,求p的极大似然估计量。 若抽取100件产品,发现10件次品,试估计p.,例2. 设总体X服从参数0的泊松分布,求 参数的极大似然估计量
5、。,例4. 设X1,X2,Xn为取自总体XU(a, b)的样本, 求a, b的极大似然估计量.,回顾: 设X1,X2,Xn是取自总体X的一个样本,求 的矩估计量和极大似然估计量.,其中 0,解:(1)矩估计,(2)极大似然估计,7.2 点估计量的评价标准,评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量 . 即确定估计量好坏必须在大量观察的基础上从统计的意义来评价。,常用的几条标准是:,1无偏性,2有效性,3一致性,一、无偏性,二、有效性,例1:设X1,X2, X3是来自某总体X的样本,且 E(X)=,讨论的以下估计量的无偏性和一致性。,例2:设X1,X2, Xn是
6、来自某总体X的样本,且, 判断 的矩估计量是否是无偏估计。,三、一致性(相合性),切比雪夫大数定律,伯努利大数定律,7.3,区间估计,置信区间定义:,则称区间 是 的置信度为 的置信区间.,满足,设 是 一个待估参数,给定,若由样本X1,X2,Xn确定的两个统计量,正态总体均值与方差的区间估计,7.4,期望的区间估计2已知时的置信区间2未知时的置信区间,2. 求方差的区间估计已知时2的置信区间未知时2的置信区间,单正态总体四种类型的区间估计,已知方差,求期望的区间估计,例1:随机地从一批服从正态分布N(,0.022)的零件16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.
7、13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度,并求的置信区间(=0.05),查正态分布表得,使,例1:随机地从一批服从正态分布N(,0.022)的零件16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度,并求的置信区间(=0.05),求置信区间的步骤,(1) 构造仅与待估参数 有关,但分布已知的函数U;,(2) 给定置信度1-,得常数a,b,使P
8、aUb= 1-;,(3) 将aUb变形,使得:,(4) 结论,方差未知,求期望的区间估计,例2:随机地从一批服从正态分布N(, 2)的零件16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 估计该批零件的平均长度,并求的置信区间(=0.05),使,例1:用一个仪表测量某物理量9次,得到样本均值为56.32,样本标准差为0.22. 测量标准差 反映了测量仪表的精度,试求的置信水平为0.95的置信区间。, 未知,求方差的区间估计,例2:假设某地区1825岁女青年身
9、高 现抽取30名,样本均值为158cm,样本方差为(5cm)2,求2的置信水平为95%的区间估计。,例2:假设某地区1825岁女青年身高 现抽取30名,样本均值为158cm,样本方差为(5cm)2,求2的置信水平为95%的区间估计。,例3:随机地从一批服从正态分布N(2.12, 2)的零件16个,分别测得其长度为: 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 试求2的置信水平为0.95的置信区间。, 已知,求方差的区间估计,例4. 对飞机的飞行速度进行15次独立试验,测得飞机的最
10、大飞行速度(单位:m/s)如下: 422.2 418.7 425.6 420.3 425.8 423.1 431.5 428.2 438.3 434.0 411.3 417.2 413.5 441.3 423.0 假设飞机最大飞行速度服从 求最大飞行速度的方差的置信度为0.90的置信区间。,解:,2的置信区间为( 41.407010, 142.549270 ).,双总体,设总体X N(1,12),总体Y N(2,22),X1,X2,Xm来自X,Y1,Y2,Yn来自Y,且两样本相互独立。,均值差1- 2的区间估计,方差比12/ 22的区间估计,例1.设甲乙两地区女青年身高分别服从分布。甲地区抽取
11、100名,样本均值为163cm; 乙地区抽取100名,样本均值为160cm,求 的置信水平为90%的置信区间。,1,2已知时,1- 2的置信区间,即得1- 2的置信区间,例2:今抽样甲乙两地区1825岁女青年身高的数据如下:甲地区抽取50名, 样本均值为163cm,样本标准差为4cm; 乙地区抽取50名, 样本均值为160cm,样本标准差为3cm。假设身高均服从正态分布并具有公共方差,求 的置信水平为90%的置信区间。,1,2未知,但1=2=时,1- 2的置信区间,1- 2的置信区间:,1,2未知,且12,但容量m,n很大时,1- 2的置信区间,例7:两位化验员A,B独立对某种化合物的含氯 量
12、用相同方法各作了10次测量,测量的样本方差 分别为S12=0.5419, S22=0.6065,设A,B所测量值 总体为X,Y,并且均服从正态分布,方差分别为,例8:假设人体身高服从正态分布,今抽样甲乙两地区1825岁女青年身高的数据如下:甲地区抽取121名,样本均值为164cm,样本标准差为4cm;乙地区抽取61名,样本均值为160cm,样本标准差为2cm,求两总体方差比的置信水平为95%的区间估计。,u1, , u2未知,方差比12/22的区间估计,u1, , u2已知,方差比12/22的区间估计,单侧置信区间,7.5*,例12:随机地从一批寿命服从正态分布N(,2)的灯泡中抽取16个进行试验,分别测得样本平均寿命为1509.5小时,样本方差为32.232.求该批灯泡的平均寿命的95%置信下限。,单侧置信区间,设X分布函数为F(x; ), 未知,给定 (01),若由样本 X1,X2, ,Xn确定的统计量 ,若满足:,置信度为1- 的单侧置信区间, 分别为单侧置信下限和单侧置信上限,例12:随机地从一批寿命服从正态分布N(,2)的灯泡中抽取16个进行试验,分别测得样本平均寿命为1509.5小时,样本方差为32.232. 求该批灯泡的平均寿命的95%置信下限。,查正态分布表得,