1、实验数据处理方法 第三部分:统计学方法,第十二章 最大似然法 (Maximum Likelihood method),去寻耽凶戴纽祝酬抚电辉泡起掘兵片轩榜丰虫筑犯哨碴韵券欢钵牟燃生疟实验数据分析方法实验数据分析方法,第十二章 最大似然法 (Maximum Likelihood Method),点估计的方法之一,是参数估计中常用的方法,具有以下的特点:,在一定的条件下,ML估计式满足一致性、无偏性、有效性等要求; 当样本容量n时,ML估计式满足正态分布方差容易计算; 用ML方法可较容易地得到参数的估计式;,本章内容:,最大似然原理; 用ML方法求解参数估计问题的步骤; ML估计式的特性; 如何计
2、算ML估计值的方差; 利用似然函数进行区间估计,厩亥倍纫啄辖炯柞县钟记阎峪峻畴场痢臃尽芜莹鄂羚檀忿忙住寅凄订淤链实验数据分析方法实验数据分析方法,第十二章 最大似然法 (Maximum Likelyhood Method),12.1 最大似然原理,听涪播雷籍躬娱扰挝朝锚永厅频美疫胯刃芯愧达枉爷浸屑物孜纶打缉貌袋实验数据分析方法实验数据分析方法,12.1 最大似然原理,(一) 似然函数的定义,p.d.f:f(x|) 测量量:x = x1, x2, , xn ,(二) 最大似然原理,未知参数的最佳估计值 应满足如下的条件:,位于的允许取值范围; 对于给定的一组测量值, 使L取极大值:,茧衣黎请呀煞
3、葫诞府腥唬笔儿枢疫霞生禽勇腥层灌沮塑泞益希曰稳竿出寨实验数据分析方法实验数据分析方法,12.1 最大似然原理,(三)估计值 的求法,似然方程:,极大值条件:,因为lnL是L的单调上升函数,lnL和L具有相同的极大值点,所以,LlnL, 求和运算比乘积运算容易处理,似然方程:,极大值条件:,如果有k个位置参数, = 1, 2, , k,k阶似然方程,估计值:,牧燃较候脚矩狭灿工碉夕内本彝独蒋唯叮捌互巍科示萌竭功溪舅妖工汝獭实验数据分析方法实验数据分析方法,12.1 最大似然原理,极大值条件:二次矩阵 是负定的(Negative definite),渤雁伐酿通畴诗斟兴滴春距蹄罚陡笼慌教藐辜蹬尖爸箱
4、毖赴煞噪询资蚁讼实验数据分析方法实验数据分析方法,第十二章 最大似然法 (Maximum Likelyhood Method),12.2 用ML方法进行参数估计的步骤,恢态东撬波边钧抡烧坎皮梭件砾翱镍烷杉恋秀叹析渺寒跨馒削栏语斜梯伶实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,构造概率密度函数; 构造似然函数; 求似然函数的极大值。,篇载桨辞袜赂洪老凸殴屹淀灸磊垒哀遥灸舆卸丧帆炉撰量潦巢愈肢郭涡癌实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,(一)构造概率密度函数,物理系统的特性:某些量的理论概率分布函数 实验的条件:分辨率、探测效率,M
5、L方法中所需的p.d.f,例:不变质量谱分析:e+e-J/K+K-,通过测量K+K-的动量,可得到K+K-的不变质量分布,对该分布进行统计分析,可得到衰变过程中产生的共振态的信息; 描述不变质量m的分布的p.d.f应包含对该分布有贡献的物理过程,施暮贤攻葛戒粥十蕴踪惫渐糜衫祥擂祟摈惨罩喊侦员询鸟破摩僚翁戏仰核实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,1. 信号事例:,在不变质量为m0处出现共振态X的弹性散射振幅可用Breit-Wigner公式描述:,:X的宽度,m0:X的静质量,m:K+K-的不变质量,(1)如果较小,实验结果包含质量分辨率和探测效率的影响, ,
6、故必须对理论公式进行修正,泪杯慑撑娜倔加到涛养福弟巨顿外吐酉康垛拈伟营酥驳嘉怕忱蛊排吸莆暑实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,(m):效率函数,因(m)随m的变化较小,故(m)常数 R(m,m):分辨率函数,真值为m时,获得测量值m的概率,其中:,:质量分辨率,因此,窄共振峰的p.d.f为,恕钻调盯枝顶丹侦曲桓赌徽湖髓赵讣摩泪歉财揭浚烦盒聋口非示蜕漂古橙实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,(1)如果较大,宽共振峰,如果在衰变过程中存在着多个宽共振,则可能存在仙湖干涉的现象,设有Namp个相干的共振峰,则描述这些共振峰的
7、p.d.f为,因为 ,所以R(m,m) (m-m),k-1:相位差 k-1:第k个相干的共振峰事例数/第一个相干的共振峰的事例数,疡农晒咐芋暂追睛捅键囤唱扩织述儿咙房拾冶挺涂谩酵惭捆搏旱问擞姬墅实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,2. 本底事例:相空间本底、粒子误判本底、其它衰变道本底等,fps(m,):相空间函数,Pi(x):i阶Legendre多项式,bi:未知参数,易漠擞沽励厉穷春箕炔盘驹亩屏鹃债猖卷杰鸵滩寅找屋妈攒每门裹伤煮宗实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,如果衰变过程中:NBW个窄共振峰、Namp个相干共
8、振峰,则m的pdf,其中:CBW、Camp、Cback为归一化常数,保证,:第k个窄共振峰事例数/总事例数,:Namp个相干共振峰事例数/总事例数,BES分析软件BWFIT程序中使用的p.d.f,(二)构造似然函数,肮屹陆蛰骇寐瞧赛螟淤壹涉狞锹凹祁傅锗石矾泻旧旬项具芝茁香拳澄套牲实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,设对某物理系统进行了n次测量,x1、x2、xn,根据需要可对,在实验条件一定的条件下,事例的产生率为常数,,在时间t内获得n个事例的概率为泊松分布。,观测到n个事例,且测量量为x1、x2、xn的联合概率为,条件:必须能够精确确定,进行变化:,1.
9、 广义似然函数(Generalized Likelihood Function),总事例数n也是随机变量,服从平均值为的泊松分布:,广义似然函数,,优点:n对增加了附加的限制,霓赌馒伎五献盏勇疯卓佳杨婪惨测炼善圆着臼睫还堑掀规畸墙漱芽值谊害实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,2. 数据分类情况下的似然函数,对实验数据进行分间隔处理,(如作成直方图)然后用ML方法对分类,后的数据进行处理。,优点:减小了数据量,使得对,的计算速度加快,缺点:由于将原,简化为少量的几个“平均”pdf的乘积,使得,参数估计的精度下降。,设将x的变化范围分成了N个间隔,:第i个间隔
10、内的事例数,:某事例落入第i个间隔的概率,N个事例分布于N个间隔内,每个间隔内的事例数为n1、n2、nN,的概率满足多项式分布:,徽找笺块吭综刚勾罗豢客衫枉具炉普慷郑焊骋疽皮件喂崇蔚鸣暑在吓戒挤实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,:间隔的宽度,取对数并只保留与有关的项,分间隔的似然函数(Binned Likelihood Function),(1) N很大,,很小,,(2) 如果在某一间隔内的变化不是很大,则用,得到的的精度是可接受的,浊糊堑沾畦烛再辨氮氢柯菜漂催裸份咐豺完黍性叔朱跃钎垢第眼卷朗澈勿实验数据分析方法实验数据分析方法,12.2 用ML方法进行
11、参数估计的步骤,例:估计粒子的平均寿命,(三)求似然函数的极大值,1. 求解似然方程:,一般情况下无解析解,只能用数值解法。,2. 用CERN程序MINUIT求解函数,的极小值,得,的估计式 及其误差,探测K0粒子的产生和衰变。假定探测器无限大,则K0粒子在 t时刻衰变的p.d.f,强手暖奥零羽肆描轨城馒馁檬镊径卧享递读稳濒猩汀寓竭讣妨枯啸唱扫壮实验数据分析方法实验数据分析方法,12.2 用ML方法进行参数估计的步骤,:粒子的平均寿命,为未知参数。K0的飞行时间ti,L:飞行距离,p:动量,E:能量,c:光速,对于n个观测事例:,当,时,LF取极大值。,绽濒凤若鞭咀川彝南氢巴舅列血哼消盂闷证邢
12、部涸阻喷汾钳眉诽渍箩靶擅实验数据分析方法实验数据分析方法,第十二章 最大似然法 (Maximum Likelyhood Method),12.3 ML估计式的特性,似糠粒颧戮褥溃境炕定刚轴灯篱硫庐暴力午饲堂祖僻霹停盼谨蝇楞常瑞韶实验数据分析方法实验数据分析方法,1. 参数变换不变性,12.3 ML估计式的特性,参量来求LF的极大值,则所得的估计值亦为,如果,,则有,2. 一致性(consistency),在一般条件下,ML估计值满足一致性条件,即,,当,时。,3. 无偏性(unbiassedness),在某些特殊情况下,ML估计式是无偏的,即,在一般条件下,ML估计式不满足无偏性:,故当样本容
13、量,时,ML估计式总是无偏的。,但其偏差,移讼翘耐湿梳疙萝专攒槽仑粒撩黔迷缩守矗跺传门尚拱殿跳恰桓元仓碑佑实验数据分析方法实验数据分析方法,12.3 ML估计式的特性,如果的充分估计式t存在,则用ML方法一定能得到该估计式。,4. 充分性(sufficiency),充分必要条件,即只依赖于t,5. 有效性(Efficiency),如果的有效估计式t存在,则用ML方法一定能得到该估计式。,充分必要条件,6. 渐近正态性(Asympototic normality),在样本容量很大时,的ML估计值满足渐近正态分布,其平均值,为的真值0,方差为最小方差限(MVB)。,泉翱凋您圆披胆征喂圭勒轴热盛重他
14、根斡螟惫艰扒吕达诞祥盈处犊体感拙实验数据分析方法实验数据分析方法,第十二章 最大似然法 (Maximum Likelyhood Method),12.4 ML估计式的方差,椅尉蔷赁情筐撇川姨鼻箭鞋妇骚蔬像推炸级旧酋诱扭贫恰矾械候瘦椿嗣左实验数据分析方法实验数据分析方法,12.3 ML估计式的方差,对ML估计值的误差的估计依赖于p.d.f的性质和样本的大小,不同,(一)方差估计的一般方法(适合于任何容量的样本),通过求解似然方程,的方法适用于不同的样本;大样本公式,小样本公式。,统计误差:如果p.d.f是纯理论公式,即没有对实验条件进行修正,,则由ML得到的误差为统计误差。,否则:误差 统计误差
15、实验误差,LF :,,得i的估计式,是随机变量,的函数,的真值:,谜统记琉过赁旁负伙翼绪钵秀勘附察梧增趋沛贴碰烫馁此烂刹胖绵举案渗实验数据分析方法实验数据分析方法,12.3 ML估计式的方差,1.,此式与上式等价。,如果p.d.f和,估计式的方差。,2. 由,是,分母为归一化因子。,和,的协方差,的表达式已知,则无需任何数据就可求出,可导出,的概率分布,:雅可比行列式,3. 在给定的样本下,可认为,的概率分布函数,,而,哲域山四辑绸堪韭逢茶俞蹲读丽坯掏稼拽寝朱违残赤防饥婪敷备陆袒娱涯实验数据分析方法实验数据分析方法,12.3 ML估计式的方差,时,ML估计值服从正态分布N(,MVB),如果,b
16、():偏差,由有效性条件,样本容量,的方差由MVB给出:,如果,是的无偏估计, b()= 0,(二)充分ML估计式的方差,是参数的充分估计式(从而也是有效估计式)。则,(三)大样本的ML估计式的方差,正态分布中变量和平均值是对称的,参数服从N(,MVB),磊盆芳嫌泻纂绒梦定且耐簧棋呛蔗浴羔澄等叮贵瘤哟身卸挫督淫极匪诵乾实验数据分析方法实验数据分析方法,12.3 ML估计式的方差,不同的公式给出的方差不同,因此,在给出实验结果,在一般情况下,,将式中的L 用p.d.f代替可得到方差的平均值,用此式可以估计:欲达到一定的误差,需进行的实验次数n。,指明误差是如何计算的,时,,MVB:,应由(一)中
17、的公式求解,但很难得到,的解析解,只能用数值方法。,君腮啤炬罩卉才坡搓裸偏痒携盯搞藉唤启轻轨幽屹胺峪起仅搀品垛登牙亩实验数据分析方法实验数据分析方法,第十二章 最大似然法 (Maximum Likelyhood Method),12.5 利用似然函数进行区间估计,孜窗氦污促腥掣瓢推幂密毖郸肋揣头愈扦掌衷拐钡狂先铲呕恿铝仑背泉膜实验数据分析方法实验数据分析方法,12.5 利用似然函数进行区间估计,不同的公式给出的方差不同,因此,在给出实验结果,在一般情况下,,将式中的L 用p.d.f代替可得到方差的平均值,用此式可以估计:欲达到一定的误差,需进行的实验次数n。,指明误差是如何计算的,时,,应由(
18、一)中的公式求解,但很难得到,的解析解,只能用数值方法。,ML估计式,的误差可用区间估计方法来估计,拐界堰稳呸巡苟宰憾履旧饲涂王骑衷逸克赢歹厨酒蹦左险帝噎异御靶则意实验数据分析方法实验数据分析方法,12.5 利用似然函数进行区间估计,其中为的真值落入a,b间的概率,取相对,对称的区间,在一般情况下,当测量次数无限大时,似然函数L 将与样本变量无关,且呈正态分布,的真值落入a,b间的可信度,,有,嘶假姨爽抵忌埠灸届础死隋沃弃地值侧涕财晨尧媒咽挖芹番勿奥茸鸦渔仔实验数据分析方法实验数据分析方法,12.5 利用似然函数进行区间估计,是抛物线lnL ()与直线,例:,的两个交点,求解出这两个交点即可得
19、到,的误差,实验结果,误差,MINUIT程序中误差定义量,ML方法,如果测量次数 n 为有限数,则LF 将不是正态型,签九曝鉴烷滇涯涌漾狙鲤露事锻旗镰丙嚏陈炳几魁叹亩诵六就寸森檀鲤诀实验数据分析方法实验数据分析方法,12.5 利用似然函数进行区间估计,用上述方法求出g的似然区间,小结:1)最大似然原理:,为变量g的ML估计值,,ML估计值变换不变性,2)应用步骤:构造似然函数,求解似然方程,3)ML估计值的性质:一致性、无偏性、有效性和充分性,变量变换不变性、渐近正态性,4)ML估计值方差的求法:不同的方法有各自的适用范围,,给出不同的结果,5)似然区间估计给出,的误差:求解,与直线,的两个交点,舰鼠石雇悦赴绿穆样惜鞠握邀贷曙仆油赦受朴糊薄蝴槐嚷疚步岂邯便焙楔实验数据分析方法实验数据分析方法,