1、粒子物理与核物理实验中的数据分析,杨振伟 清华大学第十二讲:特征函数,2,本讲要点,特征函数的定义 特征函数的性质 常用概率密度函数的特征函数 特征函数的应用 中心极限定理 利用特征函数求估计量的p.d.f.,3,特征函数的定义,特征函数的本质是什么?,设随机变量 x 的概率密度函数为 f(x),则 特征函数 定义为 的期望值,即,特征函数的本质是概率密度函数 f(x) 的傅里叶变换。,任意概率密度函数都存在特征函数。,4,特征函数与概率密度函数的关系,特征函数则与概率密度函数一一对应。 概率密度由特征函数的反傅里叶变换唯一确定,已知概率密度函数f(x) ,我们往往关心其特征值(比如均值、方差
2、)。 特征值提供了概率密度函数最重要的信息,但不能完全确定概率密度函数的所有性质。,也就是说,概率密度函数 f(x) 与其特征函数 是等价的。,5,为什么引入特征函数,问题:既然概率密度函数与特征函数一一对应,给出任意一个都可以完全确定概率密度函数的所有性质,为什么还需要引入特征函数?,很多问题直接用概率密度函数不易处理,但用特征函数处理则非常方便。比如, 1)求独立随机变量之和的分布的卷积变为乘法运算; 2)求n阶代数矩变为求n阶微分 ,6,特征函数的性质(1),7,特征函数的性质(2),可以推广到n个独立随机变量之和,利用反傅立叶变换可求出z的概率密度函数,8,特征函数的性质(3),利用特
3、征函数可以方便地求出各阶代数矩。,9,常用概率密度函数的特征函数,10,特征函数的应用(1),问题:既然概率密度函数与特征函数一一对应,给出任意一个都可以完全确定概率密度函数的所有性质,为什么还需要引入特征函数?,很多问题直接用概率密度函数不易处理,但用特征函数处理则非常方便。比如, 1)求独立随机变量之和的分布的卷积变为乘法运算; 2)求n阶代数矩变为求n阶微分 ,11,特征函数的应用(2),求均值和方差(以高斯分布为例),类似地,可以很容易求各阶中心矩,特征函数为,12,特征函数的应用(3),取极限 为常数,求p.d.f.的极限行为(以二项分布为例),即二项分布在试验次数很大并且均值保持不
4、变时,趋向于泊松分布 同样可以证明很大时,泊松分布趋向于高斯分布。,特征函数为,13,特征函数的应用(4),则z=x+y的特征函数,求独立随机变量之和的p.d.f.,两个独立的高斯随机变量x和y, 均值为 ,方差为,这正是均值 ,方差 的高斯分布的特征函数。 同样可证泊松变量之和仍服从泊松分布。,14,特征函数的应用(5),15,中心极限定理(1),定理:假设有n个独立随机变量xj,均值与方差分别为 。在大n极限下, 为高斯随机变量,均值和方差分别为 和 。,16,中心极限定理(2),n有限时,中心极限定理成立的条件与程度:,大致说来,只要z的求和中,每个xj的贡献都很小即可。即 z由大量微小
5、贡献组合而成。 例如,很多地方经常用12个(0,1均匀分布的随机变量之和近似高斯分布。,如果某个或某几个xj的贡献非常大,则求和的的结果将明显偏离高斯分布。,为什么取n=12?,17,求估计量的p.d.f.(1),这是伽马分布,n很大时趋于高斯分布。,18,求估计量的p.d.f.(2),要求寿命 的平均值,可以,也可以用刚才的p.d.f进行积分:,有意思的是 的最大似然估计量,如何求其期待值?,19,用该p.d.f求解期待值:,求估计量的p.d.f.(3),可以看出 不是无偏估计量。,可以先求 的分布函数:,20,对于给定 以及观测值 , 通过,求估计量期待值的置信区间,求得置信区间a, b。,利用特征函数方法求出估计量(如 )的p.d.f.,有了估计量的p.d.f.(如 ), 很多问题都可以方便地处理,比如置信区间。,21,小结,特征函数的定义特征函数的性质常用概率密度函数的特征函数特征函数的应用中心极限定理利用特征函数寻找估算子的p.d.f.,