收藏 分享(赏)

EM算法的数学本质.docx

上传人:HR专家 文档编号:6297862 上传时间:2019-04-05 格式:DOCX 页数:2 大小:51.85KB
下载 相关 举报
EM算法的数学本质.docx_第1页
第1页 / 共2页
EM算法的数学本质.docx_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

1、EM 算法如果我们碰到一个这样的数学模型,它的参数 (高维)控制着两层变量,一层变量为隐层变量,一层变量为观察变量,那么假设现在我们观察到了观察变量,想估计 ,那么我们可以用最大似然去估计它。既要求 lnp(X|),但是我们只知道联合分布,而不知道边缘分布,那么就要转化成为(1)但是右式难以计算,那么要想办法把求和符号放在对数外面。下面叙述如何变成想要的数学形式。利用贝叶斯公式可知 p(X|)=p(x,z|)/p(z|x,)。同时取对数得 lnp(X|)=lnp(x,z|)-lnp(z|x,)(2)。我们现在观察右式,由于 x 是观察变量而 z 是隐层变量,我们仍然无法计算,怎么办呢?我们的想

2、法就是首先处理隐层变量让这个隐层变量消失,那么就要加上求和函数,如何加这个求和函数呢?利用等式两边可以同时乘以 1 的性质,而 1 如何换做求和函数呢? 设一个 z 上的一个函数 q(z),使其在 z 上求和为 1,这样可以再( 2)式左右同乘以 1,然后换成 可得下式:(3)这样我们处理掉了隐层变量,但是 q(z)的形式未知,还是不能计算,如何处理 q(z)?我们想想是不是可以利用数学形式上的方便来估计 q(z), 现在(3)式做变形如下:(4)后面的一项就是所谓的 KL 距离,通过某种限制使其是大于等于 0 的,前面的一项称之为下界。如果 P(Z|X,)后验概率可以计算的话,我们令 q(z

3、)=p(z|X,),(也就是令 kl 距离为 0,这样下界可以最大),(这里的 可以预先设置一个值,以后在最大似然的过程中,迭代更新 ,这里到底为什么可以通过迭代更新找到最佳,有时候只有利用这种迭代的方式去解决没有解析解的数学问题)。这样就剩第一项下界了。这样的做法好处有 2,1 是把二式划归为一式,方便计算,2 是我们达到了最初想要的目的,把求和符合很自然的过渡到了对数的外面。(这就是伟大的数学,艺术啊)(有人会问为什么不让 q(z)=p(x,z|),消去第一式,利用第二式去迭代更新,原因很简单,就是一个是二元函数,一个是一元函数)。以上就是 EM 算法的数学本质,一句话概括就是,目的是方便

4、计算,方式是迭代更新。迭代更新的实质:没办法一次性解决问题的时候,只能迭代解决,一次解决一个小问题,然后往后滚,每次利用上一次的计算结果,依次下去,这在算法上本质就是动态规划算法,所以我猜测最早做动态规划算法的计算机科学家一定是个计算数学家。我们注意到如果 z 的后验概率难以计算 ,可能因为维度太高,或者数学形式很复杂,怎么办呢?2 种方法去解决,一种是采样方法,一种是变分法去估计后验概率,其中变分法的理论基础就是泛函分析,变分法在数学领域里面本身就是一个分支,这里是利用其成果。关于这 2 种方法都有很深的研究工作。要想继续研究这些知识,需要更深入的学习。2011 年 11 月 26 日晚于燕园

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报