1、电子商务信息管理专业:电子商务班级:1333 班姓名:李瑞平学号:201321102330 随时确定性的随机连续时间马尔可夫过程厄尔布斯拉加州大学河滨分校基督教 r 谢尔顿加州大学河滨分校摘要我们描述一个随机确定性方法、计算过滤和平滑分布,在大型 variable-based 连续时间马尔可夫的变化过程。之前,不随机算法,收敛到真实的极限分布,无限的计算时间。当内部使用的期望导致不稳定,抽样算法可以给不同的结果每次运行最大化或其他算法。我们的方法,结合了随时收敛的性质,与随机收敛的性质,与随机抽样杂文集一一的性质操作方法。它是建立在一个时间允许订购产品的扩张矩阵前,我们证明我们的方法形式比当前
2、最好的抽样方法对基准问题。1.连续随机系统连续系统离散状态随机模型描述系统的事件时间不同步于全局时钟。例如:网页搜索(gvnawar- 达纳 etal,2012),计算机网络(徐、谢尔顿 .2010).社交网络(风扇、谢尔顿 2009)。机器人技术(Ngetal.2005),系统验证(Baier etal;2003)以及系统发育树( Cohn,etal,2009)等等。离散化时间可以计算昂贵,这个“分配”宽度必须比美国东部事件之间的时间短的多。这可能导致低效的com-pntation 事件或预期的事件的时期不太频繁,很多像表示“状态”的数值算法。(浮点而及其实现比定点表示)在发展数值算法中是有
3、用的,连续时间对随机动系统来说是有用的。本文重点是马尔可夫的模型,一个离散时间马尔可夫过程,row-stochastil矩阵 M 和分布 V(作为一个行向量)的计算。素食新闻=xmn 向前传播 n 次步骤,在一个连续时间马尔可夫过程(CTMP )率(一紧张度)矩阵Q,Vt=VeQt 。单位以相同的方法向前传播,这是在计算一步过滤平滑和参数估计中的关键,当 V 的规模很大,结构(al-v 和问降低他们的效率表示)我们关注如何计算这个矩阵指数。除了最简单的情况下,Vt 内部没有真正的;特别是在由联合作业的假设状态空间分解下的状态变量,即使 V 是完全独立的, Vt 不再有任何结构(除非Q 也代表了
4、一种完全的影响系统),这是同样的问题出现在 dy-向前运动的贝叶斯网络(DNNS )propa-gation 导致耦合系统中的所以变量,我们假设一个完整的分布状态空间太大的存储,因此寻求一个近似。1.1 以前的工作这个问题在消失的 decision-diagram-base 表示强度矩阵 Q 得到关注,然而,这背后的假设文学是,尽管 Q 可能保持代表,需要一个确切的答案,因此, Vt表示为一个完整的向量,随机算法是其中之一,例如(费尔南德 etal;1998).相比之下,我们假设代表 Vt 明确不可能的,我们将要对分销 Vt 进行预期计算。在我们的方法中,我们共同在连续时间贝叶斯网络(Node
5、lman Centrate-etal;2002),(CTBNS)。但该方法一般针对任何 Q 的克罗内克产品的总和,即使最简单的期望( 如边界) 是计算(np 困难证据证明的是一个简单的扩展贝叶斯网络), 所以我们关注近似。在文献丁腈,有许多这样的方法,大致分为两组。第一个是变分方法如预期传播(El-Hay et al .,2010)和平均场 (科恩 et al .,2009)。这些方法是确定的。然而,他们不收敛真正价值随着计算时间增加,一般只计算边界或类似的期望。美国证券交易委员会(sec)-作为集团包括重要性抽样方法抽样(风扇 et al .,2010)和吉布斯抽样(Rao 来自他们!(13
6、):这对应于我们的层表示的问是 0 和有一个 Bj 为每个变量和实例化它的父母。我们可以强度拉进一个矩阵定义 B(ijui);i0 =8 (Tt)(and 然后 result).正常化首先,考虑每个指数分别计算。让“转发”方向的结果 pJ .提出计算的 jth 节点贡献在哪里 j =纳米 i= 1 j,i。让“落后”的方向是类似的图 4.计算时间与吉隆坡发散的环形线圈网络= 2 时,= 0:5图 5.计算时间与吉隆坡发散的环形线圈网络 = 2 时,= 1表示为 它可以很容易地可显示为因此,我们必须考虑每两个节点,一个从向前扩张和一个来自向后扩张。对于每一对,分解想必的组件同轴和逐点地增加在一起
7、得到的对答案的贡献。我们想要包括这些条件对最好明智地使用预算有限的计算。我们这样做是通过保持一个弗伦联盟-层组对计算节点,一个向前的树和一个从落后的树。如果我们有了( 添加到平滑结果)jk,我们添加到弗伦联盟 -层组 j 和 k 的所有儿童和 j 的孩子配上 k。我们用一个封闭列表以确保没有一对接下来的问题是如何优先弗伦联盟的成员层。我们需要估计的总贡献这副图和所有后续对。我们选择这个查询节点的贡献值的总和(呈献值的变化),最大的产物每个节点的价值。3、实验我们实现了我们的方法,TTOP(树的时间-订购产品),如 CTBN-RLE 代码库的一部分( 谢尔顿 et al .,2010),它将包括
8、在未来版本。我们评估我们的方法合成网络伊辛模型的动力学。是一个著名的伊辛模型与应用程序交互模型在许多领域萤火虫- 荷兰国际集团(ing)统计力学、遗传学和神经科学 (周然而,错误 forMF 超过误差范围其他方法的计算时间。由于这个原因,我们在故事情节省略 MF 的结果。我们分析错误在边界相对准确,计算每个方法过。我们专注于计算时间,因为在我们的实验记忆和整个 computa不是一个问题树只有少数 GBs 占领。TTOP,我们设置了数字正交的分裂(见方程 5)10,因为它产生一个好的 compu -界定的时间和错误的性能。我们改变 compu -界定时间预算观察 compu之间的权衡界定时间和
9、错误。AuxGibbs,我们不同样本大小和 50 之间 5000 年,设置这个值的老化期为 10%。的是,500 年到 50000 年之间的样本大小各不相同。我们跑实验为每个测试对山姆- 100 倍当乞丐的方法。所示的计算时间的情节平均这些运行给定的萨姆-pl。这个错误是所有的 KL-divergences 之和从他们的真实值边界。我们的实验关注平滑。网络开始从一个确定的状态,在 t = 0 m = 9:变量 1 - 5 + 1 和 6 - 9 是 1。在 t = 1、变量 1 - 3 转到 1,4 - 5 + 1,6 - 9 已经转向+ 1。m = 15和 21 的增强型植被指数我们使用一个
10、类似的模式丹斯原因比较。m = 15,变量 1 - 5、7 - 8、10 - 11 + 1 开始,剩余的变量从 1 开始。变量 1 - 3 开关 1,4 - 5、7 -8、10 - 11 留在 + 1,6、9 和 12 - 15 + 1。m = 21 的证据也遵循相同的模式扩展到21 个节点。节点之间没有观察到 t = 0 和 t = 1。我们查询在 t = 0:5 边际分布的节点。图 4 和图 5 显示计算时间与笔吉隆坡 -地区的差异。我们专注于第一个 20 秒计算时间,因为通常几秒钟足以让我们的推理任务。块中的行 con -继续他们的趋势和交叉在某种程度上,除了图 4 b。KL-diver
11、gence 笔 10 2 通常是准确的对于这些网络。图 4 显示了结果= 2,= 0:5。对于大多数这些实验,TTOP 执行比抽样方法。当网络的耦合强度= 1,如图 5 所示,TTOP 更多误差随着计算时间的增加而变化总体上仍然有更好的性能。偶尔的山峰在错误发生,因为有时一个 com的一部分 putation 树扩展添加到总和,没有部分平衡,因为预算的时间过期。这可以被视为更多的计算时间的算法,平衡的错误减少的部分。方法使计算时间与错误的优势。此外,我们的方法和其他人之间的差距皱纹与网络的大小。特别是当= 1,它执行更好的更大的网络。虽然我们可以 -不执行精确推理更大的网络,我们预计这些趋势将
12、继续随着问题规模的增加。TTOP 也更短的计算时间,是-导致它解决 e(上)直接集成在山姆-当乞丐方法可以生成只有少数样本。虽然的衍生品小 TTOP 线,这可能可能固定有更好的节点优先级。最好的节点优先级会看着 contri -bution 整个子树的根节点,而不是只有该节点的贡献。我们的启发式是好的最初的几个级别的树,但它确实不一样当我们去更深层次的在树上。预计 TTOP 误差的波动。的抽样误差从单一运行会波动好。我们的方法的绘制结果来自一个运行相比平均抽样方法的结果 100 年运行。4、结论我们演示了一个结构化的随时算法 CTMP 滤波和平滑。不同于之前的工作 ,这是德-terminist
13、ic,可以当用在学习中受益荷兰国际集团(ing) 的方法。在实验中,它具有更好的计算时间和误差性能比之前随时转换绅士的方法,尤其是对松散耦合的系统。也随着网络规模的增加和耦合强度保持相同的,我们的方法的优势增加。应答这项工作是由劳拉p利兰 K。惠蒂尔虚拟 PICU 洛杉矶儿童医院(加州大学河滨分校的奖项- 12101024 和 8220 - sgnzz0777 - 00)美国国防部高级研究计划局(奖 fa8750 - 14 - 2 - 0010)。引用赫尔曼斯 Christel,Baier Haverkort、Boudewijn,Holger,和 Katoen Joost-Pieter。模型检
14、测算法连续时间马尔可夫链。ieee 软件工程,29(6):524 - 541 年,524 年 6 月。伯奇,杰瑞r。克拉克,埃德蒙。长,大卫e。符号模型检测和重新分区的过渡颁布的。在国际会议上非常大的规模集成、49-58 页。1991 年 8 月。Ciardo,詹弗兰科和 Yu,安迪 Jinqing。饱和,使用连接词象征意义的可达性分析和分离的分区。在正确的硬件设计和验证方法,146 页 161 年,2005 年。科恩,被罩,El-Hay Tal,Kupferman,拉兹和油炸人,近红外光谱。平均场变分近似连续时间贝叶斯网络。在诉讼程序 unc - 25 日的国际会议 2009 年人工智能,t
15、ainty。戴森,f . j . Tomonaga 的辐射理论施温格,费曼。物理评论,75(3):486502 年,1949 年。El-Hay Tal,科恩,被罩,弗里德曼,近红外光谱,Kupferman,拉兹。连续时间的信念传播。在继续-第 27 届国际会议上的新年机器学习,第 350 - 343 页,2010 年 6 月,以色列海法。粉丝,Yu 和谢尔顿,基督教学习连续- r 社交网络动力学。在诉讼程序 25 日国际会议上的不确定性人工智能,2009 年。Yu,徐京,谢尔顿,基督教 r .重要的-例如取样连续时间贝叶斯网络。机器学习研究杂志11 日(8 月):2115 -2140 年,20
16、10 年。费尔南德斯、保罗、高原、碧和斯图尔特,威廉J。在随机有效 descriptor-vector 乘法自动机网络。ACM 的杂志,45(3):381 - 414,1998 年。Gunawardana Asela,温顺,克里斯托弗和徐,濮阳。事件流的时间依赖模型。在神经信息处理系统的进步,24 卷,2012 年版。埃里克和 Yosiphon Mjolsness,家伙。随机过程 se -占卜的动态语法。上数学,ics 和人工智能,47(3 - 4):329 - 395 年 8 月 2006 年。硅藻土,克里夫和贷款,查尔斯。19 个可疑的计算一个矩阵的指数的方法,25岁年后。暹罗,45(1)
17、:3-49,2003 年。Najfeld,伊戈尔和哈维尔 ,蒂莫西f马的衍生品特利克斯指数及其计算。美联社-的进步于数学,16:321 - 375,1995。Ng,布伦达,菲费尔,Avi,狄尔登理查德。Continu -我们的时间粒子滤波。在九- 人工英特尔teenth 国际联合会议 ligence,1360 - 1365 年,1360 页。Nodelman,Uri,谢尔顿,基督教 R。科勒,达芙妮。连续时间贝叶斯网络。在学报十八国际会议上的不确定性在人工智能,378 - 387 年,378 页。饶,Vinayak 和,Yee Whye。快速获得萨姆-马尔可夫跳过程的乞讨和持续时间贝叶斯网络。