1、12006 年 中国经济学年会 投稿论文研究领域:数理经济学与计量经济学贝叶斯计量经济学:从先验到结论Bayesian Econometrics: From Priors to Conclusions刘乐平 1 摘要 本文从现代贝叶斯分析与现代贝叶斯推断的角度探讨贝叶斯计量经济学建模的基本原理。并通过一具体应用实例介绍贝叶斯计量经济学常用计算软件 WinBUGS 的主要操作步骤,希望有更多的国内计量经济学研究学者关注现代计量经济学研究的一个重要方向贝叶斯计量经济学(Bayesian Econometrics) 。关键词: 贝叶斯计量经济学, MCMC , WinBUGSAbstract: Ba
2、sic principles of Bayesian econometrics with Modern Bayesian statistics analysis and Bayesian statistics inference are reviewed. MCMC computation method and Bayesian software WinBUGS are introduced from application example.KEYWORDS: Bayesian Econometrics, MCMC, WinBUGSJEL Classifications: C11, C15,
3、1 天津财经大学统计学院教授, 中国人民大学应用统计科学研究中心兼职教授。电子邮箱: 。天津市 2005 年度社科研究规划项目TJ05-TJ001;中国人民大学应用统计科学研究中心重大项目(05JJD910152)资助。2一、 引言美国经济学联合会将 2002 年度“杰出资深会员奖(Distinguished Fellow Award) ”授予了芝加哥大学 Arnold Zellner 教授,以表彰他在“贝叶斯方法”方面对计量经济学所做出的杰出贡献。1985 年,Arnold Zellner 教授在 Econometrica 上发表论文Bayesian Econometrics, 1996 年
4、, Arnold Zellner 的著作An Introduction to Bayesian Inference in Econometrics 正式出版。近年来, Gary Koop(2003)的专著Bayesian Econometrics 、Tony Lancaster (2004) 的专著 An Introduction to Modern Bayesian Econometrics和 John Geweke(2005) 的专著Contemporary Bayesian Econometrics and Statistics等,加上大量出现在各种计量经济学重要期刊上的文献无疑已逐渐形
5、成了现代计量经济学研究的一个重要方向贝叶斯计量经济学(Bayesian Econometrics ) 。本文从现代贝叶斯分析与现代贝叶斯推断的角度探讨贝叶斯计量经济学建模的基本原理。并通过一具体应用实例介绍贝叶斯计量经济学常用计算软件 WinBUGS 的主要操作步骤,希望有更多的国内计量经济学研究人员关注贝叶斯计量经济学。二、 现代贝叶斯分析与现代贝叶斯推断虽然对贝叶斯分析方法至今还有许多争议,但贝叶斯统计学在统计学中的地位可用中国科学院院士陈希孺教授的一段话来形容:“托马斯.贝叶斯这个生性孤僻,哲学气味重于数学气味的学术怪杰,以其一篇遗作的思想重大地影响了两个世纪以后的统计学术界,顶住了统计
6、学的半边天” 。在大约三百年以前,人们开始严肃地思考这样一个问题:“当存在不确定性时,如何进行推理?” 。James Bernoulli (1713)恐怕是第一个构造该问题的人(Samuel Kotz, 吴喜之,2000) 。他意识到在可应用于机会游戏的演绎逻辑和每日生活中的归纳逻辑之间的区别。对于他来说,这个未回答的问题在于前者的机理如何能帮助处理后者的推断问题。托马斯贝叶斯(Reverend Thomas Bayes, 1702-1761)是对归纳推理给出精确定量表达方式的第一人,他死后发表的论文,可以作为科学史上最著名的论文之一(Press ,1989:P181) 。他在 18 世纪上半
7、叶欧洲学术界不算一个起眼的人物。在他生前,没有片纸只字的科学论著发表。那时,传播和交流科学成果的一种方式,是学者间的私人通信。这些信件许多都得以保存下来并发表传世,例如 HuygensPascal 通信。但在贝叶斯生前,除在 1755 年有一篇致 John . Condon 的信(其中讨论了 Simpsons 有关误差理论的工作)见 John 的文件外,历史上也没有记载下他与当时的人有何重要的学术交往。不过,他一定曾以某种方式表现出其学术造诣而为当时的学术界所承认,因为他在 1742 年就当选为英国皇家学会会员,这个称号相当于今天的英国科学院院士。这篇“遗作”的题目就是An essay tow
8、ards solving a problem in the doctrine of chances (机遇理论中一个问题的解),发表在 1764 年伦敦皇家学会的Philosophical Transactions上。1812 年,Laplace 在他的概率论教科书第一版中首次将贝叶斯思想以贝叶斯定理的现代形式展示给世人。Laplace 本人不仅重新发现了贝叶斯定理,阐述得远比贝叶斯更为清晰,而且还用它来解决天体力学、医学统计、甚至法学问题(Samuel Kotz 和吴喜之,32000) 。目前被承认的现代贝叶斯统计工具的使用,应归功于 Jeffreys(1939),Wald(1950),Sa
9、vage(1954), Raiffa 和 Schlaifer(1961),Lindly(1972) 和 DeFinetti(1974-1975)。在 20 世纪90 年代,由于高维计算上的困难,贝叶斯方法的应用受到了很大的限制。但随着计算机技术的发展和贝叶斯方法的改进,特别是 MCMC 方法的发展和 WinBUGS 软件的应用,原来复杂异常的数值计算问题如今变得非常简单,参数后验分布的模拟也趋于方便,所以现代贝叶斯理论和应用得到了迅速的发展(刘乐平、袁卫,2004) 。1. 现代贝叶斯分析经典统计学,它的基本观点是把数据(样本) 看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不局限
10、于数据本身。据现有资料看、这方面最早的工作是Gauss,C F (17771855)和 Legendre,A M (17521833)的误差分析、正态分布和最小二乘法。从十九世纪末期到二十世纪上半叶,经 Pearson,K (1857 一 l 936) 、Fisher,R A (1890 一 1962)和 Neyman,J(1894 一 1981)等人杰出的工作创立了经典统计学。如今统计学教材几乎全是叙述经典统计学的理论与方法。二十世纪下半叶,经典统计学在工业、农业、医学、经济、管理、军事等领域里获得广泛的应用。这些领域中又不断提出新的统计问题,这又促进了经典统计学的发展,随着经典统计学的持续
11、发展与广泛应用,它本身的缺陷也逐渐暴露出来了,从而带动了贝叶斯理论、方法和应用的发展。贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法。(Samuel Kotz 和吴喜之,2000) 。一个完全的贝叶斯分析( Full Bayesian Analysis)包括数据分析、概率模型的构造、先验信息和效应函数的假设和最后的决策(Lindley,2000) 。贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数(茆诗松,王静龙等,1998) 。Duke 大学统计与决策科学学院的统计学教授 James O. B
12、erger,可以称得上是当代国际贝叶斯统计学领域研究的顶尖人物,他是 ISBA 的发起者,他在贝叶斯理论和应用方面的做了许多重要的研究工作。他的著作统计决策论及贝叶斯分析 (第二版) (Statistical Decision Theory and Bayesian Analysis)已作为“现代外国统计学优秀著作译丛“之一被介绍到中国。他于 2000 年在美国统计学会期刊 (JASA:Journal of the American Statistical Association)上发表文章,对贝叶斯统计学今日的状况和明日的发展进行了综述(Berger ,2000): (1)客观贝叶斯分析(O
13、bjective Bayesian Analysis)将贝叶斯分析当作主观的理论是一种普遍的观点。但这无论在历史上,还是在实际中都不是非常准确的。第一个贝叶斯学家,贝叶斯学派的创始人 Thomas Bayes 和 Laplace 进行贝叶斯分析时,对未知参数使用常数先验分布。事实上,在统计学的发展中,这种被称为“逆概率” (inverse probability)方法在十九世纪非常具有代表性,而且对十九世纪初的统计学产生了巨大的影响。对使用常数先验分布的批评,使得 Jeffreys 对贝叶斯理论进行了具有非常重大意义的改进。Berger 认为,大多数贝叶斯应用研究学者都受过 Laplace-J
14、efferys 贝叶斯分析客观学派的影响,当然在具体应用上也可能会对其进行现代意义下的改进。许多贝叶斯学者的目的是想给自己贴上“客观贝叶斯”的标签,这种将经典统计分析方法当作真正客观的观点是不正确的。对此,Berger 认为,虽然在哲学层面上同意上述这4个观点,但他觉得这里还包含很多实践和社会学中的原因,使得人们不得已地使用这个标签。他强调,统计学家们应该克服那种用一些吸引人的名字来对自己所做的工作大加赞赏的不良习惯。客观贝叶斯学派的主要内容是使用无信息先验分布(noninformative or default prior distribution) 。其中大多数又是使用 Jeffreys
15、先验分布。最大熵先验分布(maximum entropy priors)是另一种常用的无信息先验分布(虽然它们也常常使用一些待分析总体的已知信息,如均值或方差等) 。在最近的统计文献中经常强调的是参照先验分布(reference priors)(Bernardo 1979, Yang and Berger 1997) ,这种先验分布无论从贝叶斯的观点,还是从非贝叶斯的观点进行评判,都取得了显著的成功。Kass and Wasserman(1996) 对选择无信息先验分布的方法进行了综述。客观贝叶斯学派研究的另一个完全不同的领域是研究对“默认”模型(default model)的选择和假设检验。
16、这个领域有着许多成功的进展(Berger 1999) 。而且,当对一些问题优先选择默认模型时,还有许多值得进一步探讨的问题。经常使用非正常先验分布(improper prior distribution)也是客观贝叶斯学派面临的主要问题。这不能满足贝叶斯分析所要求的一致性(coherency) 。同样,一个选择不适当的非正常先验分布可能会导致一个非正常的后验分布。这就要求贝叶斯分析过程中特别要对此类问题加以重视,以避免上述问题的产生。同样,客观贝叶斯学派也经常从非贝叶斯的角度进行分析,而且得出的结果也非常有效。(2)主观贝叶斯分析(Subjective Bayesian Analysis)虽然
17、在传统贝叶斯学者的眼里看起来比较“新潮” ,但是,主观贝叶斯分析已被当今许多贝叶斯分析研究人员普遍地接受,他们认为这是贝叶斯统计学的“灵魂” (soul) 。不可否认,这在哲学意义上非常具有说服力。一些统计学家可能会提出异议并加以反对,他们认为当需要主观信息(模型和主观先验分布)的加入时,就必须对这些主观信息完全并且精确的加以确定。这种“完全精确的确定”的不足之处是这种方法在应用上的局限性。主观贝叶斯分析方法的重要进展可参见 The Statistician,47,1998。有很多问题,使用主观贝叶斯先验分布信息是非常必要的,而且也容易被其他人所接受。对这些问题使用主观贝叶斯分析可以获得令人惊
18、奇的结论。即使当研究某些问题时,如使用完全的主观分析不可行,那么同时使用部分的主观先验信息和部分的客观先验信息对问题进行分析,这种明智的选择经常可以取得很好的结果(Andrews, Berger, and Smith 1993) 。(3)稳健贝叶斯分析(Robust Bayesian Analysis)稳健贝叶斯分析研究者认为不可能对模型和先验分布进行完全的主观设定,即使在最简单的情况下,完全主观设定也必须包含一个无穷数。稳健贝叶斯的思想是构建模型与先验分布的集合,所有分析在这个集合框架内进行,当对未知参数进行多次推导(elicitation)之后,这个集合仍然可以反映此未知参数的基本性质。关
19、于稳健贝叶斯分析基础的争论是引人注目的(Kadane 1984; Walley 1991) ,关于稳健贝叶斯分析最新进展的文献可参见 Berger,(1985, 1994, 1996) 。通常的稳健贝叶斯分析的实际运用需要相应的软件。(4)频率贝叶斯分析(Frequentist Bayesian Analysis)统计学存在许多不断争议的学科基础这种情况还会持续多久,现在很难想像。假5设必须建立一个统一的统计学科基础,它应该是什么呢?今天,越来越多的统计学家不得不面对将贝叶斯思想和频率思想相互混合成为一个统一体的统计学科基础的事实。Berger 从三个方面谈了他个人的观点。第一,统计学的语言(
20、Language of Statistics)应该是贝叶斯的语言。统计学是对不确定性进行测度的科学。50 多年的实践表明(当然不是令人信服的严格论证):在讨论不确定性时统一的语言就是贝叶斯语言。另外,贝叶斯语言在很多种情况下不会产生歧义,比经典统计语言要更容易理解。贝叶斯语言既可对主观的统计学,又可以对客观的统计学进行分析。第二,从方法论角度来看,对参数问题的求解,贝叶斯分析具有明显的方法论上的优势。当然,频率的概念也是非常有用的,特别是在确定一个好的客观贝叶斯过程方面。第三,从频率学派的观点看来,基础统一也应该是必然的。我们早就已经认识到贝叶斯方法是“最优”的非条件频率方法(Berger 1
21、985) ,现在从条件频率方法的角度,也产生了许多表明以上结论是正确的依据。(5)拟(准)贝叶斯分析(Quasi- Bayesian Analysis)有一种目前不断在文献中出现的贝叶斯分析类型,它既不属于“纯”贝叶斯分析,也不同于非贝叶斯分析。在这种类型中,各种各样的先验分布的选取具有许多特别的形式,包括选择不完全确定的先验分布(vague proper priors) ;选择先验分布对似然函数的范围进行“扩展” (span) ;对参数不断进行调整,从而选择合适的先验分布使得结论“看起来非常完美” 。Berger 称之为拟(准)贝叶斯分析,因为虽然它包含了贝叶斯的思想,但它并没有完全遵守主观
22、贝叶斯或客观贝叶斯在论证过程中的规范要求。拟(准)贝叶斯方法,伴随着 MCMC 方法的发展,已经被证明是一种非常有效的方法,这种方法可以在使用过程中,不断产生新的数据和知识。虽然拟(准)贝叶斯方法还存在许多不足,但拟(准)贝叶斯方法非常容易创造出一些全新的分析过程,这种分析过程可以非常灵活的对数据进行分析,这种分析过程应该加以鼓励。对这种分析方法的评判,不必要按照贝叶斯内在的标准去衡量,而应使用其它外在的标准去判别(例如,敏感性,模拟精度等) 。2. 现代贝叶斯推断贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数。 (
23、茆诗松,王静龙等,1998)一个完全的贝叶斯分析(full Bayesian analysis)包括数据分析、概率模型的构造、先验信息和效应函数的假设和最后的决策。 (Lindley,2000)袁卫(1990)从认识论的角度阐述了贝叶斯辨证推断的思想。他认为,贝叶斯公式中包含了丰富的辨证思想:(1)贝叶斯公式既考虑了主观概率,又尊重了客观信息。(2)贝叶斯公式将静态与动态结合起来,充分利用前人的知识和经验,符合认识的发展过程。(3)人类的认识过程是一个从实践到认识,再从认识到实践这样循环往复的过程。经典的统计理论仅仅反映了这一无限的认识链条中的一个环节,即“实践 认识”过程;而贝叶斯推断则反映
24、整个认识链条中互相联系的两个环节“认识 实践认识” 。其中第一个认识活动即先验知识,反映为先验分布;实践活动主要表现为样本观察;第二个认识活动是通过认识到实践再到认识的重新认识活动,是对第一次认识的补充、修改和提高。毫无疑问,历史和前人的知识对实践会起指导作用。6陈希孺院士(1999)从统计推断的观点对贝叶斯估计进行了论述。他从纯科学研究的性质(不考虑损失,只关心获取有关未知参数的知识) ,解释了贝叶斯方法:(1)先验分布总结了研究者此前(试验之前)对未知参数可能取值的有关知识或看法。(2)在获得样本后,上述知识或看法有了调整,调整结果为后验分布。按贝叶斯学派的观点,在获得后验分布后,统计推断
25、的任务原则上就完成了。理由很简单:推断的目的是获取有关未知参数的知识,而后验分布反映了当前对未知参数的全部知识。至于为了特定的目的而需要对未知参数作出某种特定形式的推断,它可以由研究者根据后验分布,以他认为合适的方法去做,这些都已不是贝叶斯方法中固有的,而只是研究者个人的选择。陈希孺院士还总结了吸引应用者的贝叶斯推断思想和方法的特点:(1) “先验分布+样本 后验分布”这个模式符合人们的认识过程,即不断以新发现的资料来调整原有的知识或看法。(2)贝叶斯推断有一个固定的、不难实现的程式:方法总是落实到计算后验分布。这可能很复杂但无原则困难。在频率学派的方法中,为进行推断,往往需要知道种种统计量的
26、抽样分布,这在理论上往往是很难的问题。(3)用后验分布来描述对未知参数的认识,显得比频率学派通过用统计量来描述更自然些。(4)对某些常见的问题,贝叶斯方法提供的解释比频率学派更加合理。三、贝叶斯计量经济学1. 什么是贝叶斯计量经济学?Ragnar Frisch 在 1933 年计量经济学 (ECONOMETRICA)杂志首期创刊中指出:“经验表明,统计学、经济理论和数学对理解现代经济生活的定量关系都是必须的,但其中任何单独一种都是不够的,三者的结合才是强有力的,且正是这三者的结合构成了计量经济学” 。 ( ECONOMETRICS is the unification of Statistic
27、s, Economic Theory and Mathematics.) 从 Ragnar Frisch 对计量经济学的定义可以很清晰地看出,将统计学放在首位,置于经济理论和数学之前,表明统计学对于计量经济学的特别突出的重要性。我们知道,建立经济模型、估计经济模型和检验经济模型是计量经济学的主要内容,而估计和检验统计推断的主要内容正是计量经济学方法的核心,之所以在计量经济学中,统计学比数学更有效,主要的原因是因为经济问题的不确定性,而不确定性是很难用严密的数学去描述的。而什么是贝叶斯计量经济学?从贝叶斯计量经济学的英文定义Bayesian Econometrics 可以看出,贝叶斯计量经济学不
28、仅仅是在经典计量经济学的参数估计中使用贝叶斯估计或检验中使用贝叶斯检验(否则可用 Bayesian Inference in Econometrics) ,而是以贝叶斯统计思想和原理为基础,从一个全新的角度,将计量经济学模型中的参数作为具有先验分布的随机变量,然后根据贝叶斯定理,得出后验分布,以此为基础,再进行模型参数估计和模型检验的过程。贝叶斯计量经济学不仅在模型参数估计和模型检验中使用贝叶斯方法,更重要的是在模型的构建中也使用了贝叶斯思想。7如果从统计学角度对计量经济学进行分类,可以分为频率(或频率统计学)计量经济学和贝叶斯计量经济学。而其中的频率计量经济学包含了使用频率统计学的经典计量经
29、济学和现代计量经济学(经典、微观、非参数、时间序列和动态计量经济学等)的绝大部分内容。而现代贝叶斯计量经济学(Modern Bayesian Econometrics)可以理解为以 MCMC 方法为代表的现代贝叶斯统计学的发展促进了现代贝叶斯统计推断方法的进展,而将 MCMC方法和相应的软件(如 WinBUGS)应用到贝叶斯计量经济学中,对后验分布进行模拟,对模型的参数进行估计,对模型进行检验等构成了现代贝叶斯计量经济学区别于传统计量经济学的主要方面。 2. 贝叶斯计量经济学模型的构建过程有哪些步骤?按照李子奈(2005)关于建立计量经济学模型的步骤和要点,可将非贝叶斯计量经济学模型的构建过程
30、用以下框图表示:而以贝叶斯统计分析和贝叶斯统计推断为基础的贝叶斯计量经济学模型的构建过程则变换为:3. 贝叶斯计量经济学的先验信息是否可靠?对于贝叶斯计量经济学的批评的主要方面先验信息是否可靠?同贝叶斯方法受到了经典频率统计学批评类似,批评的理由也会集中在三个方面主观性、先验分布的误用和先验依赖数据或模型。针对这些批评,贝叶斯学派的回答如下:几乎没有什么统计分析哪怕只是近似是“客观的” 。因为只有在具有研究问题的全部覆盖数据时,才会得到明显的“客观性” ,此时,贝叶斯分析也可得出同样的结论。但大多数样本数据的收集经济理论 理论模型的设计 模型参数的估计 模型的检验贝叶斯定理样本数据的信息先验信
31、息模型参数的估计 模型的检验后验理论模型8统计研究都不会如此幸运,以模型作为特性的选择对结论会产生严重的影响。实际上,在许多研究问题中,模型的选择对答案所产生的影响比参数的先验选择所产生的影响要大得多。Box(1980)说:“不把纯属假设的东西看作先验 我相信,在逻辑上不可能把模型的假设与参数的先验分布区别开来。 ”Good(1973)说的更直截了当: “主观主义者直述他的判断,而客观主义者以假设来掩盖其判断,并以此享受着客观性的荣耀。 ”防止误用先验分布的最好方法就是给人们在先验信息方面以适当的教育。另外,在贝叶斯分析的最后报告中,应将先验(和数据、损失)分开来报告,以便使其他人对主观的输入
32、做合理性的评价。两个“接近的”先验可能会产生很不相同的结果。没有办法使这个问题完全消失,但通过“稳健贝叶斯”方法和选择“稳健先验”可以减轻。 (Berger, 1985)能否在计量经济学中利用主观经验,加入先验信息,我国著名科学家钱学森的一段话非常值得我们深思(成平,1990):“处理复杂行为系统的定量学方法学,是科学理论、经验和专家判断力的结合,这是定量方法学,是半经验半理论的。提出经验性假设(猜想或判断) ,是建立复杂行为系统数学模型的出发点。这些经验性假设(猜想或判断)不能用严谨的科学方法证明,但需要经验性数据对其确实性进行检测。从经验性假设(猜想或判断)出发,通过定量方法途径获得的结论
33、,仍然具有半经验、半理论的属性。当人们寻求用定量的方法处理复杂行为系统时,容易注重于数学模型和逻辑推理,而忽视数学模型微妙的经验含义或解释。要知道,这样的数学模型看起来理论性很强,其实不免牵强附会,从而脱离真实。与其如此,反不如从建模一开始就老实承认理论的不足,而求援于经验的判断,让定性的方法和定量的方法结合起来,最后定量。 ”本文观点与 Samuel Kotz 和 吴喜之(2000)观点相同,认为杰出的当代贝叶斯统计学家 A. OHagan(1977)的观点是最合适的:“劝说某人不加思考地利用贝叶斯方法并不符合贝叶斯统计的初衷。进行贝叶斯分析要花更多的努力。如果存在只有贝叶斯计算方法才能处理
34、的很强的先验信息或者更复杂的数据结构,这时收获很容易超过付出,由此能热情地推荐贝叶斯方法。另一方面,如果有大量的数据和相对较弱的先验信息,而且一目了然的数据结构能导致已知合适的经典方法(即近似于弱先验信息时的贝叶斯分析) ,则没有理由去过分极度地敲贝叶斯的鼓(过分强调贝叶斯方法) 。 ”四、贝叶斯计算方法及软件应用1. 贝叶斯计算方法20 年前,人们经常听到的一句话是:“贝叶斯分析在理论上确实很完美,但遗憾的是在实际应用过程中不能计算出结果” 。令人高兴的是,现在情况已大有改进。如今,再复杂的模型也可通过贝叶斯方法进行处理。这种改进已经吸引了许多新人加入贝叶斯研究的行列,而且还减少了关于贝叶斯
35、方法可行性的“哲学”上的争论。贝叶斯计算主要集中在后验期望(posterior expectation)的计算上,这种计算需要进行特别的从一维到上千维的积分。另一种常见的贝叶斯计算类型是计算后验分布的众数(posterior mode) 。9计算后验分布期望的传统数值计算方法是数值积分、Laplace 近似计算和 Monte Carlo重要抽样。数值积分在中等维数(最大为 10)问题上非常有效,最新发展可见 Monahan and Genz(1996)。Laplace 和其它鞍点(saddlepoint )近似方法的讨论可参考 R.Strawderman的简评(vignette ) 。至今为止
36、,Monte Carlo 重要抽样是利用传统方法计算后验分布期望最常用的方法。这种方法可以计算维数很大的问题,并且有着很高的计算精度。目前,MCMC 方法已经变成了非常流行的贝叶斯计算方法。一方面是由于它处理非常复杂问题的效率,另一方面是因为它的编程方法相对容易。最近,这方面的书籍非常多,如 Chen, Shao, and Ibrahim(2000)等。需要强调的是,并不是说 MCMC 方法已经完全替代传统的方法,在一些特别的场合(如要求精度) ,传统方法还具有它的优势。2. MCMC 方法MCMC 方法马尔可夫链蒙特卡罗(Markov Chain Monte Carlo)方法实质上就是利用M
37、arkov 链进行蒙特卡洛积分。它的历史可以追溯到 40 多年前,几乎与蒙特卡洛方法同时出现,最初出现于统计物理学(statistical physics) ,后来还被应用于空间统计学( spatial statistics)和图像分析(image analysis)的研究。在统计领域里,有关 MCMC 方法经典的文献是 Hastings, W. K.在 1970 年发表在Biometrika 上的一篇论文 “Monte Carlo Sampling Methods Using Markov Chains and Their Applications“。90 年代以来,很多应用问题都存在着研究
38、对象比较复杂和对模型结构正确识别的困难。现在根据 MCMC 理论,通过使用专用统计软件进行 MCMC 模拟,可解决许多复杂的应用问题。贝叶斯图建模的目的是用图形清晰地显示出参数之间的条件独立的假设,并以此为基础设计基于 MCMC 的计算方针。在贝叶斯图建模过程中,主要是采用 DAG(Directed Acyclic Graphy) 。对于这种方法, Best et al. (1996), Smith, Spiegelhalter, and Parmar (1996), and Spiegelhalter, Thomas, and Best(1996)都作了深入的研究,在国内,Samuel Ko
39、tz 和吴喜之(2000)在其著作中通过实例对此方法作了介绍。在贝叶斯统计中(有时在经典统计中) ,常常需要对高维概率分布函数进行积分来对总体参数进行推断或预测。而在许多情况下,这种积分是很困难的,它没有或很难写出明确的解析表达式。解决这一难题用数值积分比较困难而且不够准确,尤其当维数较大时更是如此。而 MCMC 方法是一种简单且行之有效的 Bayes 计算方法。在国内的书籍当中,关于MCMC 方法的详细内容可参见茆诗松、王静龙和濮晓龙( 1998)第六章。3. 软件介绍关于MCMC方法最重要的软件包是BUGS(Spiegelhalter et al. 1996)和WinBUGS。BUGS是B
40、ayesian Inference Using Gibbs Sampling的缩写,它是一种通过贝叶斯分析利用MCMC方法解决复杂统计模型的软件。该软件1989年开始由剑桥大学的生物统计医学研究所(MRC : Biostatistics the Medical Research Council, Cambridge, United Kingdom)开发研制,现在由MRC 和伦敦St. Marys的皇家医学院(Imperial College School of Medicine at St Marys, London.)共同开发。BUGS的运行以MCMC方法为基础,它将所有未知参数都看作随机变
41、量,然后对此种类型的概率模型进行求解。它所使用的编程语言非常容易理解,允许使用者直接对研究的概率模型作出说明。WinBUGS是在BUGS基础上开发面向对象交互式的Windows软件版本,它可以在Windows 95/98/NT/XP中使用,WinBUGS提供了图形界面,允许通过鼠标的点击10直接建立研究模型。4. 下载安装目前,关于 WinBUGS 最权威、资源最丰富的是“The BUGS Project”网站:http:/www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtmlWinBUGS1.4 软件现在免费提供下载, WinBUGS 软件非常小(
42、压缩后只有 2.86M) ,安装的方法非常简单,先将软件包(zipped version of the whole file structure)下载到你的机器中,解压缩,然后双击 WinBUGS14.exe 即可(为了使用方便,你可右键 WinBUGS 图标在桌面上创建快捷方式) 。为了避免出现软件使用过期问题,最好按网址的要求通过电子信箱获得 WinBUGS 无约束适用的“key” (免费即得) 。5. 应用实例以下通过一实际例子,来说明通过贝叶斯统计计算软件 WinBUGS 来模拟后验密度的具体操作步骤。例(引自于WinBUGS软件帮助手册中的 Volum I):George et al
43、 (1993) 讨论了分层模型的贝叶斯分析(Bayesian analysis of hierarchical models)。其中,第一层采用了共轭先验分布。该例考虑了相关的10个发电站的水泵,假设发生故障的水泵个数 服从Poisson 分布,ix即, .)(ii tPosnx10,2其中, 表示水泵 i 的发生故障率, 表示水泵运行时间的长度 (单位:千小时),ii数据见下表:水泵 1 2 3 4 5 6 7 8 9 10ti 94.3 15.7 62.9 126 5.24 31.4 1.05 1.05 2.1 10.5xi 5 1 5 14 3 19 1 1 4 22故障率的共轭先验分布
44、假设为 , .),(Gami 0,2iGeorge et al (1993) 对超参数 和 先验假设为)0.1(lExponeti).1,(a他们给出了 的后验分布,但 的标准后验分布无法给出。因而,他们使用Gibbs sampler模拟得到 的后验密度。以上表达式可用贝叶斯图建模方法(Samuel Kotz和吴喜之 ,2000, 现代贝叶斯统计学) 表示成如下有向关系图(图1),在WinBUGS中称作Doodle模型。(注意: 用alpha表示,用xi表示, 用lambdai 表示,其余类似。)ixi11for(i IN 1 : N)betaalphatithetailambdaixi图1
45、Doodle模型启动WinBUGS14,会出现两个窗口,关闭其中一个(Licence Agreement 窗口) ,你会看到如下WinBUGS主窗口(图2):窗口简单明了,WinBUGS主窗口和Windows常用窗口结构类似,关闭、最小化等基本操作相同。WinBUGS主窗口最上面一行为标题栏(heading line),下一行是菜单栏(menu heading line)有File, Tools, Edit, Attributes, Info, Model, Inference, Options, Doodle, Map, Window, Help12个菜单,最下面一行是状态栏(status
46、line)。下面分四个步骤解释怎样通过WinBUGS软件解决以上问题。步骤1:Doodle模型的建立和检验1 建立Doodle模型(图3)图 2:WinBUGS 主窗口 图 3:Doodle 模型的建立在WinBUGS的使用中,Doodle模型非常特别,它以节点(nodes)、箭头(edges )和平板(plates)等图形方式出现(对应图1:包含alpha的小椭圆形和包含 ti的小矩形都为节点;箭头分实线箭头和双线空心箭头;右侧和下侧边线较粗的大矩形称为 “平板”),可以用图形的方式来构建模型。模型的每个节点,都含有特定的属性,如名称、类型、分布或逻辑函数的定义等(name, type, d
47、istribution, or logical function definition)。以下我们按照图1的形状,以从上到下、从左至右的顺序,利用Doodle菜单构建Doodle模型。(1)打开Doodle菜单,选择New (新建)命令,可以打开一个名为“New Doodle”的对话框。键入200、150和20,作为编辑窗口的显示宽度、显示高度和节点的宽度。这三个选项控制编辑窗口和节点的大小,输入数值的大小应与模型相适合。点击OK ,一个无标题名(untitled1)的 DoodleBUGS编辑窗口就产生了。(注:可以按默认值打开,窗口大小可以按调节windows窗口的一般方法调节)。(2)在
48、此DoodleBUGS编辑窗口(untitled1)中的空白处单击(左键,下同)鼠标,会自动产生一个椭圆形节点(node)(注:在此窗口中,不能按习惯任意点击,因为一点就会出现一个节点。多余节点删除与一般删除不同,先用鼠标将需删除的节点点击选中,12然后按住Ctrl键不放,再按下delete键或backspace键删除),窗口左上方也会同时出现七个蓝色的标题,分别为name(名称), type (类型), density(密度), mean(均值),precision(精度), lower bound (下界), upper bound(上界),光标在第一个名称栏(name)内闪烁,节点可以用
49、鼠标点中后随意拖动。在名称栏(name)内,输入“alpha ”(表示 )作为此节点的名称。然后,name右侧的是类型栏(type),单击(type)不放它会自动出现下拉菜单,菜单中有三个选项:随机、逻辑和常量(stochastic, logical, and constant),第一项是默认值。由于alpha是随机变量,故选择默认值;再往右是密度栏(density),单击此栏会出现16种分布的下拉菜单栏(默认值是正态分布dnorm)。因为假设alpha服从Exponential指数分布,所以选择dexp(表示Exponential分布)密度。接下来,在scale框中输入数值1.0( )。对于下界和上界(lower bound and )0.1(lExponetiaupper bound)栏,不用输入数值,因为不需要对此节点的数值范围加以限制。这样,就完成了对模型中参数 的节点属性定义。在窗口中的其它位置重新再点击鼠标,生成一个新的节点,命名为beta(表示 )。这个新的节点的颜色相比会显得“高亮”(highlighted),