1、 投资组合管理公式(译文)拉尔夫.文斯 Ralph Vince 期货、期权与股票市场数学交易方法 PORTFOLIO MANAGEMENT FURMULAS Mathematical Trading Methods for the Futures, Options, and Stock Markets 前言(Preface) 这是一本关于数学工具的书。从数学的观点来看,这些工具对交易者极为重要。因此,我的观点是,它们将改变交易者看待市场的方式。 本书的主旨适用于任何一种市场的参与者,尽管其初衷是针对商品期货市场的交易者。无论读者参与的是何种市场,他们很可能缺少本书中将讨论的一种或多种工具。如我
2、们将要看到的,忽视这些工具中的任何一种都将付出巨大的代价。 第一种工具只是交易选择,对系统交易者来说就是系统选择。这是多数交易者全神贯注的方面,也是大量书籍着力描述的方面。除了对诸多系统问题和系统缺陷阐明纠正措施外,本书的重点不放在交易选择或系统选择上。这些问题和缺陷主要在构造交易系统过程中应用计算机进行权衡。 现在,我们来看被忽视的工具,这些工具是正文的核心内容。第一种工具是数量。本书将向交易者阐明,对于给定的市场给定的系统,何谓适宜于交易的数量。在本书中,读者对交易市场的理解将变成为读者认识到数量与交易选择的同等重要。谁都不支配谁。读者开始认识到,他们在交易中应该控制的并非上次交易的赢或亏
3、,而是是否有正确的数量。错误的数量是如此众多的基金经理无法战胜标准普尔 500 指数的主要原因之一。指数不存在收益再投资的问题,而基金经理存在这个问题。 在令人满意的交易选择工具和适宜的决定数量工具之后,交易者需要的第三种工具是收益的相关性这一重要概念。这第二种被忽视的工具也称为多样化,而且与前两种工具同样重要。本书将对多样化程序进行量化,向读者阐明的不仅是在何种市场用何种系统进行交易,而且是针对每个市场所交易的正确数量如何实现多样化。大多数交易者只是将多样化视为一种消除风险的功能,在这种意义上,多样化被忽视。然而,多样化的作用远远多于只是消除某些与交易有关的风险。如果完全发挥作用,多样化可以
4、为改善投资业绩做好准备。如我们将要说明的,选取一个赚钱的市场一个在同一时期亏钱的市场,由这两个市场复合而成的市场可能会显出比单一的赚钱的市场具有更大的收益。 在给予交易者的能力以及交易者因忽视这些工具中的一种而受到惩罚这两个方面,这两种被忽视的工具(即数量与收益的相关性)几乎不为人理解。加上适宜的交易选择与(或)系统选择,这些构成了所谓的资金管理(money management)。所有这三种工具对于市场中任何交易的成功都是必需的。本书将用数学阐明,在市场中不使用所有这三种工具所取得的任何成功都是纯粹的偶然事件。 与资金管理工具所提出的相比,读者也将更多地受到观念上的影响。向读者介绍一种观念-
5、将交易系统所产生的利润流和亏损流看作一种非稳定分布(non-stationary distribution)。这解释了为什么系统往往运行得忽好忽坏。在自由市场中交易的任何品种的价格也显示出这一特性,这就是任何一种自由交易品种的图表似乎显示出随机产生价格的期间以及某种强非随机因素确定出现的期间(比如锁定连续的 10 天)的原因。我希望这种非稳定分布的观念在与众不同更富有成效这方面给读者以启发,而不只是将其视为进出交易的更好方式。 最后,读者将习惯于将预期大幅降低作为应用本书中所解释的技术工具保持帐户长期增长的一部分。不幸的是,如果交易者是以数学最优化的方式管理帐户,预期的大幅降低就是生活中的一种
6、现实。与大多数交易者不同,本书的读者会在心理上做好这些预期降低的准备,在它们作为程序的一部分出现时识别出它们。读者会注意到每种成功的交易程序都必须涵盖一定的时段,其间该程序的交易者会很容易被诱使中止交易。如果该程序令人满意,那么,中止交易就不是明智的选择。作为对本书中这一主题的应对结果,我希望在多数交易者很容易被诱使认输时,读者们不会认输。留有余地比认输需要更多的技巧。 俄亥俄州,查格林瀑布 1990 年 6 月 R.文斯 导言:关于本书 以前,你已经在市场中进行过交易。你相信自己拥有了某种赢利之道。现在呢? 本书将改变你看待市场交易的方式。你可能对资金管理或风险回报有一些先入之见。本书中提出
7、的某些主题可能会有启发性,某些可能会比较单调,另外一些的含义可能会有一定难度。不管你如何看待这些主题,它们对于发挥你的赢利之道的作用都是至关重要的。本书将从数学的观点向你阐明如此这般的原因所在。 本书关注的是在有利不确定性(favorable uncertainty)环境中的最优几何增长问题。所谓有利不确定性环境,换句话说,即事件集合有利的单个独立事件的风险环境。这表示存在着运用这种事实的宽频谱,即使它出现在交易市场相当狭窄的区域内。 本书中描述的许多数学知识也适用于其他的几何增长函数,比如: 细胞生长或体力增加 因广告引致的销售增长 放射性物质的衰变 药品的半衰期 化学反应的变化 物体的冷却
8、 人类、动物、植物、细菌或病毒数量的增长,或者传染病通过上述群体的扩散。 这张清单还可以不断延续下去。 不过,本书只涉及资本增长的几何函数。我们研究有关的数学并提出关于其他评判标准的增长最大化法则。在市场参与者的词汇中,这被称为“资金管理”,但是要记住:我们只是在给这种事实的运用频谱蒙上一层银色。 许多投身于市场的人对于资金管理有着错误的观念。幸运的是,在这一点上存在着正确的数学观念。本书提出了正确的数学观念,使你不会象其他众多的交易者和基金经理一样,迷失在同一片无知的海洋中。 书中所提出的许多观念来源并成熟于我为期货行业中人编程的实践之中。在 1988 年的年中,我为某个交易者设计的计算机程
9、序出现了令人困扰的异常现象。后来,一个星期五的下午,我获悉我的程序显示在这一期间它一直在赢利,而应用该计算机程序管理的帐户却没有赢利。令人困扰的是计算机程序没有丝毫的差错,而且我们采纳了所有它给出的交易信号。我搞不懂了。在那天剩下的时间里,我的思绪无法摆脱这个问题。 那个星期六的早晨,我醒来时终于领悟了解释真实发生情况的所有各种观点和公式。那些观点的痕迹最终成文于本书。我努力去做的是为交易者或基金经理描绘一幅完整统一的画面,使他们知晓为了将来取得数学意义上的最佳业绩应如何管理自己的帐户。因此,你在本书中所读到的大多数内容并不新颖;更确切地说,为了创作这幅完整的画面需要把空间填满。本书的目的也非
10、取代讨论这一主题或类似主题的其他书籍,相反,是为之增砖添瓦,并提出新的相关主题。 我无意写一本关于这一主题的书。实际情况是,由于我对这一主题的数学进行了研究,我最终得出的答案无法在五分钟的谈话中完全解释清楚。而且,答案的性质使然,最终导致一本书的形成(因为答案依次建构在彼此之上)。所以,你瞧,本书就是我一开始以为是计算机程序中一个简单缺陷(bug)的自然发展的必然结果。 在大多数人听到“资金管理”这一词语时,他们会认为你所指的是消除或降低消耗。但那不是本书中的含义。通常,你要承受巨大的消耗使你能够在市场中最有效地运用你的资金。 这里提出的观念不会保证你赚钱。它们不是能够空手套白狼的万无一失的公
11、式。相反,这里提出的观念将从数学上向你阐明,如何在你具有优势的给定条件下使潜在回报-潜在风险比率最优化。发现你的优势是你自己的职责。本书假定你已经能够在市场中赚钱。本书还假定你已经在有利不确定性环境中进行操作。 定量化在此(THE QUANTS ARE HERE) 如今,对市场的计算机化分析已经使我们达到将所有的摆动指标、均线、交易系统、以及交易市场其他的数字分析技术打入冷宫的程度。在拥有所有这些计算机化的最优化和模拟之后,我们发现圣杯(the Holy Grail)仍在躲避着我们。 加入定量化,现今的策略博弈冠军为质量控制赋予新的定义:“在其上加一个数字。”如果你能够给某个事物上加上一个数字
12、,那么你至少对这种程序有一定的理解。对市场定量化的态度是将风险管理策略作为交易市场基础的一种理解。 定量化是现今市场分析的趋势,是一种数学的而不是魔术的方法,是一种以计算机为特征而不是以年长的“高僧”的直觉为特征的方法。本书可归为定量化方法一类,但它还既不是这种方法的开端,也不是这种方法的终了。 不要将风险管理策略的标题混淆为必然意味着低风险。通常,恰恰其对立面才是真实的。这里所描述的方法涉及到潜在收益-潜在亏损比率的最大化;通常,潜在亏损可能高得使人感觉不舒服。 一般来说,这与大多数人的风险厌恶水平相悖。例如,使用本书中所讨论工具的交易者可能会发现他们的最佳交易水平应该比现在多进行一倍的交易
13、。这可能比他们所能承受的风险更大;因此,他们保持与目前同样数量的交易。这样做,他们仅有最佳数量交易时一半的风险。然而,他们没有另一半的潜在收益;他们所有的不足潜在收益的一半。 最后,本书中所描述的方法符合渐进线优势,这意味着潜在收益-潜在亏损比率在长期意义上的最大化。换句话说,所得出的结论一般带有某种事物重复无穷数次的限定性条件。 你在本书中找不到的内容 书中所选取的素材没有复杂的,尽管一开始可能需要动动脑筋才能完全领会。每一章节以教科书的格式建构在前一章节的基础上。因而,你必须按照给出的顺序一次一个章节循序渐进。 我力求尽可能地简明中肯。我力求找到折衷办法,给出复杂现象的完整解释而不至写成专
14、题论文。作为结果,某些“进一步的引申”尚未得到完整的证明。这种情况发生在以下两种原因同时出现时: 1、 我们尚未得到我们认为的对现象的完全理解。 2、 即使对这一现象描绘一幅不完整(而且,结果可能是不正确)的画面,也会需要一篇冗长、复杂而且通常是专业性的论文。 这里正好有一个这种情况的例子。我们频繁地使用统计学中所称的“正态概率分布”。我们可以使用基于这种分布的统计工具。我们经常将这些工具用于期货价格,然而,期货价格并不服从正态概率分布。一些人认为期货价格服从稳定的 paredian 分布系列,一些人认为期货价格服从学生分布(the Students Distribution),等等。我们可以
15、证明价格不服从学生分布,因为学生分布是对称的,而期货价格的分布则不是。另一方面,稳定的 paredian系列根本就几乎无法理解。我们可以研究它几乎无法理解的原因,我们可以研究其他类型的分布;由此,我们可以研究许多种推理的途径。然而,这样做是没有意义的,因为我们还没有找到这些问题的确切答案,讨论也将变得冗长而复杂。但是,这并不意味着这些不是素材及重要的问题。它们只是属于其他的书,而不是这本书。 基于类似的理由,我们也将不涉及某些相关的概念,诸如对于市场的非线性和混沌理论的研究、资金管理的专家系统,等等。这并非是因为这些主题不值得过多地讨论,而是因为这些内容(包括其他)更适合单独作为整个一本书的主
16、题。 另一个你在本书中找不到的是用来表示变量的希腊字母。谢天谢地!1970年代,在我成长的过程中我学会了用 FORTRAN 语言编程。此后,计算机键盘上就没有希腊字母了。今天没有,希望今后永远不会有。希腊字母于清晰的数学表达式没有丝毫的帮助,因此,适得其反。 章节顺序 第一章,我们研究随机过程与赌博理论。这里的目的是为以定量的方法研究交易系统打下基础。第二章研究交易系统,以及如何使交易系统将来可靠地运行。第三章建构在前两章所阐述内容的基础上,研究收益再投资的特性。正是在这一章中,我们开始讨论几何增长概念。 第四章是整本书的核心;在这里,最优 f 被引入。最优 f 是一种可能由任意概率分布的离散
17、结果流产生最大几何增长的技术(假定离散结果的加总是赢利的)。假定我们用一只温度计测量洛杉矶市区的温度。温度在全天中的变化是连续的,但是,我们只是每小时记录一次温度。那些每小时的读数就是我们所称的离散读数。它们是单独的小“信息包”,通常自另外的连续函数采样。由某个交易系统产生的交易也是离散的(尽管它们并非来自连续函数),就象轮盘赌游戏的结果一样。 第五章是关于破产风险计算的。第六章阐述如何将各个最优 f 组合为最优多样化。本章对最优系统以及用最优系统交易的市场进行量化。接下来,第七章讨论一些零碎的内容以及相关的结语。最后是一个附录,包括本书中的许多等式、运行一些有趣任务的计算机编码、以及一些随时
18、可以运行的程序。 熟视无睹(THE OBVIOUS USUALLY GOES UNNOTICED) 当你学完这本书时,书中提出的所有概念应该看上去都是明摆着的。正因为是明摆着的,你可能会纳闷:为什么你在交易中过多强调交易选择而没有充分强调这些“资金管理”概念?从数学的观点你将会看到,这些概念必定是一个合理的交易程序的核心。 有一个交易者没有给予这些技术适当权重的原因。大多数人可能从未看到数学上的明显事实。例如,在美国以及假定除英国以外的其他各个地方,如果一辆车想要左转弯,转弯车辆就必须避让迎面驶来的车辆。 现在,我们来考察一下这种情况。转弯车辆以及在同一车道上转弯车辆后面的每辆车必须等待迎面车
19、道上所有其他车辆通过。从数学上来看,目前情况下左转组织结构的“车辆等待单位”大约等于 A 乘以 B,其中,A 为左转车辆及其后面的所有车辆,B 为迎面车道上车辆的数目。 现在,我们研究一下左转车辆得到行车权时会发生什么情况(我们只考虑双车道道路的情况,红灯一亮我们即刻起程,该左转车辆为红灯亮后驶出的第一辆车。另假定左转车辆的转向灯一直亮着!)。现在,如果左转车辆被允许在迎面驶来的车辆之前转弯,车辆等待单位的等式大约为 1 乘以 B,其中,B为迎面车道上车辆的数目。 假如迎面车道上有 5 辆车,左转车道上有 5 辆车(包括左转车辆)。在目前的情况下,车辆的净等待单位为 25 个车辆单位。在另一种
20、情况下,等待单位为其 1/5,即 5 个单位。显然,第二种情况将大大加快交通流量。车辆越多,加快的流量就越大,因为这是一个指数函数。 这种观点以前曾向你说明过吗?问题在于存在着以前你所不了解的、切实可行的、合情合理的、更好的行事方式。 给初学者的书(A BOOK FOR BEGINNERS) 交易者开始学习本书时还需要具备在交易市场中赢利的技术。对此,我最后可能要说,这不是一本给初学者的书。但我的愿望是,当你学完这本书时,你会发现它物有所值。 本书中所用的惯用法(COVENTIONS USED IN THIS BOOK) 我已尽量在全书中最低限度地保留数学符号,即使全篇充满了数学等式。而且,我
21、已尽量使符号在全书中保持一致。作为结果,除法(分数)几乎都用斜线(/)表示。这比除法用其他方式表示更加“键盘化”。大多数计算机语言用这种方式表示除法。 同样地,乘法都用星号(*)表示。这样做有四个原因。首先,同样是因为大多数计算机语言用这种方式表示乘法运算。其次,使用星号,我们不会将乘法运算符 X 与命名为 X 的变量相混淆。使用星号的第三个原因是与乘法的另一种表示方式-圆点进行对比,这是因为并不是所有键盘上都有圆点,而且圆点通常不象星号一样为人普遍地接受。第四个也是最后一个原因,另一种不使用运算符的做法也可能会混淆,见以下例子的说明: AB=C 我们要问这是否表示: A*B=C 或者,这里引
22、入了一个独立于变量 A 和变量 B 的新变量 AB? 在全书中,求幂运算用凸起的加字符()表示。例如,式 103 表示 10的 3 次幂,或 1000。根式只是分数幂。因此,1000 的立方根表示为1000(1/3),显然,该式等于 10。求幂应该有一个运算符,而不只是一个幂的上角标。因此,我们的符号更加一致。当我们求一个数的根时还可以得到进一步的一致性。将加字符用作运算符,我们用与数学运算有关的方式表示求一个数的根,即一个数自乘分数次幂(实际上,当一个数大于 1 时,运算结果小于原数)。 但是,以这种方式表示求幂运算的主要原因在于,许多读者会想要对书中出现的很多内容进行编程。使用这种求幂格式
23、,会使编程更快捷、更容易,而且更不容易出错。 用这种方式表示求幂运算,我们也废止了根号的使用。这样做,我们使求幂运算更加“键盘化”,并且使得用数学优先律分析公式更加容易。此外,随着计算机的同步发展,以这种方式表示求幂运算已成为一种趋势。(在这里,我并不是试图证明一种趋势,而是顺应一种业已形成且能提高我们的理解力的趋势。) 我们往往认为我们的数字和数学符号是不变的、普遍接受的。相反,它们非常容易变化。试想,十进制直到 11 世纪才传入欧洲,但是没有被欣然接受,因为它无法表示分数。直到 1617 年,小数点才被约翰.纳皮耶引入。在 15 世纪,符号 p 和 m 被用于表示加法和减法。对我们所看到的
24、符号+和-的最早使用是在 1481 年。只是到最近几个世纪,数学符号才形成普遍接受的形式。例如,17 世纪,德国数学家莱布尼茨用类似翻转过来的小写字母 u 的符号表示乘法。笛卡儿用看上去象小写字母 o 和 c“背靠背”连接起来的符号表示等号。是笛卡儿偶然地引入了方根号,而我们在这里试图用(1/2)来取代它。在用字母 M表示之前,早期的罗马人用我们现在用来表示无穷大的符号来表示数字1000。1713 年,伯努利开始用这个符号表示无穷大,从此,这种用法就被人们接受。 数学符号的演化大多发生在最近几个世纪。随着计算机的出现,这种演化的速度现在成倍地提高。因此,我们可以在本书中发扬传统,更用凸起的加字
25、符表示求幂运算,因为数学符号的传统几乎不是静止不变的! 我非常好奇地发现,普遍接受的数学符号距今只有 100 年!我想象着我们的后代将使用某种类型的多进制体系而不是我们所用的原始单一的十进制体系。或许,他们用这样一种体系能够更好地表示无理数以及我们今天难以表达的数字概念。 许多我们想当然的惯用法将被更好的用法取代。例如,当你站在北极时,你的周围都是南方!你从北极朝任何方向迈出的第一步都是朝南的。那是因为我们的经度纬度体系用的是极坐标。极坐标试图强行使二维体系(在飞机上绘制地图)与一个三维物体(即,地球)的表面相吻合。显然,这样做是愚蠢的,无法令人满意的。我们应有更好的体系用来确切地描述三维物体
26、表面上的各个点。远在哥伦布发现美洲之前,除了几个傻瓜以外,每个人都知道地球是圆的。你还能怎样解释返航的船只在地平线上消失的事实?问题在于更好的体系并没有进入日常所用,这只是因为在人们尽力使用新体系之前,时间已经流逝。这也是本书尽量用这种方式表示数学运算的部分原因。我们的愿望是使运算更清晰,等式更容易用数学优先律进行分析(而且,结果是更容易从书中搬到计算机键盘上)。 假定读者至少具备起码的代数知识和基本的统计学知识(或者至少曾经具备)。这时候,值得复习的一部分内容是数学优先律。本书从头到尾会有大量的等式。很多读者不能充分理解等式,除非对所有的要点加以注释(否则,他们会觉得作者的表达不明确,使读者
27、对等式产生歧义)。举例说明这个问题,来看: 1+2*3 某些人可能认为这个式子表示(1+2)*3,等于 9。但那是不对的。正确的答案是 1+(2*3)或 7。 再来看等式: -6+ 上式等价于-6+49,或 43。而非: 该式等于 1。根据数学优先律你应知道这点,优先律规定除非加括号与此相反(括号只能用于与数学优先律相反的等式运算),你应按照以下方式进行等式运算: 1. 首先运算所有的求幂(包括根号)。 2. 其次运算所有的单项减法。 3. 第三运算所有的乘法和除法。 4. 第四运算所有的加法和减法。 5. 如果存在同等优先,则从左至右进行运算。 单项减法只是表示仅有一个运算域的减号。通常,减
28、法有 2 个运算域: 运算域-运算域 单项减法与此相对,仅有一个运算域: -运算域 准确地说,单项减法表示“一个负数”。如果你不理解数学优先律,现在就学习,不然对于本书中的等式你会有麻烦。 你将在书中再三遇到“市场系统”这一术语。市场系统是指关于特定市场的特定交易系统。与关于债券的系统 B 或关于白银的系统 A 相比,关于债券的系统 A 是一个不同的系统。另请注意:本书正是在这方面对金字塔式加仓进行讨论。那将使问题得到简化。我们将讨论一旦进行交易就不做金字塔式加仓的系统,而“金字塔式加仓”定义为给已在进行中的交易增加更多的合约。这样简化应该有助于理解。即使不增加金字塔式加仓的内容,我们提出的概
29、念也是复杂的。这并不是说我们完全忽视了金字塔式加仓。相反,一旦交易已在进行,期货研究员应将增加合约作为开仓系统之外的独立系统对待。这样做,我们可以对于不同的系统对苹果和苹果进行比较,也可以对于不同的系统对开仓和加仓(金字塔式)进行比较。当我们在第四章中讨论最优 f 时,你会学到作为你的开仓系统的给定市场系统的最优交易合约数。将开仓系统与金字塔式加仓系统分为独立的系统,你还能够确切地知道金字塔式加仓的合约数。 通常,书中提出的概念会以下注的方式表述,或者以赌博术语表述。赌博和投机之间主要的区别在于,赌博创造风险(由此,在大多数社会中,赌博在道德上被认为是错误的),而投机则是将业已存在的风险转嫁给
30、别的投机者。关于赌博的参考资料和例子都被用来以尽可能清晰的方式说明有关的问题。通常,用赌博说明问题比用交易说明问题更容易理解,因为用赌博说明问题往往更为简洁。不过,这并不是一本关于赌博的书。 在本书中,某些句子、短语或段落用斜体字表示。这些斜体部分并非只是加重语气。当一个概念是公理或原理时,它就会用斜体表示。因此,你在阅读中要确信你总是能够完全理解斜体字的内容。 第一章 随机过程与赌博理论 向空中抛一枚硬币。这一瞬间,你便体验到自然界最令人着迷的悖论之一-随机过程。当硬币在空中的时候,我们不能确定它落地后是正面还是反面朝上。然而,经过多次抛掷,我们就能合理地预测结果。 尽管足够奇怪,但是,关于
31、随机过程存在着大量的误解和误导。我们的祖先试图解释随机过程,而在这样的尝试中,他们创造了我们今天所说的迷信。除了概率和统计课上学到的一点皮毛之外,大多数人从未在学校学过一点有关随机过程的知识。随机过程几乎一直被错误地理解,这有什么好奇怪的吗? 因此,我们就从这里开始讨论。 在讨论随机过程时,我们会给出一些公理。这些公理中的第一条就是:随机过程中一个独立事件的结果无法被预测。然而,我们可以将可能的结果简化为概率陈述。 皮埃尔.西蒙.拉普拉斯(Pierre Simone Laplace,1749-1827)将一个事件的概率定义为事件可能的发生方式的数目与事件总的可能数目的比率。因此,当我们掷一枚硬
32、币时,得到反面的概率为 1(一枚硬币反面的数目)除以2(可能事件的数目),概率为 0.5。在我们掷硬币的例子中,我们不知道结果是正面还是反面,但是,我们确切地知道结果为正面的概率为 0.5,结果为反面的概率为 0.5。因此,概率陈述就是一个位于 0(所考虑的事件问题根本没有机会发生)和 1(事件确定会发生)之间的数字。 通常,你要将概率陈述转换为机率,反之亦然。这两个概念是可以互换的,因为机率表示概率,而概率也表示机率。现在,我们给出这些转换。当机率已知时,机率转换为概率的公式为: 概率=(正机率/(正机率+逆机率) 例如,如果一匹赛马的机率为 4 比 1(4:1),则,这匹马获胜的概率(如机
33、率所暗含的)即为: 概率=(1/(1+4) =(1/5) =0.2 因此,一匹 4:1 的赛马也可以被说成有 0.2 的获胜概率。如果机率为 5比 2(5:2)结果又如何?在这种情况下,概率为: 概率=(2/(2+5) =(2/7) =0.2857142857 从概率转换为机率的公式为: 机率(逆,比一)=(1/概率)-1 因此,对于我们掷硬币的例子,当出现正面的概率为 0.5 时,出现正面的机率如下式给出: 机率=(1/0.5)-1 =2-1 =1 这个公式给你的总是机率“比一(to one)”。在这个例子中,我们可以说成出现正面的机率为 1 比 1。 我们前面的例子又是怎样的情况?在那个例
34、子中,我们将 5:2 的机率转换为 0.2857142857 的概率。我们来将概率陈述转换回机率,看看能否做到。 机率=(1/0.2857142857)-1 =3.5-1 =2.5 这里,我们可以说成这种情况下的机率为 2.5 比 1,与说成机率为 5 比 2是一样的。因此,当某个人说到机率时,他也就是在说概率陈述。 大多数人不会处理概率陈述的不确定性;这只是因为他们没有很好地理解概率陈述。我们生活在一个精密科学的世界中,而人类的天性是相信自己无法理解那些只能简化为概率陈述的事件。在量子物理学问世之前,物理学的王国似乎是稳固的。我们有方程式用来说明我们观察到的大多数过程。这些方程式是真实的,可
35、以证明的。它们反复出现,在事件发生之前结果就能够精确地计算出来。随着量子物理学的问世,一切突然到此为止,精密科学仅仅能够将物理现象简化为概率陈述。可以理解,这使许多人感到不安。 我并非是在支持价格运动的随机漫步观念,也不是在要求你们接受市场是随机的观念。无论如何,这不是我的目的。象量子物理学一样,市场中是否存在随机性是一种情感化的观念。到这一阶段,让我们把注意力只集中于随机过程,因为这与某种我们确信是随机的事物有关,比如掷硬币或赌场的赌博。如此,我们首先可以理解随机过程,然后可以研究其应用。随机过程是否适用于其他领域(比如市场),是一个可以稍后提出的问题。 从逻辑上来讲,有个问题必然会出现:“
36、随机序列何时开始何时终结?”随机序列实际上没有终结。即使你离开牌桌,二十一点牌戏仍在继续。当你在赌场中从一桌换到另一桌时,我们可以说随机过程一直跟随着你。如果某天你离开了牌桌,随机过程可能会中断,但是,你一回来它就继续下去。因此,当我们谈到事件 X 的随机过程的长度时,我们是为了研究随机过程而主观地挑选某些有限的长度。 独立试验过程 VS 条件试验过程(INDEPENDENT VERSUS DEPENDENT TRIALS PROCESSES) 我们可将随机过程分为两种类型。第一种是那些一个事件到下一个事件的概率陈述固定不变的事件。我们将这些称为独立试验过程或放回抽样。掷硬币就是这种随机过程的
37、一个例子。不管前一次抛掷的结果如何,每次抛掷的概率都是 50/50。即使前 5 次抛硬币都出现正面,再抛一次硬币出现正面的概率并不受影响,仍然是 0.5。 在另一种随机过程中,事件的概率陈述必然受到前一事件结果的影响,自然,一个事件到下一个事件的概率陈述不是固定不变的。这种类型的事件被称为条件试验过程或不放回抽样(sampling without replacement)。二十一点牌戏就是这种随机过程的一个例子。一旦出过一张牌,这副牌的组成在抽下一张牌时就与抽上一张牌时不同。假定一副新牌已经洗过并拿走一张牌,比方说,拿走的是方块 A。在拿走这张牌之前,抽出一张 A 的概率是 4/52 或0.0
38、7692307692。既然已经从这副牌中抽出一张 A 而且不放回,那么,下一次抽出一张 A 的概率就是 3/51 或 0.5882352941。 有些人认为,上面这样的条件试验过程实际上并非随机事件。尽管如此,为了我们讨论问题,我们假定它们是随机事件-因为事件的结果仍然无法预先知道。最好的做法就是把结果简化为概率陈述。设法将独立试验过程和条件试验过程之间的区别考虑为仅仅在于,根据前面的结果,一个事件到下一个事件的概率陈述是固定的(独立试验)还是可变的(条件试验)。实际上,这是它们之间唯一的区别。 任何事件都可以简化为概率陈述。从数学的观点来看,结果可以在事实之前知道的事件与随机事件的区别仅仅在
39、于其概率陈述等于 1。例如,假定从一副 52 张的牌中拿走 51 张牌,而且你知道拿走的是哪些牌。因此,你知道剩下的那张牌是什么的概率为 1(确定性)。现在,我们要讨论独立试验过程,尤其是简单的抛掷硬币。 数学期望(MATHEMATICAL EXPECTATION) 在这个问题上,我们需要理解数学期望的概念。数学期望有时也称为游戏者胜出(对游戏者来说期望为正)或庄家占优(对游戏者来说期望为负)。 数学期望=(1+A)*P-1 其中,P=赢的概率 A=可能赢得的金额/可能输掉的金额 因此,如果你正要抛掷一枚硬币,出现正面你会赢得 2 美元,但出现反面你会输掉 1 美元,每抛一次的数学期望为: 数
40、学期望=(1+2)*0.5-1 =3*0.5-1 =1.5-1 =0.5 换句话说,每抛一次硬币你预期平均赢得 50 美分。 这个刚刚描述的公式给出了有两种可能结果的事件的数学期望。有两种以上可能结果的条件下又当如何?下面的公式将给出结果为无限可能情况下的数学期望。它也能给出只有两种可能结果的事件(比如刚才描述的 2 对 1 抛硬币)的数学期望。因此,这个公式是优先的。 数学期望= 其中,P=赢或输的概率 A=赢或输的金额 N=可能结果的数目 数学期望的计算是将每种可能的赢或输的金额分别与赢或输的概率相乘,然后对乘积求和。 现在,我们来看在更复杂的新公式中 2 对 1 掷硬币的数学期望: 数学
41、期望=(0.5*2)+(0.5*(-1) =1+(-0.5) =0.5 当然,在这个例子中,你的数学期望是每抛一次平均赢得 50 美分。 假定你在玩一种游戏,你必须猜中三个不同数字中的一个。每个数字出现的概率相同(0.33),但是,如果你猜中其中一个数字,你会输掉 1 美元,如果你猜中另一个数字,你会输掉 2 美元,如果你猜中正确的数字,你会赢得 3美元。这种给定情况的数学期望(ME)为: ME=(0.33*(-1)+(0.33*(-2)+(0.33*3) =-0.33-0.66+0.99 =0 考虑对轮盘赌中的一个数字下注,你的数学期望为: ME=(1/38)*35)+(37/38)*(-1
42、) =(0.02631578947*35)+(0.9736842105*(-1) =(0.9210526315)+(-0.9736842105) =-0.05263157903 如果你对轮盘赌(American double-zero,美国加倍-零式轮盘赌)中一个数字下注 1 美元,每转一次你预期平均输掉 5.26 美分。如果你下注 5 美元,每转一次你预期平均输掉 26.3 美分。注意:尽管以数量表示的不同的下注数量具有不同数学期望,但是,以数量的百分数表示的下注数量的数学期望总是相同的。 游戏者对一系列下注的数学期望是单个下注的数学期望之和。因此,如果你在轮盘赌中对一个数字赌 1 美元,然
43、后,对一个数字赌 10 美元,然后,对一个数字赌 5 美元,那么,你的总期望为: ME=(-0.0526*1)+(-0.0526*10)+(-0.0526*5) =-0.0526-0.526-0.263 =-0.8416 因此,你预期平均输掉 84.16 美分。 这个原理解释了为什么在赢或输的金额已知时(假定为独立试验过程),试图改变下注规模的系统是注定要失败的。负期望赌注的总和总是负的期望! 实值序列、可能结果及正态分布(EXACT SEQUENCES,POSSIBLE OUTCOMES,AND THE NORMAL DISTRIBUTION) 我们已经看到,抛一枚硬币给出两种可能结果(正面
44、或反面)的概率陈述。我们的数学期望是这些可能结果的总和。现在,我们抛两枚硬币。可能结果如下表: 硬币一 硬币二 概率 正 正 0.25 正 反 0.25 反 正 0.25 反 反 0.25 这也可以表示为有 25%的机会得到两个正面,25%的机会得到两个反面,50%的机会得到一个正面一个反面。以表格形式表示为: 组合 概率 二正零反 0.25 * 一正一反 0.50 * 零正二反 0.25 * 右边的星号说明可以有多少种不同的组合方式。例如,在上面抛两枚硬币时,一正一反有两个星号,因为有两种不同的方式可以得到这种组合。硬币 A可以为正面硬币 B 可以为反面,或者与此相反,硬币 A 为反面,硬币
45、 B 为正面。表格中星号的总数就是在抛那么多硬币(两枚)时,你可以得到的不同组合的总数。 如果抛三枚硬币,我们会有: 组合 概率 三正零反 0.125 * 两正一反 0.375 * 一正两反 0.375 * 零正三反 0.125 * 对于四枚硬币: 组合 概率 四正零反 0.0625 * 三正一反 0.25 * 二正二反 0.375 * 一正三反 0.25 * 零正四反 0.0625 * 对于六枚硬币: 组合 概率 六正零反 0.0156 * 五正一反 0.0937 * 四正二反 0.2344 * 三正三反 0.3125 * 二正四反 0.2344 * 一正五反 0.0937 * 零正六反 0
46、.0156 * 这里要注意:如果我们把星号作为纵轴绘制成曲线,我们就得出大家熟悉的钟形曲线,也称为正态分布或高斯分布(见图 1-1)。 图 1-1 正态概率函数 最后,对于十枚硬币: 组合 概率 十正零反 0.001 * 九正一反 0.01 * 八正二反 0.044 *(45 种不同方式) 七正三反 0.117 *(120 种不同方式) 六正四反 0.205 *(210 种不同方式) 五正五反 0.246 *(252 种不同方式) 四正六反 0.205 *(210 种不同方式) 三正七反 0.117 *(120 种不同方式) 二正八反 0.044 *(45 种不同方式) 一正九反 0.01 *
47、 零正十反 0.001 * 注意:随着硬币数的增加,全部得到正面或全部得到反面的概率将减小。当我们用两枚硬币时,全部得到正面或全部得到反面的概率为 0.25。三枚硬币的概率为 0.125,四枚硬币的概率为 0.0625;六枚硬币为 0.0156,十枚硬币为0.001。 (注)实际上,在纯粹的统计学意义上,抛硬币并不服从正态概率函数,而是属于一种所谓的二项分布(亦称为伯努利分布或抛硬币分布)。然而,随着 N 的增大,二项分布的极限接近于正态分布(条件是相关概率不趋向于 0 或1)。这是因为正态分布是自右至左连续的,而二项分布则不是连续的,而且,正态分布总是对称的,而二项分布则不一定是对称的。因为
48、我们处理的是抛有限枚硬币,试图使之对于抛硬币具有普遍的代表性,加之概率总是等于 0.5,故此,我们可将抛硬币分布作为正态分布处理。需要进一步指出的是,如果事件发生 N 次的概率与对立事件发生 N 次的概率均大于 0.5,正态分布可以被用作二项分布的近似。在我们抛硬币的例子中,因为事件的概率为 0.5(对于正面或反面),且对立事件的概率为 0.5,则,只要我们处理的是 N 大于等于 11的情况,我们就可以用正态分布作为二项分布的近似。 可能结果与标准差(POSSIBLE OUTCOMES AND STANDARD DEVIATIONS) 把一枚硬币抛四次共计有 16 种可能的实值序列: 1. 正
49、 正 正 正 2. 正 正 正 反 3. 正 正 反 正 4. 正 正 反 反 5. 正 反 正 正 6. 正 反 正 反 7. 正 反 反 正 8. 正 反 反 反 9. 反 正 正 正 10. 反 正 正 反 11. 反 正 反 正 12. 反 正 反 反 13. 反 反 正 正 14. 反 反 正 反 15. 反 反 反 正 16. 反 反 反 反 术语“实值序列”在这里表示一个随机过程的实际结果。给定条件下所有可能的实值序列的集合被称为样本空间。注意:上面所描述的抛四枚硬币可以是一次抛所有四枚硬币,或者是一枚硬币抛四次(即,它可以是一个时间序列)。 审视一下实值序列“反-正-正-反”和序列“正-正-反-反”,我们会发现其结果对于单调下注者(即,对每一种场合下一个单位的赌注)可能一样的。不过,对于非单调下注者,这两个实值序列的最终结果可能会大不相同。对于单调下注者,抛四枚硬币的序列仅有 5 种可能的结果: 4 正 3 正 1 反 2 正 2