收藏 分享(赏)

博奕论论文.doc

上传人:gnk289057 文档编号:7112988 上传时间:2019-05-06 格式:DOC 页数:2 大小:21.19KB
下载 相关 举报
博奕论论文.doc_第1页
第1页 / 共2页
博奕论论文.doc_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

1、囚徒困境囚徒困境(prisoners dilemma )是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。 囚 徒 们 虽 然 彼 此 合 作 , 坚 不 吐 实 , 可 为 全 体 带 来 最佳 利 益 ( 无 罪 开 释 ) , 但 在 资 讯 不 明 的 情 况 下 , 因 为 出 卖 同 伙 可 为 自 己 带 来 利 益 ( 缩 短刑 期 ) , 也 因 为 同 伙 把 自 己 招 出 来 可 为 他 带 来 利 益 , 因 此 彼 此 出 卖 虽 违 反 最 佳 共 同 利 益

2、 ,反 而 是 自 己 最 大 利 益 所 在 。 举 一 个 简 单 的 例 子 就 是 : 警 方 逮 捕 甲 、 乙 两 名 嫌 疑 犯 , 但没 有 足 够 证 据 指 控 二 人 。 于 是 警 方 分 开 囚 禁 嫌 疑 犯 , 分 别 和 二 人 见 面 ( 两 罪 犯 不 能 交流 ) , 并 向 双 方 提 供 以 下 相 同 的 选 择 : 若 一 人 认 罪 并 作 证 检 控 对 方 ( 相 关 术 语 称 “背叛 ”对 方 ) , 而 对 方 保 持 沉 默 , 此 人 将 即 时 获 释 , 沉 默 者 将 判 监 10 年 。 若 二 人 都 保 持沉 默 ( 相

3、 关 术 语 称 互 相 “合 作 ”) , 则 二 人 同 样 判 监 半 年 。 若 二 人 都 互 相 检 举 ( 相 关 术 语称 互 相 “背 叛 ”) , 则 二 人 同 样 判 监 2 年 。 “坦白从宽,抗拒从严 ”的道理人人都懂,但往往囚 徒 们 必 须 考 虑 刑 期 以 外 之 因 素 ( 出 卖 同 伙 会 受 到 报 复 等 ) , 而 无 法 完 全 以 执 法者 所 设 立 之 利 益 ( 刑 期 ) 作 考 量 。 举个最简单的例子,大家都知道国外的黑手党组织严密,对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。我们假设前面的囚徒困

4、境故事不是发生在中国,而是意大利,囚犯 A 和 B 都是黑手党成员。他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙干掉。以 上 我 们 谈 到 一 次 性 博 奕 , 即 参 与 者 的 欺 骗 和 违 约 行 为 是 不 可 能 被 报 复 的 , 这 与有 限 多 次 重 复 博 奕 一 样 , 于 最 后 一 期 单 个 参 与 者 的 占 优 策 略 就 是 不 合 作 的 欺 骗 或 违 约 。只要两个参与者仍然还是理性人,博弈的结果仍然是囚徒 A 和 B 相互把对方招供出来。为了解释这个问题,我们不妨讨论一个博弈两次的模型。我们首先考虑第二次博弈的情况,由于这是最后一次博弈,

5、自然没有后面的博弈对这次博弈的影响,因此也不就不必为将来打算,个人都只追求这次博弈的最大利益,于是第二次博弈的结果应该和一次囚徒困境博弈完全一样,自然是囚徒 A 和 B 都坦白,达到纳什均衡。而后谈到黑手党的成员则是重复博奕中无限次重复博奕的情况,弈 被 重 复 一 个 无 限 的 次 数 称 为 无 限 次 数 博 弈 。 这 种 情况 下 , 每 个 参 与 人 不 知 道 博 弈 会 在 什 么 时 候 停 止 , 谁 都 考 虑 为 自 己 留 后 路 。 此 种 博 弈 中妥 协 会 比 较 多 , 信 誉 也 比 较 好 。 在 这 种 博 弈 条 件 下 , 参 与 者 可 以

6、达 到 合 作 , 由 于 双 方可 以 采 用 报 复 机 制 来 威 慑 背 叛 者 , 背 叛 的 代 价 使 参 与 者 只 能 选 择 合 作 , 从 而 实 现 有 效 合作 。 在 市 场 经 济 条 件 下 , 就 反 映 了 信 誉 的 重 要 性 , 大 家 都 愿 意 和 口 碑 好 , 信 誉 高 的 人 做生 意 , 从 而 形 成 良 性 循 环 。 如 果 大 家 都 采 用 打 一 枪 换 一 个 地 方 的 方 法 , 抱 着 “做 一 天和 尚 撞 一 天 钟 ”的 想 法 过 一 天 是 一 天 , 而 不 注 重 信 誉 , 那 么 市 场 经 济 就

7、达 不 到 所 谓 “看不 见 的 手 ”期 望 的 那 种 帕 累 托 最 优 状 态 。 在无限次重复博弈的情况下,合作可能是稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都取合作态度会带来合作收益。但是在现实社会生活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他人的事情,这就回复到有限次重复博弈的境况企业间的合作一般是长久的,可以算作无限次重复的博奕,可是利益难免会出现一方出卖另一方背叛对方使自己利益最大化。

8、在这样一种法治环境中,法律必然可以改善囚徒困境。如 有公司 A 与公司 B 是商业上的合作伙伴,公司 A 经常向公司 B 购买原材料,由于两家公司在不同的城市,于是两个公司经过谈判之后签定买卖合同,一般在一周之后的那一天,公司 A 打现金打入公司 B 的银行帐户,公司 B 则发货到公司 A,若违约则处于 25 倍罚款。实际上,如果公司 A 与公司 B 都是理性人,那么他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次交易中都有可能有某一家公司不遵守合同,逃款或逃货,即使公司 A 现金充裕,而公司 B 货源充足。所谓的熟人欺诈也是这个道理。然而,在我们理想的法律环境

9、下,公司 A 和 B 最佳策略都是合作。不妨假设公司 A 与公司 B 每年的交易都有十几次,平均每笔生意为 100 万,若违约则罚款 200 万。见下图,公司 A 与公司 B 合作时,双方收益均为 20 万(指公司 A 与公司 B 的利润) ;公司 A 付款,而公司 B 不发货,A 损失 100 万,B 收益 100 万;公司 A 不付款,公司 B 发货,公司 A 收益 120 万(其中包含 20 万的利润) ,公司 B 损失 80 万(指公司 B 货物的成本,也就是收入减去利润) ;公司 A 不付款,公司 B 不发货,双方收益为零。在没有法律背景的条件下,双方选择不合作是自然的纳什均衡点。然

10、而引入强制性的法律则不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款其 200 万元,并且法院可以强制实行。在这种情况下,两个“囚徒”,也就是公司自然都会采取合作策略,完成合同对各方所要求的行动。简单说来,就是法律改变了两个公司博弈的均衡结果。如果说法律不存在或法律不严,而商业信誉又不强的话,这些违约金就会成为被背叛一方的商业成本,破坏了市场均衡,违反了公平原则。当然现实上还有存在道德博奕问题。正如猴群博奕,道德会使人走出囚徒困境,道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。因此

11、只要社会形成了道德或不道德,或者正义或非正义的观念,就自动地产生了调节作用。当然,道德约束有其自身的局限性。它对不道德的行为的抑制是有限度的,当不道德的行为带来的利益大于道德的满足时,道德约束的作用便失效。举个很简单的例子,拾金不昧是理所当然的美德,当捡到别人丢的 100 块钱时还给失主不仅有道德满足感,还会受到社会的表扬,建立起自己的美誉;若不及时交换失主并很容易被发现的话,则会受到严厉的谴责并失去社会信誉。假想一下,当检别人遗失的价值上百万的古玩名画时,极大的可能是归为己有。这是因为他道德的满足感与可能所受谴责的效用远小于其所检物品给他带来的效用。这种情况下,道德作用失效了,法治就不可替换地代替了道德。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报