1、 1 An introduction to game theory 賽局理論 報告人:林楚彬 日期: 98.11.28 1 What is game theory? 賽局理論被歸在經濟學的寡佔市場,討論當你的對手做什麼事情的時候你會做什麼反應。獨占市場不會有這個問題,你做什麼決策不會影響到別人。 政治學上應用到的也是這樣。 例如兩家電視台或三家報社如何定他們的策略,都會受到對方的影響。 Game theory is the study of how people behave in strategic situations. 例如剪刀石頭布就是一種賽局,因為你出招會考量到對方如何出招。 Gam
2、e theory concerns situations in which multiple players make strategically interdependent decisions. The term interdependent means that one persons behavior affects another persons well-being. 一個人的行為會影響到對方的福利,如果 A 已經猜到 B 會出剪刀,他如果要贏的話就要出石頭。那這個之後可能會有輸贏的獎賞。 切蛋糕的例子: Ex. (Sharing cake) Suppose you have to
3、 share a cake with your little brother. For fairness, your mom asks you to cut the cake into two pieces, and then your little brother chooses which one he likes most. Now, if you and your brother both are hungry and want to get the cake as big as possible, what would you do? 其實就是遊戲理論,從日常生活的小遊戲出發。 這可
4、能是彼此無法合作的狀況,你可能要面對的就是競爭。有時候希望是競爭的,這樣才會有更好的價錢。 之後討論效用時指得是快樂程度 2 A description of a game 如何可以定義一個賽局 1. Who the players are? 誰是玩家 2. The rule of the game: 遊戲規則有哪些 When do they move? What do they know when they move? 2 what can they do? 需知道招式有哪些、有哪些選擇、會有哪些結果 3. Outcomes/payoffs 有時後賽局的結果和效用是分開的。贏的結果未必令人開
5、心 你的很多策略其實都可以數字化成賽局。像是象棋 、圍棋 之類的可以全部拆解出來(如同數率或排列組合 ) 只是排列組合的可能性非常龐大,電腦也未必會全部跑出來。 經驗還是會有差,會影響到遊戲的結局。 賽局是仰賴於對方的行動。假設:理性且有規則。 蔡師 :有時候 玩家未必理性,未必遵守規則行動? 楚彬: 這也是賽局他有的侷限,經濟學是將一些都排除了,在某個範圍內討論。有時候必須假設人是理性的,但我覺得有時候這個假設就不是理性的。但也因此有些東西無法解釋。 王 暉:我玩井字遊戲發現只要先出招的人有先想好,就一定會贏。 楚 彬 :如果沒記錯的話應該是不一定,但這個要去精算。我記得人好像是先下的人至少
6、不會輸,但不一定會贏。 Ex. sharing cake revisit Your little brother You 你的弟弟有兩種策略,你的切法有無限多種。但這裡先把事情簡化,只能切一大一小,或是你盡量切成等分,但無法全然相等。 這些格子表示四種你拿到蛋糕的可能。 玩家:弟弟、我 誰先出招:我,決定如何切。這個賽局是弟弟選擇後就完成了。 Choose the bigger Choose the smaller One much bigger(7) One much smaller(3) 7 3 3 7 One a little bigger(5.1) One a little small
7、er(4.9) 5.1 4.9 4.9 5.1 3 對弟弟而言是不會吃虧。而因為我們都知道彼此都非常餓,所以弟弟應該不會選右邊的。 所以在此賽局中得到的理性結果,就是五五分。 當然, 在現實生活中這些規則、雙方目的並沒有那麼明顯。 在你猜測對方的策略本身也是一種策略。 而寡佔市場我們就是排除合作的可能,彼此為競爭的關係。 雁舒:這樣是不是選擇雙 贏最能被接受? 楚彬:那個叫做合作賽局,但討論比較少。因為在經濟學上,如果雙方合作就一起獨佔了市場,這不一定是可以被接受的。 臧師:但弟弟有時候是亂出招,所以理性的假設有時候是不存在。 孫師:有沒有可能三者競爭時,二者結合打第三者? 楚彬:有可能,當他
8、們同盟起來就將他們視為一體。又是一個賽局。但如果裡面還是有爾虞我詐就是還是算是三方賽局。 3 Three main models of game theory 1. Normal form( strategic form) : moves are simultaneously 例如:猜拳 Ex. The matching pennies game Player 2 Player 1 逗點前面的是第一個人的 payoff,後面是第二個人的 payoff。 都是頭或是都是反面的為第一人獲勝。 2. Extensive form: moves take place over time 例如:井字遊戲
9、 Ex. The centipede game In:遊戲繼續換另一個人出招 In In In 1 2 1 4, 2 Out Out Out 2, 2 1, 3 3, 4 Heads Tails Heads 1, -1 -1, 1 Tails -1, 1 1, -1 4 3. Coalitional games 合作賽局,較少被討論到。 因為主要討論如何在一個情 境下,彼此的行動如何影響彼此。 4 Prisoners dilemma 囚犯的困境 Johns decision Clydes decision Dominant strategy: 優勢策略 In the language of g
10、ame theory, a strategy is called a dominant strategy if it is the best strategy for a player to follow regardless of the strategies pursued by other players. 不 管對手出什麼策略,你的那招永遠是最好的那招,那就是你的優勢策略。 We can find equilibrium through dominant strategy. Dominant strategy for John: Confess Dominant strategy fo
11、r Clyde: Confess Equilibrium: (confess, confess) 如果大家都是理性的,這會是均衡解。因為你要追求自己利益極大化。此即為 Nash 均衡。 Ex. ASUS and ACER 假定目 標群眾雷同,決定是否要價格競爭。要找均衡有很多種方法,但優勢策略是大家都覺得滿適當的均衡解。 ASUS ACER Dominant strategy for ACER: Discount Dominant strategy for ASUS: Discount Confess Silent Confess John gets 8 years, Clyde gets 8
12、 years John gets 20 years, Clyde goes free Silent John goes free, Clyde gets 20 years John gets 1 years, Clyde gets 1 years Discount No discount Discount Acer low profit Asus low profit Acer high profit Asus very low profit No discount Acer very low profit Asus high profit Acer medium profit Asus me
13、dium profit 5 Equilibrium: (discount, discount) 優勢策略均衡解 Many times in life, people fail to cooperate with one another even when cooperation would make them all better off. Ex. Revisit Prisoners dilemma If both of them remain silent, both are better off (1year, 1year) 最好的解釋雙方同盟,但在經濟上是犯法的托拉斯 孫師:但如果兩者個
14、折價策略不一樣,可能又有不一樣的結果。 楚彬:對,所以這是比較簡化的狀況。實際上會有數種或無限種策略決策可能那可能還可以以數學模型進行推導。 賽局還有很多分類,像是零和賽局等。 零和:一方之所得必 定為另一方之所失。 但在經濟上或政治上並不是那麼明顯的一整塊大家一起分,而是可能有中間選民、開發新的市場等。 5 Nash Equilibrium Motivation: dominance does not always yield precise prediction. 這種均衡可以用數學公式推導出來。賽局並不是 Nash 發明,但他找出一種方式找出賽局的解。解之所以重要,是因經濟學家希望找出一
15、個能夠穩定的解決方案。 Ex. Battle of Sexes KJT and YT are couple 先 假設了一個賽局,那我們從中找解。(此處的效用並沒有累加性,非數學可直接解釋 。假設最高即為 10。 ) YT KJT No dominant strategy 沒有優勢策略 John Nash: Nash Equilibrium 何謂 Nash 均衡解 Opera Baseball Opera 10(8+2) 10(2+8) 2 2Baseball 8 8 10(2+8) 10(8+2) 6 In a Nash Equilibrium, no single player has an
16、 incentive to deviate given the other players strategy. Or equivalently, in a Nash Equilibrium, every player plays a best response to his rivals strategy 沒有一個玩家有誘因讓他改變它的策略 ,例如給定 opera 或 baseball 對方都不會想改變如果沒有想改變就是 Nash 均衡解 。所以會有兩種 Nash 均衡解。 There are two Nash Equilibria in the game of battle of sexes
17、: (Opera, Opera) (Baseball, Baseball). 但常沒法給定對方策略,而 對方的策略 又 是可以改變的,是種馬後炮的行為。 Ex. The stag hunt Celstine Sean There are two Nash Equilibria in stag hunt: (Stag, Stag) (Hare, Hare). 在 Nash 定義下這兩種都是有可能的結果。 NOTE We can find a N.E. through dominant strategy. However, a N.E. is not necessary players domin
18、ant strategy.我們可以從優勢策略找 Nash 均衡,但 Nash 均衡卻不一定是優勢策略。 Nash 均衡不一定是必然的結果,因為資訊可能不完全。而且有時候 Nash 均衡不一定是停在一個最好的點。但只是大家停在那邊都不想動了。 Stag Hare Stag 2, 2 0, 1 Hare 1, 0 1, 1 7 6 More examples Ex. The Hotelling model 0(綠 ) 1/2 1(藍 ) 兩家在此賣冰淇淋,品質目標客群都一樣。評估在哪個地方可以賣最好。是一個連續的策略,可以在一整條路上的任何點選擇開店。那開在哪裡會是兩個人都會決定停在那邊的點?而且
19、這個決定是可以一直因著對方改變而改變的。 這個決定就是 Nash 均衡。一起開在 1/2 的點。 應用於政治領域,就會趨近中間。如果國家只有兩個政黨,他們就會向中間靠攏,以爭取中間選民的選票。 競爭關係會使得二者趨同 Nash 均衡必須倒轉法找解,先 選定地方再決定你要不要移動或改變。 三家廠商沒有 NE 均衡解。 四家廠商的 NE 均衡解是二家廠商停在 1/4,二家停在 3/4。 Ex. Arm race 武裝競賽:冷戰時討論雙方是否要發展核武可找出優勢策略 U.S . USSR 美國能源部資料顯示: 可用的完整原子彈數目 1945 年 約 2 枚 1946 年 約 6 枚 1947 年 約
20、 7 枚 1948 年 不多於 50 枚 1949 年 少於 240 枚 1950 年 292688 枚 Arm Disarm Arm U.S. at risk USSR at risk U.S. at risk and weak USSR safe and powerful Disarm U.S. safe and powerful USSR at risk and weak U.S. safe USSR safe 8 7 Discuss Is laissez-faire the best way? Refinement to Nash Equilibrium. 楚彬: 在經濟學上,至少我們
21、學的是資本市場的自由放任經濟學。但賽局理論出現引領我們討論自由放任真的是最好的嗎? 課本跟我們說, 當所有經濟客體都在找尋最大利益的時候,就會有一直 看不見的手,將市場推向完美。 然而賽局理論提醒我們,應該要有適當的規範,過度放任達到的結果並不是最好的。有所限制對於雙方有可能才是好的。 煜麟:但如果這一點就會導向認為國家應該介入干涉。這其實是從微觀經濟學導出來的東西。 在對巨觀的討論 下會偏向以國家政策介入,但這只是我認為的一種策略而已。除了國家政策外, 另一個透過創業精神的市場條件也可 造成改變。這樣 均衡 的移動會更好。 這或是 另一條可以思考的路 現在只有自由放任,過去我們都會從整體的來
22、思考。 但現在, 例如我們從非營利部門,透過創業性的總體經濟條件,來推動改變。 楚 彬: 有時候不僅僅是改變規則,而是可以增加競爭者,都有可能造成均衡點的移動。政府可能不滿意這個均衡點,但可能不一定是由上至下的規則改變,而是增加 player。 例如增加多一點政黨。 煜麟:賽局理論並不僅講到競爭性,它隱含了創造性。例如其中一家廠商做了改變,有了創造,就會改變整體的競爭結構。 Reference Mankiw. 2007. Principles of Economics. 4th edition. Thomson south-western Corp. Mas-Colell, Whinston and Green. 1995. Microeconomic Theoty. Oxford University Press. Wen-jen Wen. Fall 2009. Advanced Theory of Microeconomics (I). Poundstone. Prisoners Dilemma . 1992.囚犯的兩難 . 2007. 葉家興譯 . 左岸文化 .