納許均衡－劣勢潮流及銀行擠兌

講座五

我們首先正式定義上一堂課的新概念：納許均衡。然後討論為什麼我們對納許均衡感興趣，以及我們怎樣才能找到各種遊戲中的納許均衡。我們以一個課堂上的投資賽局遊戲為例，說明社會環境中有很多均衡的情形，以及社會可能完全無法協調，或可能有較劣均衡的協調。我們認為，在現實世界中，協同謬誤是常見的情形。最後討論為什麼在這種不同於囚徒困境的協同謬誤中，簡單溝通可能是一個補救措施。

講座五：納許均衡－劣勢潮流及銀行擠兌

Ben Polak 教授：上一講我們學到了一個新的概念，可能有些人覺得並不陌生，它就是納許均衡。這一講我們來探討下納許均衡，並學習如何找出簡單案例中的納許均衡。在後半講中我們透過一個小遊戲來學習如何運用納許均衡，希望這個遊戲會很有趣。首先我們給出納許均衡正式定義，上一講我們給出的是非正式定義，策略組合是一個集合，該集合包含每個參與人的一個已選策略，用S1*、S2* 一直到SM*表示，如果此賽局一共有M個參與人，納許均衡以後我就簡寫成NE了。納許均衡是滿足下列條件的策略組合，對於任意此集合內的參與人I，她所選擇的策略Si是其他參與人所選策略的最佳對策，當然，其他參與人的策略要用S*-i表示，也就是說，每個參與人都選擇了最佳的對策。納許均衡目前是賽局理論最常用的解概念，比如去麥肯錫之類的公司面試時，你會發現公司要求面試者掌握納許均衡，為什麼我們要掌握納許均衡呢？不僅因為它是教材內容，它有很多實用價值，而且你去麥肯錫面試還會用到它。這可不是一個好的學習動機，而且我可不想讓大家覺得，我們花了這麼多時間學習納許均衡，學到的卻都是脫離實際的知識，絕對不是這樣的。實際上，並非所有情況都能達成納許均衡，比如說在我們之前玩的數字遊戲中，每個人都選擇一個數字。我們之前講解過的，這個遊戲的均衡就是每個參與人都選1，但實際操作下來平均數遠高於1，在13左右。當我們重複進行這個遊戲時，平均數的確趨近於1了，但是我們第一次做這個遊戲時並未達成納許均衡，所以我們不能想當然的認為人們總能達成納許均衡，或理性人就能達成納許均衡，上述的說法都是不正確的。誠然，除了納許均衡被廣泛運用之外，學習納許均衡還是有充分的理由的，我們不妨來稍作討論。我先在這裡寫一下學習動機，我們上一講討論過，第一個動機其實是你們當中的一員提出來的，其實就是不反悔，這怎麼講呢？假設我們分析一個納許均衡，如果把其他人的策略看成不變數，任意參與人I都不會改變策略。我再重複一遍，把其他參與人的行為看成不變的，任意一個參與人都不會改變策略。說得更嚴謹一點，任何參與人都嚴格不會改變策略，我們一會就知道這一點很重要了。改變策略嚴格不會使參與人獲得增益，其他參與人不改變行為的前提下，自己改變行為並沒有任何好處。我為什麼把它稱為不反悔呢？因為如果你也參與到賽局中來，這個賽局已經達成了納許均衡，你觀察了一下其他參與人的行為，瞭解其他參與人的行為後，你自問道，我為我的選擇後悔嗎？你的回答會是我不會後悔，因為在當時情況下我採取了最佳對策，因此這應該算是我們學好納許均衡的一個相當重要的動機了。接下來是第二個動機，剩下的動機我們邊講邊提。第二個動機是因為，納許均衡可以被想像成自我實施的信念。上一講我們著重討論了信念，如果我認為門將會撲向這邊，我就應該從另一邊射門，以此類推。不過我們確實沒有深入探討過信念，如果我認為－如果賽局中的所有參與人相信其他人想要保持納許均衡的狀態，那麼大家都不會打破這種均衡，為什麼會這樣呢？為什麼說要是大家想要保持納許均衡的狀態，那麼大家都不會去打破均衡呢？這怎麼解釋呢？誰來回答？請穿紅色上衣的小夥子來回答。學生：因為在納許均衡下，賽局雙方均採取最佳對策。教授：完全正確，這和第一個動機差不多。如果我覺得其他參與人2到N會採用S2到Sn的策略，根據定義，我的最佳對策是S1，實際上我也是納許均衡的一部分，這些自我實施的信念是納許均衡定義的一部分，我們透過回顧上一講的案例，來看看納許均衡是怎麼達成的。我並不是說要重新分析那個案例，我只是想讓大家都能聽懂。上一講我們繪製了一個賽局的圖像，賽局中參與人要選擇自己的努力程度，這一條線代表參與人1的最佳對策，它是參與人2策略的一個函數。這條線代表參與人2的最佳對策，它是參與人1策略的一個函數。這就是我們在上一講繪製的圖像，我們一起來回顧一下。很顯然納許均衡就是這一點，納許均衡就是兩條線的交點，但這和之前提到的動機有什麼關係呢？哪裡體現出了自我實施的信念，抱歉，我寫成參與人1了，應該是2。如果參與人1認為2會採用這個策略，那麼參與人1應該採用這個策略；如果參與人1認為2會採用這個策略，那麼參與人1應該採用這個策略；如果參與人1認為2會採用這個策略，那麼就應該採用這個策略，以此類推，這就是最佳對策的意思。如果參與人1認為2會採用納許策略，那麼他的最佳對策也是採用納許策略。反言之，如果參與人2認為1會採用納許策略，那麼她的最佳對策也是採用納許策略。因此，這就是一個自我實施的信念。如果兩人都相信會這樣發展，那麼事情的確就會這樣發展。哪裡體現出了不反悔這一點呢？比如說參與人1她第二天早上起床，不好意思，應該是他，對吧？他第二天早上睡醒後自問道，我選了S1*，我後悔嗎？但是他知道參與人2的選擇，參與人2選擇了S2*，然後他自言道，在參與人2選擇S2*情況下，這是我能做的最好的選擇了，實際上我選擇了我的最佳對策，因此選擇S1*我一點也不後悔。請注意這一點在其他情況下並不成立，比如說參與人1採用了策略S1，但參與人2卻採取了其他策略，如S2'，這時參與人1就會後悔了。參與人1第二天睡醒後自言自語道，我原本以為參與人2會採用S2，實際上她卻選擇了S2'，我真後悔自己選了S1，我當時應該選擇S1'，因此只有在納許均衡下參與人才不後悔，大家都明白了嗎？這些就是我們對上一講所學內容的回顧和總結。這一講我們將要利用較多的時間來理解納許均衡的概念，並學會如何尋找納許均衡。我得把投影機關掉，好了。接下來，我們來研究一個只有幾個參與人和幾種策略的簡單賽局，我希望以此讓大家學會如何尋找簡單賽局中的納許均衡。先穩紮穩打吧，以後再加快速度。我們從這個簡單的雙人賽局開始研究吧！每個參與人都有三個策略，我們就不來做這個賽局了，這只不過是一個隨機編出來的賽局。參與人1可以選擇上中下，參與人2可以選擇左心右，收益如下：(0,4)、(4,0)、(5,3)、(4,0)、(0,4)、(5,3) 及 (3,5)、(3,5)、(6,6)。如果我們時間充裕倒是可以做這個賽局，但這並不是一個多麼有趣的賽局，所以我看就算了吧！接下來，我們來分析哪種情況是納許均衡，以及如何來找出這個賽局的納許均衡。我們用和之前類似的方法來尋找這個賽局的納許均衡，上一講我們分析的是一個複雜賽局，兩個參與人的策略是連續的，我們在上一講找到了這個賽局中參與人1和參與人2的最佳對策，即參與人1對於參與人2的最佳對策，以及參與人2對於參與人1的最佳對策，之後我們發現兩線交點就是納許均衡。對於這個賽局也這樣分析。首先我們要找出參與人1的最佳對策，具體來說，參與人2選左時，1的最佳對策是什麼？請準備好麥克風，我要開始提問了，有人想回答嗎？這問題不是很難吧！不如讓中間那位女士試試吧！誰離那位女士最近？好。學生：最佳對策是中教授：此情況下參與人1的最佳對策是中，因為4>0且4>3，我們用圓圈把它標記出來。我們把4用綠色圓圈標記出來，這很簡單對吧！我們繼續。參與人2選心時，1的最佳對策是什麼？我們請坐在另一邊的同學回答，請穿耶魯橄欖球隊服的小夥子回答吧！就是他。學生：上教授：很好，上是正確答案，這是耶魯橄欖球隊的又一個勝利啊！因為4>3且4>0，回答得很好。艾爾，你幫我再找一名同學來回答。在參與人2選擇右的情況下，參與人1的最佳對策是什麼？請大聲說。學生：下教授：下。沒錯，下是最佳對策，因為6>5。從中我們可以找出參與人1對應左心右三種不同情況下的最佳對策。順便說一下，注意參與人1的每個策略都是最佳對策，任何策略都不會因為劣勢而被剔除，任何策略也不會因為不是最佳對策而被剔除。同理，我們來看一下參與人2，請準備好麥克風，我們再找幾個人，你想找坐在後排，之前回答過參與人2對於下的最佳對策的那位同學來回答嗎？學生：左教授：穿藍上衣的男士說是左，因為4>3>0。我們換個顏色和形狀，用方塊標注吧！我不是說非得用圓圈或者方塊，如果你喜歡用六邊形也行，隨你了。我先把答案寫在這裡吧！參與人2對於上的最佳對策是左，參與人2對於中的最佳對策是什麼？請這邊的一位同學來回答，大點聲說。學生：心教授：因為4>3>0，所以是心，我用彩色方塊在這裡標注一下，參與人2對於下的最佳對策是什麼？艾爾，請再找位同學來回答。學生：左，我說錯了，應該是右教授：說得很對，因為6>5，我們繼續。我們剛才在計算參與人1最佳對策的方程式，這與上一講的最佳對策圖線是類似的，這裡我們用白色的直線來表示，但我們也可以用綠色的小圓圈來標注，就像這樣。同理，我就不標注出所有的點了，但所有點連起來就是這樣的。後來我們算出了參與人2的最佳對策，和之前一樣，我們用紅色的長方形來表示，我們透過微積分的觀點得出連續策略，不過道理都是一樣的，把它想像成我畫了很多粉色長方形即可。同理，我就不都畫出來了，你喜歡就在筆記本上畫吧，原理一樣的，納許均衡一定是兩條最佳對策圖線的交點，因為在這一點上每個參與人都採取了最佳對策，這個賽局的納許均衡是什麼呢？我們找個人來回答吧！請你前排的一位同學來回答吧！誰想回答呢？穿義大利隊服的那位，就由你來回答吧！這個賽局的納許均衡是什麼？學生：是右下教授：右下那個方格。沒錯，這個賽局的納許均衡就是右下，雖然你答對了，但是沒有獎勵啊！為什麼右下是納許均衡呢？因為此時參與人1採取了最佳對策，而同時參與人2也採取了最佳對策。我希望大家都明白，特別是那些還在為作業發愁的同學，這不像造火箭那麼難，找出賽局中的納許均衡並不難，這並不是很麻煩的，而且我們剛才也是慢慢來分析的。我再來給大家舉一個例子，在繼續講下面的內容前，請注意，我再來強調一點，在這個賽局中參與人1的每個策略是某種情況下的最佳對策，參與人2的每個策略也是某種情況下的最佳對策，因此我們在前幾講學到的方法，即剔除劣勢策略以及剔除非最佳對策的策略，在這個賽局裡是行不通的。因此，納許均衡縮小了我們的預測範圍，但從中我們也學到了一些結論，我們在幾個星期前說到過理性或者理性的相互知識，甚至是理性的公共知識只能幫助我們剔除劣勢策略，以及剔除非最佳對策的策略。我們得出這個賽局的納許均衡是右下，這是一個很詳盡的預測。但請注意，一個理性參與人也可能選中，參與人1之所以選中，可能是因為參與人1認為參與人2會選擇左，那你可能要問，為什麼參與人2會選左？參與人1會說，我之所以認為參與人2選左，因為參與人2覺得我會選上，然後你接著問道，參與人2憑什麼認為你會選上？參與人1回答，參與人2之所以認為我會選上，是因為她覺得我認為他會選心；然後你又會問，為什麼參與人2云云，然後你就陷入了封閉循環中去了。大家都在理性地看待事物，所有東西都可以被信念合理化，但我們卻不能找到萬能解，我們無法找到一個簡單的萬能解。在剛才的右下的情況裡，參與人1認為選下是很合理的，因為他認為參與人2會選右，而參與人2認為選右是很合理的，因為他認為參與人1會選下。我可能講的有點亂了，強調一下，我們不能想當然的、理性地認為人們總會達成納許均衡，達成納許均衡還需要別的條件。誠然，這一講我們要來研究納許均衡。我們不妨再來看一個案例，同樣，為了便於分析研究，我們舉一個雙人三策略的賽局。策略分別為上中下、左心右，這個賽局的收益如下：(0,2) (2,3) (4,3) (11,1) (3,2) (0,0) (0,3) (1,0)和(8,0)。這個賽局不太好分析，這些數字都是我在寫板書時隨便想出來的。同樣，我們要找出這個賽局的納許均衡，我們還要沿用之前的方法。我們需要找出每一個參與人在對手選擇不同策略下的最佳對策，與其說直接寫出來，不如用綠圈和紅方框標注出來。我來找幾個人來回答，準備好麥克風，麥克風在哪裡呢？謝啦！艾爾，你能不能找個人回答，策略左的最佳對策是什麼？隨便找就行，左的最佳對策是什麼？學生：中教授：中是左的最佳對策，因為11>0。米拓，你來找個人回答心的最佳對策是什麼？學生：中教授：還是中，因為3>2>1。再找個人來告訴我右的最佳對策是什麼？後面有人想回答嗎？學生：下。教授：很好，是下。我們同理來分析一下，參與人2對於參與人2來說會怎樣？艾爾，讓你後兩排快睡著的傢伙回答，上的最佳對策是什麼？學生：哪個參與人的最佳對策？教授：參與人2對於上的最佳對策是什麼？算了，我再找一個人吧！沒關係，你身後的人來回答一下，上的最佳對策是什麼？學生：中或右是一樣的教授：這個就有點容易弄錯了，上的最佳對策是心或者右，多虧各位簽了授權書，上的最佳對策要麼是心要麼是右，那中的最佳對策是什麼？學生：心教授：是心，感謝你的回答。下的最佳對策是什麼？學生：左教授：下的最佳對策是左，這次我們沒有花費多少時間，我們已經輕車熟路了。這個賽局的納許均衡是什麼？我們再問問那個差點睡著的傢伙，這次問一個簡單點的問題，這裡的納許均衡是什麼？學生：納許均衡是(3,2)嗎？教授：沒錯，就是中心，注意這個就是此賽局的納許均衡，為什麼它是納許均衡呢？因為每個參與人都採取了最佳對策，如果我是參與人1，我認為參與人2會選心，我就應該選中；如果我是參與人2，我認為參與人1會選中，我就應該選心，實際上，這樣我們就都不會後悔。注意並非每個參與人都獲得了最大收益，比如參與人1其實也想得到11或者8，但是他們都不後悔，因為在參與人2選心的情況下，參與人1最多也只能得到3，這是選中時才能達到的結果。順便說一下，最佳對策不一定是唯一的，有時候也可能有多個最佳對策，這是有可能發生的。那我們從中學到了什麼呢？我們學到了如何找出納許均衡，這顯然與我們幾周之前學到的最佳對策知識點有很大的聯繫，不過我們再回顧一下更早的知識點，想想這個與優劣有什麼聯繫。這就是我們這門課的第三個概念，我們講過了優劣的概念，我們學到了最佳對策的概念，現在我們又學到了納許均衡，我覺得顯然這一點與最佳對策緊密相連，納許均衡就是最佳對策的交點，但是這個和優劣有什麼聯繫呢？我們不妨回顧一下，接下來我們要把納許均衡與優劣聯繫起來。為了聯繫起來，我們當然要回顧一個我們之前見過的賽局。這是一個參與人1和2選α與β的賽局，收益分別(0,0) (3,-1) (-1,3) (1,1)，這就是第一講的賽局，即囚徒困境；我們都知道此賽局中－我就不找人來回答了。我們都知道此賽局中α嚴格優於β，這是我們第一講學到的東西。驗證一下，對手選α時你選α得0，選β得-1；對手選β時你選α得3，而選β得1，α嚴格優於β。這當然對於參與人2也是同樣的，因為這個賽局是完全對稱的。下面我們來尋找這個賽局的納許均衡，我覺得我們知道納許均衡是什麼，但我們還是仔細分析一下。α的最佳對策是α，β的最佳對策是α，對於參與人2來說，α的最佳對策是α，β的最佳對策是α，大家都聽懂了嗎？我可能說得有點快，但是這都是顯而易見的吧！因此這個賽局的納許均衡是(α,α)，換句話說，就是我們剔除嚴格劣勢策略後剩餘的那種結果了。這是一個α嚴格優於β的賽局，此賽局的納許均衡仍然是交點，即答案是兩個參與人都選擇α。這不是什麼新知識，我的推理到目前為止還沒有錯誤吧！我們再認真一些好了。我們怎麼證明在一個賽局中，嚴格劣勢策略並不能達成納許均衡，比如這個賽局裡的嚴格劣勢策略是β。我覺得這是一個不錯的想法，因為我們希望這兩個知識點有交集，我強調了嚴格劣勢策略無法促成納許均衡，這是為什麼呢？請那位同學來回答。學生：嚴格劣勢策略不可能成為最佳對策教授：很好學生：最佳對策才可能達成納許均衡。教授：說得很對，嚴格劣勢策略永遠不可能成為最佳對策。具體說，優於它的策略總是優於它，因此說嚴格劣勢策略不能達成納許均衡，這是嚴格劣勢策略無法達成納許均衡的一個很好的證明。不過現在我們遇上了點小麻煩，麻煩就是弱劣勢和弱優勢，我們可以理直氣壯地說，嚴格劣勢策略絕對不會在納許均衡裡出現，可是弱劣勢策略卻不然。你們可能預感到了下一次作業會有一道這樣的題，我記得應該是第二題。剔除弱劣勢策略有時候確實挺難處理的，弱劣勢策略不像嚴格劣勢策略那麼好處理。我們來分析一個簡單的案例。這是一個簡單而枯燥的案例，但它卻很能說明問題。這仍然是一個2 * 2的賽局，參與人1可選上下，而參與人2可選左右，收益很簡單：(1,1) (0,0) (0,0) (0,0)。我們來找出這個賽局的納許均衡。我就不叫人回答了，因為太簡單了。參與人2選左時，參與人1的最佳對策是上，如果參與人2選擇右時，參與人1的最佳對策是上或下，因為兩者的收益都是0，這兩個策略都是最佳對策，沒錯吧！因為它們的收益是一樣的。相反，如果參與人1選上，那麼很顯然參與人2的最佳對策是左，我們都比較喜歡這樣的答案，但很不幸的是，如果參與人1選下，參與人2的最佳對策是左或右，二者收益均為0，沒什麼區別。那麼這個賽局的納許均衡是什麼？我們首先發現的是，這個賽局不止存在一個納許均衡，我們以前沒有遇到過這樣的情況，我覺得教室裡的人會達成一個納許均衡，我也希望這是對這個賽局的合理預測，在這個賽局裡，我希望所有的參與人1都選上，參與人2都選左，是這樣吧！促使大家不去選擇左和右的想法似乎都是站不住腳的。不過很不幸，也不能說不幸吧！左上是一個納許均衡，但右下也是，如果參與人2選右，你的弱最佳對策為下，如果參與人1選下，參與人2的弱最佳對策是右，這也是根據納許均衡定義得出來的。它是一個很明確的定義，我把它擦掉了。定義這麼說的－納許均衡就是每個參與人都採取最佳對策的均衡，換句話說，每個參與人嚴格不願改變策略，參與人改變策略嚴格不會獲得增益，比如這個案例中，參與人1選右並沒有獲得額外收益，參與人2改變策略也沒有額外收益，兩個策略的收益都是0。到這裡我們似乎遇到了這門課的難點了，有時候我們不止找到了一個納許均衡，但這並沒有什麼，這是客觀存在的，但是在這個案例中的一個納許均衡很牽強，如果你回去跟你室友解釋說，我預測這些都是賽局的可能結果，你會被嘲笑。某種意義上來說，它應該是合理預測。好了，就說這麼多，我們繼續講課。這些都太正經了，毫無意思。接下來我們講點有意思的吧！我們來看另外一個賽局，我們當然也要找出這個賽局的納許均衡，不過我們還有別的工作要做，我們要來仔細分析一下這個賽局。這個賽局很有特點，它與我們之前的賽局的不同之處是，這個賽局有很多個參與人，儘管每個參與人只有幾個策略，我想透過這樣賽局讓大家明白，如何在像這樣參與人不止兩個的賽局中找出該賽局的納許均衡。所幸的是，每個參與人的策略不是太多，我在這塊黑板上寫板書吧！我們要做的這個賽局叫做投資賽局，我們來模擬一下這個賽局吧！賽局中的參與人是在座的全體同學，那些昏昏欲睡的同學趕快醒醒，你們要參與到其中來了。這個賽局的策略，或者說這個賽局的策略組合很簡單，大家可以選擇分文不投，或者為一個課時專案投資10美元。我們有時把分文不投說成不投資，都聽懂了嗎？這個很好理解吧！你們要麼投資10美元，要麼不投資，現在給出了參與人和策略，我們還沒有給出賽局的收益。收益如下；如果你不投資，你的收益就是0，不勞則無獲，這是個常識吧！如果你們都投資了10美元，那麼你們的收益就是這樣的了。好消息，各位會分得5美元利潤，也就是說，你們投資了10美元，得到了15美元的毛利潤，但是減去之前投資的10美元，淨利潤就是5美元。好消息就是各位能獲得5美元淨利潤，但這要求不少於90%的同學選擇了投資10美元，如果多於90%的同學投資了，那麼你們會獲得50%的利潤。然而壞消息就是，如果投資的人數少於90%的話，你會損失掉原始10美元的投資。賽局的關鍵在於，你們不允許互相溝通，不許用手勢和表情，一切都不行，大家都聽懂了吧？各位都明白這個賽局的意思了吧！首先我要說明的就是，我們只是模擬一下，因為在座有250人，而且我現在也沒有那麼多現金。所以假裝我們在進行這個賽局，不許溝通，請各位在筆記本的邊上寫下你是否會選擇投資，你可以用Y表示投資，N表示不投資，不要互相討論，在你們筆記本的邊上寫下Y或N。投資就寫Y，不投資就寫N，不許討論的。現在給你的同桌看一下，因為你在同桌面前不會說謊。現在請大家舉手表決，我們來看看多少人選擇了投資。誰投資了請舉手，舉手就行了；不投資的舉手，這絕對多於10%啊。我們再來一次，選擇投資的請舉手，不投資的請舉手，我也不知道具體有多少？我猜是一半。看來我們真應該實際進行這個賽局。那我們就來分析一下，我們花點時間來討論討論，這個賽局有很多東西值得分析討論的，把麥克風借我用一下吧！這位同學，請問你怎麼選擇的？學生：我投資了教授：你為什麼選擇投資呢？學生：因為我不缺錢教授：他很富有，那你請我們吃午餐吧！誰選擇了不投資？這裡有一位，請問你為什麼不投資？大聲說出來，讓大家都聽見。學生：我不投資，因為我覺得想要獲得利潤，90%的人投資與否的比率至少是2:1。教授：你的意思是說計算預期利潤嗎？學生：你可能獲得一半利潤，但也可能一無所獲。教授：我明白了，你計算了預期收益，還有別的理由嗎？你怎麼選擇的？學生：我投資了教授：我本來想找不投資的傻瓜的。好吧，那你說說為什麼你投資了？學生：只有付出才會有回報，我不理解為什麼有人會選擇不投資，因為不投資就沒有回報啊！教授：請問你叫什麼名字？學生：克雷頓。教授：克雷頓說只有投資了才會有收益，不投資的話顯得缺少魄力。還有誰想回答？學生：這個和之前(1,1) (0,0)的賽局差不多，因為都有兩個納許均衡，但兩個均衡的收益是不同的，要是你選擇不投資，你太害怕風險了，所以我覺得．．．教授：這麼說你投資了？學生：是的，我投資了教授：在我把音響系統弄壞以前，我趕緊把麥克風還給艾爾吧！我們得到了不同的理由，大家是不是都聽清楚了？關於是否應該投資大家各有見解，差不多一半的人選擇投資，另一半的人選擇不投資，他們的理由也都能自圓其說，我們以後再來討論，這個和之前的賽局是否是一樣的。剛才的那個說法．．．抱歉，忘記了你的名字。派翠克認為這個和之前的賽局很相似，它們二者確實聯繫緊密，接下來我們看看二者到底有什麼聯繫？這個賽局裡的納許均衡是什麼？讓這位女士回答一下。學生：無人投資，無人受損失，皆大歡喜。或者每個人都投資，大家都受益了。教授：說的不錯，請問你叫什麼名字？學生：凱特教授：凱特說有兩個納許均衡。辛苦了，裘德，我還是回到講臺上吧！這個賽局有兩個納許均衡，一個是都投資，而另一個是都不投資，所以說有兩個納許均衡，我們來驗證一下是不是和凱特說的一樣。如果每個人都投資，那麼無人會後悔，這種情況下，每個人的最佳對策是投資；如果無人投資，選擇不投資也很合理，因為是最佳對策，這和派翠克說的一樣。這個賽局和之前的一樣，有兩個均衡，除此以外，二者還有別的相似之處，但怎麼說好呢？兩個賽局的納許均衡並不完全相同，在之前的那個賽局裡，(0,0) 這個均衡似乎很不合理，我們都不覺得這種情況會發生。然而這個賽局中，無人投資也是一個很合理的均衡，如果我認為沒有人會投資，那我絕對會選擇不投資。這裡面有兩個重要內容，講重點之前，我還需要解釋一下嗎？這就是第一個重點，我們如何尋找納許均衡？在尋找這個賽局的納許均衡時，我們用到了哪些複雜的數學方法？請準備好麥克風並遞給凱特，請問你是怎麼找到納許均衡的？學生：我只找到了兩處不會後悔的結果教授：原則上來說，你的方法是可行的，不過準確說，你應該考慮了各種情況，這裡有很多可能的情況，可能是1%選擇投資99%選擇不投資，也可能是2%比98%，以此類推。我們可以很準確的推算出不同情況下，每個人的最佳對策是什麼。那麼這個賽局最後的結果會是什麼呢？用什麼方法推算？你來回答吧！學生：你只需要考慮你的行為能改變結果的情況，只有兩種情況，都投資或都不投資。教授：的確是這樣，這樣問題變得簡單了，很好，我覺得他們兩位同學比我分析得更嚴謹，更有數學邏輯性，我覺得簡單的分析方法就是去猜測，我要猜測的東西很簡單，我只需要猜測均衡會是什麼樣的，然後再驗證一下即可。因此，分析這些賽局可以先猜測後驗證，這不失為尋找納許均衡的好方法，因為驗證過程很簡單易行，猜測可能比較困難，難免會有疏漏。可能會有一個隱含的納許均衡，在美國你們都說隱藏吧，可能會有隱藏的均衡，儘管如此，驗證過程中，無論假設的還是客觀的均衡，驗證它們到底是不是均衡很簡單，因為你只需要驗證參與人都不想改變策略，實際上這就是賽局最終的結果，這一點是比較容易猜測並驗證的。因此我們可以找到均衡，先猜後證的方法，在分析這樣參與人的數量很多，但策略不多的賽局時很有效。這個賽局已經寫在黑板上了，因為它很重要。我們再討論一會，我想請大家再回憶一下剛才的賽局，那個賽局是什麼內容？請剛才投資的同學再舉下手，不投資的請舉手，沒舉手的人你們都欠我10美元啊！我們再來進行一次這個賽局吧！不許交流，請在筆記本的邊緣寫上你的選擇，不許說話，寫完了給同桌看看。我們再舉手表決一次，大家準備好，不許作弊，不許左顧右盼，讓裘德把鏡頭對準你們，如果你選擇投資請舉手；不投資的請舉手。投資的請再舉下手。看來還有幾個人選擇投資啊！那你們就真要欠我錢了啊! 我們再來進行第三次賽局。準備好，這次假裝要玩真的了，寫出你們的選擇。這次投資的請舉手，這世上還真有這麼執著的傻瓜呀！我們不斷重複，最後會趨近於什麼？我想讓大家都清楚，我們趨近於均衡。第三次選不投資的請舉手，這次就很接近了。舉手表決結果很接近一個納許均衡，是這樣吧！這就是我們上一講第三個理由的一個不錯的例證，這便是我們學習納許均衡的第三個原因。有些情況下，賽局會朝著趨向於一個均衡的方向自然發展，除了那些有錢願意請我吃午餐的老頑固，其他參與人都會趨向於一個均衡。賽局的結果會不斷趨近於納許均衡。但我們討論得出，此賽局有兩個納許均衡，這兩個納許均衡當中，有哪一個優於另一個嗎？很顯然大家都投資這個納許均衡較好，大家都同意這點吧！大家都投資比起大家都不投資來說，是一個較好的納許均衡，沒錯吧！然而，我們進行這個賽局時趨向哪個了呢？我們趨向於較劣的納許均衡了，我們不斷地趨向於一個沒有人獲得利潤、投資都變成損失的均衡了，怎麼會這樣呢？我們怎麼會趨向於這個較劣均衡呢？說得正式一點，這個較劣的不投資的均衡相對於較優的納許均衡，處於帕累托劣勢。在較優均衡中，參與人的收益嚴格優於較劣均衡中的收益。用150或115的術語來說，這叫帕累托優勢，但是我們還是趨近於較劣均衡了，我們達成了那個較劣均衡。為什麼最後我們趨向於較劣均衡，而不是較優均衡呢？請穿灰上衣的小夥子回答。學生：這對投資者來說是空頭市場，難道不是嗎？教授：這個怎麼講？請你再多說點，解釋一下你的想法。學生：大家對於其他人會投資不抱有太大的信心教授：換種說法就是，最開始大概是均分的，這對那些投資的人是很不利的。我們開始時是各占一半，投資的機率低於90%的臨界值，對吧？從此以後就發生了巨變。這個思路的意思是說，初始狀態可能會影響結果。假如我們第一次進行這個賽局的時候，93%的人選擇了投資，這種情況下93%的人會賺到錢，雖然我無法給出證明，但是我猜我們會趨向於另一個均衡，最終會達到較優均衡，這樣說得通嗎？人們發現，第一次不投資的人實際上採取的是最佳對策，他們按兵不動，而那些投資的人開始時，很多人都不投資，然後大家陷入不投資的漩渦，最後也就沒人投資了。但如果我們開始時投資機率高於90%的臨界值，假如你們第一次就賺到錢了，那些選擇不投資的人可能就會後悔，然後可能會轉而選擇投資，然後我們可能會趨向另一個均衡。我並沒有說一定會，我只是說可能會。請把麥克風遞給他。學生：如果只有70%選擇投資會怎樣呢？教授：這是個很有水準的問題。如果剛開始接近但是低於臨界值，我也不知道情況會怎樣，我沒有做過類似的實驗，不過應該是越高的投資率、越接近臨界值的話，越可能趨近於較優均衡。我只是猜測一下，如果初始值小於臨界值會趨近較劣均衡，如果初始值高於臨界值會趨近較優均衡。但這可不是定理，我只不過是推測一下情況會怎麼發展，是根據你的推測再繼續推測。這個賽局有兩個均衡，一個較優一個較劣，較劣的那個處於帕累托劣勢。我們再來回顧一下。我們不斷趨向於一個均衡，正好和之前說的納許均衡的一個特點相符，那就是關於自我實施的預測。如果你認為別人都不會去投資，你就不會去投資，自我實施的預測阻止你去投資；相反，如果你認為人們都會選擇投資，那麼大家就會達成較優的均衡。我覺得這和之前坐在中間的先生說的有關，就是關於空頭市場還是多頭市場的觀點。如果是空頭市場，人們對於其他人選擇投資並不抱有信心，由於這是一個自我實施的預測，最後導致大家都不去投資了。我們早就見過這樣較劣結果的案例，比如第一講中的囚徒困境。我強調一下，雖然我們得到了較劣結果，但這並非是囚徒困境，為什麼這不是囚徒困境？它們是有不同之處的，儘管兩個均衡的收益都是較劣。囚徒困境的較劣均衡導致的結果是，大家都不去打掃房間或者都要坐牢。但這個賽局的較劣均衡不是囚徒困境，請你後面的人來回答一下。學生：沒有人活受罪，但也沒有人獲得收益教授：或許結果也沒那麼糟。你說得很對，我可以把結果編得更糟糕的，我可以讓收益降到非常低，還有別的理由嗎？你後面的那位女士。學生：因為這裡沒有嚴格劣勢策略教授：在囚徒困境中選α永遠是最佳對策，之所以在囚徒困境中會得到較劣結果，是因為保守策略、非合作策略。不打掃房間的策略α總是最佳的策略，這個賽局裡的較好較道德的做法是選擇投資，但這不等同於說不投資優於投資。實際上，如果所有人都投資你也應該投資，沒錯吧？這是個社會問題，但這可不是社會問題的囚徒困境。那這是一種什麼樣的社會問題呢？請你前面的同學回答。學生：這可能是一種合作問題教授：沒錯，如果人們合作結果會更好，但我們來換一個說法，我們用第一天講到的術語－協調。這是一個協調賽局，為了使那些紐約客的讀者習慣，我在讀O的時候變音了，為什麼說這是一個協調賽局？因為我們希望教室裡的每一個同學透過協調都選擇投資，實際上，如果協調成功就會皆大歡喜，而且沒有人會變卦，這樣我們就達成了一個均衡。然而，不幸的是，我們總是協調失敗。要麼大家都不投資，要麼和第一講一樣，大家存在分歧，使有人要蒙受損失。我認為這種情況在社會上並不少見，現實生活中有很多協同謬誤。很多事都像協調賽局一樣，而且協調賽局經常導致較劣的結果。所以我們多花點時間來探討一下，因為我認為這對你很重要，不管你是不是經濟學家。好了，我們開始探討吧！哪些情況是協調賽局能導致如下的後果？如協調失敗，或者協調的方向有問題，而最終達成了較劣均衡呢？我們來找幾個案例，後面有人舉手了，請把麥克風遞到後面去－對，就是那裡，感謝，等麥克風到了再大聲說。學生：在校園裡的派對是一種協調賽局教授：對，校園派對是一種協調賽局，因為大家需要協調好去一個地點，對嗎？你是這個意思嗎？請繼續說。學生：是這樣的，如果參加的人不多，那麼參加聚會的人玩得並不快樂。但參加的人很多，大家都會玩得開心。教授：這是個不錯的想法，派對有兩方面可能出現協同謬誤，一個是參加的人要是不多，沒有意思，因此你也就不想參加；相反，如果參加的人很多，就很有趣，這樣大家就都想參加了。第二點是－這裡也有兩個均衡，大家都參加或者都不參加。同樣，派對的地點－我以為你要說的是這個呢。這也是一個類似的協同謬誤。在紐黑文曾經有很多酒吧，但現在可能不多見了。曾經在校園附近有很多不同的酒吧，但是你們都不允許去酒吧，但反正事實是，學校周圍有很多酒吧，大家想協調好在週五晚上到酒吧聚會，研究生們通常安排在週四晚上，這些在商業區的酒吧有一家是戲劇學院的據點，另一家是經濟學院的據點，而且他們沒有聚到同一個據點，看來這個還真是個不錯的均衡。你們到了一座陌生的城市，首先要知道哪裡常舉行你喜歡參加的派對。當然你們也可能會協調失敗，大家各玩各的，然後不小心遭到打劫了。還有別的協同謬誤的案例嗎？坐在後面角落的－就是他。學生：內戰時交戰中的黨派簽協約算不算？教授：這也可以算作一個協同謬誤，這在某種意義上和囚徒困境類似，我先解除武裝，然後你也要解除武裝，這算一個吧！這也是一個協同謬誤，但這個也有些囚徒困境的意味。很好，繼續說，還有其他例子嗎？那位同學－就在你周圍，就是門旁邊的，對，就是他。學生：在大型體育賽事中，人們在考慮到底給哪個隊伍呐喊助威。教授：我不知道這是個較優結果還是較劣結果，這就是傳說中的揮手致意吧！既然美國人堅持揮手致意，我猜他們認為那是個較優結果，對嗎？還有其他的案例嗎？學生：性別之戰教授：我們以後再來考慮這個問題，先保留這個想法，下一講我們再來討論。你說的是個不錯的案例，下一講再討論，還有其他的嗎？那我們再深入研究一下會面地點吧！我們討論過在酒吧碰面或者在派對碰面，但就是沒說過網站。比如那些聊天網站或者交友網站，這些網站和派對的作用其實是差不多的。你希望大家都協調好去同一個網站，那有沒有經濟學裡的案例呢？誰能想到一個經濟學的案例？除會面地點以外，還有沒有別的外部效應？學生：我覺得除了剛才他們說過的，報紙之類的應該是相關的案例吧！可能我們都只需要一個全球新聞網就夠了。教授：有趣的想法，而且兩面還都說得通。只有一份報紙的壞處是顯而易見的，但從另一個方面來看，當午餐後大家坐在一起討論時，這倒是能讓大家找到聊到一起的話題。當然了，看電視劇也有從眾效應的。如果所有美國人都看同一部電視劇，比如說這幾天大紅大紫的美國偶像，那你們共進午餐時就有聊天的話題了。不過請注意，這可不是什麼好協調的，美國偶像這樣的例子多得很。我小時候在英格蘭生活時－看來我又要暴露自己的年齡了。那時候大家都想成為潮人，那你就要穿喇叭褲，喇叭褲可是每個潮人的必備，這是一個多麼可怕的潮流啊！你們要是不信在英國也有這麼滑稽的潮流，那你們回想一下，是不是在美國也有過這樣滑稽可笑的潮流呢？你要是還不相信，想想美國中西部，我可什麼都沒說，把這段剪掉別播出啊！還有別的案例嗎？請這位先生說說你的想法。學生：比如微軟壟斷的形成過程。每個軟體都和微軟的系統相容，所以以後就有更多的人用了。教授：好想法，我忘了你叫什麼了？學生：斯蒂文教授：斯蒂文的意思是，一種軟體可能會帶來循環效應，越多的人使用微軟的軟體產品，我使用微軟產品的優勢就更明顯。我可以安裝不同的程式，我可以跟合夥人交換檔案，可以協調達成使用不同軟體的各種均衡，當然你也可能達成了較劣的均衡。很多人對此頗有微詞，但我保持中立。很多人都認為微軟的產品不是最好的選擇，這樣的連帶產品多得很，這些都屬於連帶外部效應。比如我們舉高畫質電視這個例子，我們需要制定一個統一的技術標準，這樣大家都會遵循此標準，因為如此，大家都可以生產符合標準的電視及周邊產品了。當然，每家公司都希望自己的產品標準成為行業的通用標準，我們同樣可能會選擇不合理的標準，或者說達成了較劣的均衡。那政壇選舉呢？在政治領域，尤其是初選的時候，無論是民主黨還是共和黨，初選時集中投票給一個候選人大有益處，因為這樣能夠加快黨內選舉，而且顯得黨內意見很統一。對此我同樣表示中立，但這樣可能會導致不合適的候選人勝出，這就是政治上的潮流效應。誰贏了新罕布夏和愛荷華誰就獲勝了，這也是一個案例。還有別的經濟學案例嗎？請那個小夥子來回答。學生：證券交易所教授：具體說是掛牌交易的證券交易所。在一家大型證券交易所裡，有大量的證券交易是很有優勢的，這樣可以分攤固定成本。當然這也考慮到了流動性和其他的問題，但主要考慮的還是固定成本的問題。趨勢是，最後會只有一家證券交易所，我們現在還沒有到這一步，但這只是時間的問題了。可是這未必是家有實力的證券交易所，或者會導致該交易所獲得壟斷力量。我再舉幾個例子吧!比如說銀行擠兌的案例，什麼是銀行擠兌？誰來回答一下？學生：銀行擠兌就是公眾們對於銀行失去信任，擔心自己存在銀行資金的安全，蜂擁而至去提款。教授：我們可以很自然地把銀行看成是有兩種均衡的，較優均衡是大家對銀行抱有信心，紛紛把錢存到銀行裡去，然後銀行就可以把其中一部分資金以更高的利率貸出去－銀行可不喜歡把錢都鎖在金庫裡面，他們希望把錢貸出去收利息。對於每個人來說，這是一個較優均衡。但是如果人們對銀行失去了信心，開始瘋狂的提款時，銀行金庫沒有足夠的現金來兌現，這樣銀行就要關門了。我以前總在課堂上講，你們誰也沒見過銀行擠兌是什麼樣的，因為差不多30年代中期以後再沒發生過，這在19世紀30年代以前的美國經常發生，但自從聯邦存款保障體系建立後，這種情況基本就沒發生過了，不過我可不敢保證以後也不會發生，因為現在就有一樁銀行擠兌事件。我說的銀行擠兌發生在英國，有一家叫北岩銀行的金融機構就被擠兌破產了，不信你回去看昨天的紐約時報，就會看見報導說，在這家銀行的倫敦支行門外，人們排起長隊蜂擁而至來提款，英格蘭銀行試圖干預並恢復人們的信心。但請注意，這可不是那麼簡單的，這不是抵押貸款危機那麼簡單。這家銀行的確有抵押貸款業務，但並不是由於抵押貸款業務經營不善而引起了公眾的注意。實際上就是公眾對這家銀行信心不足。較優均衡下，人人都來存款；較劣均衡下，大家就都來提款。在美國電影裡也講過銀行擠兌，在哪部電影裡面講過銀行擠兌呢？學生：是在《風雲人物》裡面講過教授：當然在《歡樂滿人間》裡面也講過，但你說《風雲人物》也沒錯，有多少人看過《風雲人物》？誰看過《風雲人物》這部電影？我看看大概多少人沒看過，先不要放下手。大家請記住，如果你持有綠卡，快去看《風雲人物》，不然會被吊銷的。《風雲人物》裡面的銀行擠兌案例，其實說的只不過是存款取款的事兒，但無所謂了，就把它當做一家銀行吧。所幸的是，電影裡面的銀行沒有倒閉，為什麼《風雲人物》裡面的銀行沒有倒閉？為什麼它沒有倒閉呢？穿綠衣服的小夥子你來回答，請把麥克風遞給他好嗎？學生：大家達成一致，只取出日常開支，不要取出全部的存款。教授：有些人可能沒聽見，我來重複一下。人們達成一致，只取出小額的生活開支，有的甚至不取了，銀行擠兌就結束了。人們後來發現銀行不會破產，他們就又把錢都存到銀行裡了。人們確實達成一致了，是什麼原因讓人們恢復信心了呢？這多虧了詹姆斯·史都華的功勞，大家還記得這部電影吧？詹姆斯·史都華站出來，做了一個演說，他可能不會像我這麼跟大家解釋，但是如果他學過這門課，他就會這麼說－他會說這裡有兩個均衡。我不會學賓夕法尼亞州西部人的口音，但反正這裡有兩個均衡，大家都提款的均衡是較劣的均衡，最後會導致大家一無所有；大家仍然把錢存在銀行是較優均衡，這對每個人來說是較優的，所以我們還是把錢存到銀行吧！我覺得他說得應該比我說得更鼓舞人心，最後大家還是又把錢存進銀行了。那我隨便來叫一名同學提問，看看是不是大家都聽明白了。這裡面存在兩個均衡，一個較優另一個較劣。我們再來進行一次這個賽局，我們再做出自己的選擇，但開始之前，我先把麥克風給派翠克，給他五秒鐘來說服各位投資，請起立吧！派翠克將用五秒鐘的時間，用他的方法說服大家來投資。學生：很顯然，如果我們都投資，就會有所回報，所以請大家都投資吧！教授：那好，我們看看是否起到了效果，我們看看接下來結果會怎樣？選擇投資的同學請舉手？選擇不投資的請舉手？我們差不多成功了，我們差不多說服了所有人來投資，那這到底是怎麼回事呢？請大家再給派翠克一點掌聲，他做得很棒。從中我們可以總結出一條結論，結論就是這個賽局本身並沒有改變，這個就是我們進行了三次的賽局，而且這是我們第四次進行了，但是這次大家的選擇卻和以前不同，絕大多數的人，應該是超過90%的人都選擇了投資，看來派翠克的演說起到了作用。只不過派翠克並沒有出資，沒有賄賂你們，也沒有簽合同，也沒有威脅說要打斷你們的腿。他只是說這樣做是明智的做法。讓我們回憶一下囚徒困境。如果在囚徒困境中，派翠克跟大家說，在囚徒困境裡面，如果我們都選β，要比選α更好－差不多就是這樣的說法。你們處於囚徒困境中會怎麼做？你們還是會選擇α。派翠克想要說服大家，他想跟大家溝通，並告訴大家，在囚徒困境裡選β會更好，但這毫無效果。還沒下課呢!但溝通在這裡卻有效。為什麼？這個賽局裡派翠克能說服大家，但在囚徒困境裡卻不行呢？請把麥克風給凱特好嗎？為什麼此賽局中他能說服大家，而之前不行？學生：因為他並沒有勸大家選嚴格劣勢策略教授：因為他並沒有勸大家選嚴格劣勢策略。除此以外，他想讓大家怎麼樣？想讓大家達成納許均衡，從中又可以總結出一條結論。協同謬誤和囚徒困境不同，它和囚徒困境不一樣。僅透過溝通而非簽署合同就可以改善結果。具體說，我們可以說服大家共同去達成另外一個納許均衡，這就又為達成納許均衡提供了合理的動機。想要化解囚徒困境就必須簽署合同，需要單邊轉移支付，我們必須改變賽局的收益，但納許均衡是自我實施的協約，納許均衡本身就有強制力。這個賽局裡，我們大家都選擇投資，我們確實不需要單邊轉移支付，不用威脅別人，也不同簽署合同，更不需要訴諸法律。我感覺派翠克也沒有那麼暴力，我們最後會做出正確的選擇，因為這符合自身的利益。協同謬誤在現實中並不少見，小到銀行擠兌，大到市場泡沫，甚至還有中西部的時尚。總之包羅萬象，溝通能夠起到很大的作用，我們下週一再來繼續學習。 2007年9月19日 *****