納許均衡-劣勢潮流及銀行擠兌

講座五

我們首先正式定義上一堂課的新概念:納許均衡。然後討論為什麼我們對納許均衡感興趣,以及我們怎樣才能找到各種遊戲中的納許均衡。我們以一個課堂上的投資賽局遊戲為例,說明社會環境中有很多均衡的情形,以及社會可能完全無法協調,或可能有較劣均衡的協調。我們認為,在現實世界中,協同謬誤是常見的情形。最後討論為什麼在這種不同於囚徒困境的協同謬誤中,簡單溝通可能是一個補救措施。

講座五:納許均衡-劣勢潮流及銀行擠兌

    Ben Polak 教授:上一講我們學到了一個新的概念,可能有些人覺得並不陌生,它就是納許均衡。 這一講我們來探討下納許均衡,並學習如何找出簡單案例中的納許均衡。在後半講中我們透過一個小遊戲來學習如何運用納許均衡,希望這個遊戲會很有趣。 首先我們給出納許均衡正式定義,上一講我們給出的是非正式定義,策略組合是一個集合,該集合包含每個參與人的一個已選策略,用S1*、S2* 一直到SM*表示,如果此賽局一共有M個參與人,納許均衡以後我就簡寫成NE了。納許均衡是滿足下列條件的策略組合,對於任意此集合內的參與人I,她所選擇的策略Si是其他參與人所選策略的最佳對策,當然,其他參與人的策略要用S*-i表示,也就是說,每個參與人都選擇了最佳的對策。 納許均衡目前是賽局理論最常用的解概念,比如去麥肯錫之類的公司面試時,你會發現公司要求面試者掌握納許均衡,為什麼我們要掌握納許均衡呢?不僅因為它是教材內容,它有很多實用價值,而且你去麥肯錫面試還會用到它。這可不是一個好的學習動機,而且我可不想讓大家覺得,我們花了這麼多時間學習納許均衡,學到的卻都是脫離實際的知識,絕對不是這樣的。 實際上,並非所有情況都能達成納許均衡,比如說在我們之前玩的數字遊戲中,每個人都選擇一個數字。我們之前講解過的,這個遊戲的均衡就是每個參與人都選1,但實際操作下來平均數遠高於1,在13左右。當我們重複進行這個遊戲時,平均數的確趨近於1了,但是我們第一次做這個遊戲時並未達成納許均衡,所以我們不能想當然的認為人們總能達成納許均衡,或理性人就能達成納許均衡,上述的說法都是不正確的。 誠然,除了納許均衡被廣泛運用之外,學習納許均衡還是有充分的理由的,我們不妨來稍作討論。我先在這裡寫一下學習動機,我們上一講討論過,第一個動機其實是你們當中的一員提出來的,其實就是不反悔,這怎麼講呢?假設我們分析一個納許均衡,如果把其他人的策略看成不變數,任意參與人I都不會改變策略。我再重複一遍,把其他參與人的行為看成不變的,任意一個參與人都不會改變策略。說得更嚴謹一點,任何參與人都嚴格不會改變策略,我們一會就知道這一點很重要了。改變策略嚴格不會使參與人獲得增益,其他參與人不改變行為的前提下,自己改變行為並沒有任何好處。 我為什麼把它稱為不反悔呢?因為如果你也參與到賽局中來,這個賽局已經達成了納許均衡,你觀察了一下其他參與人的行為,瞭解其他參與人的行為後,你自問道,我為我的選擇後悔嗎?你的回答會是我不會後悔,因為在當時情況下我採取了最佳對策,因此這應該算是我們學好納許均衡的一個相當重要的動機了。 接下來是第二個動機,剩下的動機我們邊講邊提。第二個動機是因為,納許均衡可以被想像成自我實施的信念。上一講我們著重討論了信念,如果我認為門將會撲向這邊,我就應該從另一邊射門,以此類推。不過我們確實沒有深入探討過信念,如果我認為-如果賽局中的所有參與人相信其他人想要保持納許均衡的狀態,那麼大家都不會打破這種均衡,為什麼會這樣呢?為什麼說要是大家想要保持納許均衡的狀態,那麼大家都不會去打破均衡呢?這怎麼解釋呢?誰來回答?請穿紅色上衣的小夥子來回答。 學生:因為在納許均衡下,賽局雙方均採取最佳對策。 教授:完全正確,這和第一個動機差不多。如果我覺得其他參與人2到N會採用S2到Sn的策略,根據定義,我的最佳對策是S1,實際上我也是納許均衡的一部分,這些自我實施的信念是納許均衡定義的一部分,我們透過回顧上一講的案例,來看看納許均衡是怎麼達成的。我並不是說要重新分析那個案例,我只是想讓大家都能聽懂。 上一講我們繪製了一個賽局的圖像,賽局中參與人要選擇自己的努力程度,這一條線代表參與人1的最佳對策,它是參與人2策略的一個函數。這條線代表參與人2的最佳對策,它是參與人1策略的一個函數。這就是我們在上一講繪製的圖像,我們一起來回顧一下。很顯然納許均衡就是這一點,納許均衡就是兩條線的交點,但這和之前提到的動機有什麼關係呢? 哪裡體現出了自我實施的信念,抱歉,我寫成參與人1了,應該是2。如果參與人1認為2會採用這個策略,那麼參與人1應該採用這個策略;如果參與人1認為2會採用這個策略,那麼參與人1應該採用這個策略;如果參與人1認為2會採用這個策略,那麼就應該採用這個策略,以此類推,這就是最佳對策的意思。如果參與人1認為2會採用納許策略,那麼他的最佳對策也是採用納許策略。反言之,如果參與人2認為1會採用納許策略,那麼她的最佳對策也是採用納許策略。因此,這就是一個自我實施的信念。如果兩人都相信會這樣發展,那麼事情的確就會這樣發展。 哪裡體現出了不反悔這一點呢?比如說參與人1她第二天早上起床,不好意思,應該是他,對吧?他第二天早上睡醒後自問道,我選了S1*,我後悔嗎?但是他知道參與人2的選擇,參與人2選擇了S2*,然後他自言道,在參與人2選擇S2*情況下,這是我能做的最好的選擇了,實際上我選擇了我的最佳對策,因此選擇S1*我一點也不後悔。請注意這一點在其他情況下並不成立,比如說參與人1採用了策略S1,但參與人2卻採取了其他策略,如S2',這時參與人1就會後悔了。參與人1第二天睡醒後自言自語道,我原本以為參與人2會採用S2,實際上她卻選擇了S2',我真後悔自己選了S1,我當時應該選擇S1',因此只有在納許均衡下參與人才不後悔,大家都明白了嗎?這些就是我們對上一講所學內容的回顧和總結。 這一講我們將要利用較多的時間來理解納許均衡的概念,並學會如何尋找納許均衡。我得把投影機關掉,好了。接下來,我們來研究一個只有幾個參與人和幾種策略的簡單賽局,我希望以此讓大家學會如何尋找簡單賽局中的納許均衡。先穩紮穩打吧,以後再加快速度。 我們從這個簡單的雙人賽局開始研究吧!每個參與人都有三個策略,我們就不來做這個賽局了,這只不過是一個隨機編出來的賽局。參與人1可以選擇上中下,參與人2可以選擇左心右,收益如下:(0,4)、(4,0)、(5,3)、(4,0)、(0,4)、(5,3) 及 (3,5)、(3,5)、(6,6)。如果我們時間充裕倒是可以做這個賽局,但這並不是一個多麼有趣的賽局,所以我看就算了吧!接下來,我們來分析哪種情況是納許均衡,以及如何來找出這個賽局的納許均衡。我們用和之前類似的方法來尋找這個賽局的納許均衡,上一講我們分析的是一個複雜賽局,兩個參與人的策略是連續的,我們在上一講找到了這個賽局中參與人1和參與人2的最佳對策,即參與人1對於參與人2的最佳對策,以及參與人2對於參與人1的最佳對策,之後我們發現兩線交點就是納許均衡。對於這個賽局也這樣分析。首先我們要找出參與人1的最佳對策,具體來說,參與人2選左時,1的最佳對策是什麼?請準備好麥克風,我要開始提問了,有人想回答嗎?這問題不是很難吧!不如讓中間那位女士試試吧!誰離那位女士最近?好。 學生:最佳對策是中 教授:此情況下參與人1的最佳對策是中,因為4>0且4>3,我們用圓圈把它標記出來。我們把4用綠色圓圈標記出來,這很簡單對吧!我們繼續。參與人2選心時,1的最佳對策是什麼?我們請坐在另一邊的同學回答,請穿耶魯橄欖球隊服的小夥子回答吧!就是他。 學生:上 教授:很好,上是正確答案,這是耶魯橄欖球隊的又一個勝利啊!因為4>3且4>0,回答得很好。艾爾,你幫我再找一名同學來回答。在參與人2選擇右的情況下,參與人1的最佳對策是什麼?請大聲說。 學生:下 教授:下。沒錯,下是最佳對策,因為6>5。從中我們可以找出參與人1對應左心右三種不同情況下的最佳對策。順便說一下,注意參與人1的每個策略都是最佳對策,任何策略都不會因為劣勢而被剔除,任何策略也不會因為不是最佳對策而被剔除。同理,我們來看一下參與人2,請準備好麥克風,我們再找幾個人,你想找坐在後排,之前回答過參與人2對於下的最佳對策的那位同學來回答嗎? 學生:左 教授:穿藍上衣的男士說是左,因為4>3>0。我們換個顏色和形狀,用方塊標注吧!我不是說非得用圓圈或者方塊,如果你喜歡用六邊形也行,隨你了。我先把答案寫在這裡吧!參與人2對於上的最佳對策是左,參與人2對於中的最佳對策是什麼?請這邊的一位同學來回答,大點聲說。 學生:心 教授:因為4>3>0,所以是心,我用彩色方塊在這裡標注一下,參與人2對於下的最佳對策是什麼?艾爾,請再找位同學來回答。 學生:左,我說錯了,應該是右 教授:說得很對,因為6>5,我們繼續。我們剛才在計算參與人1最佳對策的方程式,這與上一講的最佳對策圖線是類似的,這裡我們用白色的直線來表示,但我們也可以用綠色的小圓圈來標注,就像這樣。同理,我就不標注出所有的點了,但所有點連起來就是這樣的。後來我們算出了參與人2的最佳對策,和之前一樣,我們用紅色的長方形來表示,我們透過微積分的觀點得出連續策略,不過道理都是一樣的,把它想像成我畫了很多粉色長方形即可。同理,我就不都畫出來了,你喜歡就在筆記本上畫吧,原理一樣的,納許均衡一定是兩條最佳對策圖線的交點,因為在這一點上每個參與人都採取了最佳對策,這個賽局的納許均衡是什麼呢?我們找個人來回答吧!請你前排的一位同學來回答吧!誰想回答呢?穿義大利隊服的那位,就由你來回答吧!這個賽局的納許均衡是什麼? 學生:是右下 教授:右下那個方格。沒錯,這個賽局的納許均衡就是右下,雖然你答對了,但是沒有獎勵啊!為什麼右下是納許均衡呢?因為此時參與人1採取了最佳對策,而同時參與人2也採取了最佳對策。 我希望大家都明白,特別是那些還在為作業發愁的同學,這不像造火箭那麼難,找出賽局中的納許均衡並不難,這並不是很麻煩的,而且我們剛才也是慢慢來分析的。我再來給大家舉一個例子,在繼續講下面的內容前,請注意,我再來強調一點,在這個賽局中參與人1的每個策略是某種情況下的最佳對策,參與人2的每個策略也是某種情況下的最佳對策,因此我們在前幾講學到的方法,即剔除劣勢策略以及剔除非最佳對策的策略,在這個賽局裡是行不通的。因此,納許均衡縮小了我們的預測範圍,但從中我們也學到了一些結論,我們在幾個星期前說到過理性或者理性的相互知識,甚至是理性的公共知識只能幫助我們剔除劣勢策略,以及剔除非最佳對策的策略。 我們得出這個賽局的納許均衡是右下,這是一個很詳盡的預測。但請注意,一個理性參與人也可能選中,參與人1之所以選中,可能是因為參與人1認為參與人2會選擇左,那你可能要問,為什麼參與人2會選左?參與人1會說,我之所以認為參與人2選左,因為參與人2覺得我會選上,然後你接著問道,參與人2憑什麼認為你會選上?參與人1回答,參與人2之所以認為我會選上,是因為她覺得我認為他會選心;然後你又會問,為什麼參與人2云云,然後你就陷入了封閉循環中去了。 大家都在理性地看待事物,所有東西都可以被信念合理化,但我們卻不能找到萬能解,我們無法找到一個簡單的萬能解。在剛才的右下的情況裡,參與人1認為選下是很合理的,因為他認為參與人2會選右,而參與人2認為選右是很合理的,因為他認為參與人1會選下。我可能講的有點亂了,強調一下,我們不能想當然的、理性地認為人們總會達成納許均衡,達成納許均衡還需要別的條件。 誠然,這一講我們要來研究納許均衡。我們不妨再來看一個案例,同樣,為了便於分析研究,我們舉一個雙人三策略的賽局。策略分別為上中下、左心右,這個賽局的收益如下:(0,2) (2,3) (4,3) (11,1) (3,2) (0,0) (0,3) (1,0)和(8,0)。這個賽局不太好分析,這些數字都是我在寫板書時隨便想出來的。同樣,我們要找出這個賽局的納許均衡,我們還要沿用之前的方法。我們需要找出每一個參與人在對手選擇不同策略下的最佳對策,與其說直接寫出來,不如用綠圈和紅方框標注出來。我來找幾個人來回答,準備好麥克風,麥克風在哪裡呢?謝啦!艾爾,你能不能找個人回答,策略左的最佳對策是什麼?隨便找就行,左的最佳對策是什麼? 學生:中 教授:中是左的最佳對策,因為11>0。米拓,你來找個人回答心的最佳對策是什麼? 學生:中 教授:還是中,因為3>2>1。再找個人來告訴我右的最佳對策是什麼?後面有人想回答嗎? 學生:下。 教授:很好,是下。我們同理來分析一下,參與人2對於參與人2來說會怎樣?艾爾,讓你後兩排快睡著的傢伙回答,上的最佳對策是什麼? 學生:哪個參與人的最佳對策? 教授:參與人2對於上的最佳對策是什麼?算了,我再找一個人吧!沒關係,你身後的人來回答一下,上的最佳對策是什麼? 學生:中或右是一樣的 教授:這個就有點容易弄錯了,上的最佳對策是心或者右,多虧各位簽了授權書,上的最佳對策要麼是心要麼是右,那中的最佳對策是什麼? 學生:心 教授:是心,感謝你的回答。下的最佳對策是什麼? 學生:左 教授:下的最佳對策是左,這次我們沒有花費多少時間,我們已經輕車熟路了。這個賽局的納許均衡是什麼?我們再問問那個差點睡著的傢伙,這次問一個簡單點的問題,這裡的納許均衡是什麼? 學生:納許均衡是(3,2)嗎? 教授:沒錯,就是中心,注意這個就是此賽局的納許均衡,為什麼它是納許均衡呢?因為每個參與人都採取了最佳對策,如果我是參與人1,我認為參與人2會選心,我就應該選中;如果我是參與人2,我認為參與人1會選中,我就應該選心,實際上,這樣我們就都不會後悔。注意並非每個參與人都獲得了最大收益,比如參與人1其實也想得到11或者8,但是他們都不後悔,因為在參與人2選心的情況下,參與人1最多也只能得到3,這是選中時才能達到的結果。順便說一下,最佳對策不一定是唯一的,有時候也可能有多個最佳對策,這是有可能發生的。 那我們從中學到了什麼呢?我們學到了如何找出納許均衡,這顯然與我們幾周之前學到的最佳對策知識點有很大的聯繫,不過我們再回顧一下更早的知識點,想想這個與優劣有什麼聯繫。這就是我們這門課的第三個概念,我們講過了優劣的概念,我們學到了最佳對策的概念,現在我們又學到了納許均衡,我覺得顯然這一點與最佳對策緊密相連,納許均衡就是最佳對策的交點,但是這個和優劣有什麼聯繫呢?我們不妨回顧一下,接下來我們要把納許均衡與優劣聯繫起來。為了聯繫起來,我們當然要回顧一個我們之前見過的賽局。 這是一個參與人1和2選α與β的賽局,收益分別(0,0) (3,-1) (-1,3) (1,1),這就是第一講的賽局,即囚徒困境;我們都知道此賽局中-我就不找人來回答了。我們都知道此賽局中α嚴格優於β,這是我們第一講學到的東西。驗證一下,對手選α時你選α得0,選β得-1;對手選β時你選α得3,而選β得1,α嚴格優於β。這當然對於參與人2也是同樣的,因為這個賽局是完全對稱的。 下面我們來尋找這個賽局的納許均衡,我覺得我們知道納許均衡是什麼,但我們還是仔細分析一下。α的最佳對策是α,β的最佳對策是α,對於參與人2來說,α的最佳對策是α,β的最佳對策是α,大家都聽懂了嗎?我可能說得有點快,但是這都是顯而易見的吧!因此這個賽局的納許均衡是(α,α),換句話說,就是我們剔除嚴格劣勢策略後剩餘的那種結果了。這是一個α嚴格優於β的賽局,此賽局的納許均衡仍然是交點,即答案是兩個參與人都選擇α。這不是什麼新知識,我的推理到目前為止還沒有錯誤吧!我們再認真一些好了。我們怎麼證明在一個賽局中,嚴格劣勢策略並不能達成納許均衡,比如這個賽局裡的嚴格劣勢策略是β。我覺得這是一個不錯的想法,因為我們希望這兩個知識點有交集,我強調了嚴格劣勢策略無法促成納許均衡,這是為什麼呢?請那位同學來回答。 學生:嚴格劣勢策略不可能成為最佳對策 教授:很好 學生:最佳對策才可能達成納許均衡。 教授:說得很對,嚴格劣勢策略永遠不可能成為最佳對策。具體說,優於它的策略總是優於它,因此說嚴格劣勢策略不能達成納許均衡,這是嚴格劣勢策略無法達成納許均衡的一個很好的證明。不過現在我們遇上了點小麻煩,麻煩就是弱劣勢和弱優勢,我們可以理直氣壯地說,嚴格劣勢策略絕對不會在納許均衡裡出現,可是弱劣勢策略卻不然。你們可能預感到了下一次作業會有一道這樣的題,我記得應該是第二題。剔除弱劣勢策略有時候確實挺難處理的,弱劣勢策略不像嚴格劣勢策略那麼好處理。我們來分析一個簡單的案例。 這是一個簡單而枯燥的案例,但它卻很能說明問題。這仍然是一個2 * 2的賽局,參與人1可選上下,而參與人2可選左右,收益很簡單:(1,1) (0,0) (0,0) (0,0)。我們來找出這個賽局的納許均衡。我就不叫人回答了,因為太簡單了。參與人2選左時,參與人1的最佳對策是上,如果參與人2選擇右時,參與人1的最佳對策是上或下,因為兩者的收益都是0,這兩個策略都是最佳對策,沒錯吧!因為它們的收益是一樣的。 相反,如果參與人1選上,那麼很顯然參與人2的最佳對策是左,我們都比較喜歡這樣的答案,但很不幸的是,如果參與人1選下,參與人2的最佳對策是左或右,二者收益均為0,沒什麼區別。那麼這個賽局的納許均衡是什麼?我們首先發現的是,這個賽局不止存在一個納許均衡,我們以前沒有遇到過這樣的情況,我覺得教室裡的人會達成一個納許均衡,我也希望這是對這個賽局的合理預測,在這個賽局裡,我希望所有的參與人1都選上,參與人2都選左,是這樣吧!促使大家不去選擇左和右的想法似乎都是站不住腳的。 不過很不幸,也不能說不幸吧!左上是一個納許均衡,但右下也是,如果參與人2選右,你的弱最佳對策為下,如果參與人1選下,參與人2的弱最佳對策是右,這也是根據納許均衡定義得出來的。它是一個很明確的定義,我把它擦掉了。定義這麼說的-納許均衡就是每個參與人都採取最佳對策的均衡,換句話說,每個參與人嚴格不願改變策略,參與人改變策略嚴格不會獲得增益,比如這個案例中,參與人1選右並沒有獲得額外收益,參與人2改變策略也沒有額外收益,兩個策略的收益都是0。 到這裡我們似乎遇到了這門課的難點了,有時候我們不止找到了一個納許均衡,但這並沒有什麼,這是客觀存在的,但是在這個案例中的一個納許均衡很牽強,如果你回去跟你室友解釋說,我預測這些都是賽局的可能結果,你會被嘲笑。某種意義上來說,它應該是合理預測。好了,就說這麼多,我們繼續講課。這些都太正經了,毫無意思。接下來我們講點有意思的吧! 我們來看另外一個賽局,我們當然也要找出這個賽局的納許均衡,不過我們還有別的工作要做,我們要來仔細分析一下這個賽局。這個賽局很有特點,它與我們之前的賽局的不同之處是,這個賽局有很多個參與人,儘管每個參與人只有幾個策略,我想透過這樣賽局讓大家明白,如何在像這樣參與人不止兩個的賽局中找出該賽局的納許均衡。所幸的是,每個參與人的策略不是太多,我在這塊黑板上寫板書吧! 我們要做的這個賽局叫做投資賽局,我們來模擬一下這個賽局吧!賽局中的參與人是在座的全體同學,那些昏昏欲睡的同學趕快醒醒,你們要參與到其中來了。這個賽局的策略,或者說這個賽局的策略組合很簡單,大家可以選擇分文不投,或者為一個課時專案投資10美元。我們有時把分文不投說成不投資,都聽懂了嗎?這個很好理解吧!你們要麼投資10美元,要麼不投資,現在給出了參與人和策略,我們還沒有給出賽局的收益。 收益如下;如果你不投資,你的收益就是0,不勞則無獲,這是個常識吧!如果你們都投資了10美元,那麼你們的收益就是這樣的了。好消息,各位會分得5美元利潤,也就是說,你們投資了10美元,得到了15美元的毛利潤,但是減去之前投資的10美元,淨利潤就是5美元。好消息就是各位能獲得5美元淨利潤,但這要求不少於90%的同學選擇了投資10美元,如果多於90%的同學投資了,那麼你們會獲得50%的利潤。 然而壞消息就是,如果投資的人數少於90%的話,你會損失掉原始10美元的投資。賽局的關鍵在於,你們不允許互相溝通,不許用手勢和表情,一切都不行,大家都聽懂了吧?各位都明白這個賽局的意思了吧!首先我要說明的就是,我們只是模擬一下,因為在座有250人,而且我現在也沒有那麼多現金。所以假裝我們在進行這個賽局,不許溝通,請各位在筆記本的邊上寫下你是否會選擇投資,你可以用Y表示投資,N表示不投資,不要互相討論,在你們筆記本的邊上寫下Y或N。投資就寫Y,不投資就寫N,不許討論的。 現在給你的同桌看一下,因為你在同桌面前不會說謊。現在請大家舉手表決,我們來看看多少人選擇了投資。誰投資了請舉手,舉手就行了;不投資的舉手,這絕對多於10%啊。我們再來一次,選擇投資的請舉手,不投資的請舉手,我也不知道具體有多少?我猜是一半。看來我們真應該實際進行這個賽局。那我們就來分析一下,我們花點時間來討論討論,這個賽局有很多東西值得分析討論的,把麥克風借我用一下吧!這位同學,請問你怎麼選擇的? 學生:我投資了 教授:你為什麼選擇投資呢? 學生:因為我不缺錢 教授:他很富有,那你請我們吃午餐吧!誰選擇了不投資?這裡有一位,請問你為什麼不投資?大聲說出來,讓大家都聽見。 學生:我不投資,因為我覺得想要獲得利潤,90%的人投資與否的比率至少是2:1。 教授:你的意思是說計算預期利潤嗎? 學生:你可能獲得一半利潤,但也可能一無所獲。 教授:我明白了,你計算了預期收益,還有別的理由嗎?你怎麼選擇的? 學生:我投資了 教授:我本來想找不投資的傻瓜的。好吧,那你說說為什麼你投資了? 學生:只有付出才會有回報,我不理解為什麼有人會選擇不投資,因為不投資就沒有回報啊! 教授:請問你叫什麼名字? 學生:克雷頓。 教授:克雷頓說只有投資了才會有收益,不投資的話顯得缺少魄力。還有誰想回答? 學生:這個和之前(1,1) (0,0)的賽局差不多,因為都有兩個納許均衡,但兩個均衡的收益是不同的,要是你選擇不投資,你太害怕風險了,所以我覺得... 教授:這麼說你投資了? 學生:是的,我投資了 教授:在我把音響系統弄壞以前,我趕緊把麥克風還給艾爾吧!我們得到了不同的理由,大家是不是都聽清楚了?關於是否應該投資大家各有見解,差不多一半的人選擇投資,另一半的人選擇不投資,他們的理由也都能自圓其說,我們以後再來討論,這個和之前的賽局是否是一樣的。剛才的那個說法...抱歉,忘記了你的名字。派翠克認為這個和之前的賽局很相似,它們二者確實聯繫緊密,接下來我們看看二者到底有什麼聯繫?這個賽局裡的納許均衡是什麼?讓這位女士回答一下。 學生:無人投資,無人受損失,皆大歡喜。或者每個人都投資,大家都受益了。 教授:說的不錯,請問你叫什麼名字? 學生:凱特 教授:凱特說有兩個納許均衡。辛苦了,裘德,我還是回到講臺上吧!這個賽局有兩個納許均衡,一個是都投資,而另一個是都不投資,所以說有兩個納許均衡,我們來驗證一下是不是和凱特說的一樣。如果每個人都投資,那麼無人會後悔,這種情況下,每個人的最佳對策是投資;如果無人投資,選擇不投資也很合理,因為是最佳對策,這和派翠克說的一樣。這個賽局和之前的一樣,有兩個均衡,除此以外,二者還有別的相似之處,但怎麼說好呢?兩個賽局的納許均衡並不完全相同,在之前的那個賽局裡,(0,0) 這個均衡似乎很不合理,我們都不覺得這種情況會發生。然而這個賽局中,無人投資也是一個很合理的均衡,如果我認為沒有人會投資,那我絕對會選擇不投資。這裡面有兩個重要內容,講重點之前,我還需要解釋一下嗎?這就是第一個重點,我們如何尋找納許均衡?在尋找這個賽局的納許均衡時,我們用到了哪些複雜的數學方法?請準備好麥克風並遞給凱特,請問你是怎麼找到納許均衡的? 學生:我只找到了兩處不會後悔的結果 教授:原則上來說,你的方法是可行的,不過準確說,你應該考慮了各種情況,這裡有很多可能的情況,可能是1%選擇投資99%選擇不投資,也可能是2%比98%,以此類推。我們可以很準確的推算出不同情況下,每個人的最佳對策是什麼。那麼這個賽局最後的結果會是什麼呢?用什麼方法推算?你來回答吧! 學生:你只需要考慮你的行為能改變結果的情況,只有兩種情況,都投資或都不投資。 教授:的確是這樣,這樣問題變得簡單了,很好,我覺得他們兩位同學比我分析得更嚴謹,更有數學邏輯性,我覺得簡單的分析方法就是去猜測,我要猜測的東西很簡單,我只需要猜測均衡會是什麼樣的,然後再驗證一下即可。因此,分析這些賽局可以先猜測後驗證,這不失為尋找納許均衡的好方法,因為驗證過程很簡單易行,猜測可能比較困難,難免會有疏漏。可能會有一個隱含的納許均衡,在美國你們都說隱藏吧,可能會有隱藏的均衡,儘管如此,驗證過程中,無論假設的還是客觀的均衡,驗證它們到底是不是均衡很簡單,因為你只需要驗證參與人都不想改變策略,實際上這就是賽局最終的結果,這一點是比較容易猜測並驗證的。因此我們可以找到均衡,先猜後證的方法,在分析這樣參與人的數量很多,但策略不多的賽局時很有效。 這個賽局已經寫在黑板上了,因為它很重要。我們再討論一會,我想請大家再回憶一下剛才的賽局,那個賽局是什麼內容?請剛才投資的同學再舉下手,不投資的請舉手,沒舉手的人你們都欠我10美元啊!我們再來進行一次這個賽局吧!不許交流,請在筆記本的邊緣寫上你的選擇,不許說話,寫完了給同桌看看。我們再舉手表決一次,大家準備好,不許作弊,不許左顧右盼,讓裘德把鏡頭對準你們,如果你選擇投資請舉手;不投資的請舉手。投資的請再舉下手。看來還有幾個人選擇投資啊!那你們就真要欠我錢了啊! 我們再來進行第三次賽局。準備好,這次假裝要玩真的了,寫出你們的選擇。這次投資的請舉手,這世上還真有這麼執著的傻瓜呀!我們不斷重複,最後會趨近於什麼?我想讓大家都清楚,我們趨近於均衡。第三次選不投資的請舉手,這次就很接近了。舉手表決結果很接近一個納許均衡,是這樣吧!這就是我們上一講第三個理由的一個不錯的例證,這便是我們學習納許均衡的第三個原因。有些情況下,賽局會朝著趨向於一個均衡的方向自然發展,除了那些有錢願意請我吃午餐的老頑固,其他參與人都會趨向於一個均衡。賽局的結果會不斷趨近於納許均衡。 但我們討論得出,此賽局有兩個納許均衡,這兩個納許均衡當中,有哪一個優於另一個嗎?很顯然大家都投資這個納許均衡較好,大家都同意這點吧!大家都投資比起大家都不投資來說,是一個較好的納許均衡,沒錯吧!然而,我們進行這個賽局時趨向哪個了呢?我們趨向於較劣的納許均衡了,我們不斷地趨向於一個沒有人獲得利潤、投資都變成損失的均衡了,怎麼會這樣呢?我們怎麼會趨向於這個較劣均衡呢?說得正式一點,這個較劣的不投資的均衡相對於較優的納許均衡,處於帕累托劣勢。在較優均衡中,參與人的收益嚴格優於較劣均衡中的收益。用150或115的術語來說,這叫帕累托優勢,但是我們還是趨近於較劣均衡了,我們達成了那個較劣均衡。為什麼最後我們趨向於較劣均衡,而不是較優均衡呢?請穿灰上衣的小夥子回答。 學生:這對投資者來說是空頭市場,難道不是嗎? 教授:這個怎麼講?請你再多說點,解釋一下你的想法。 學生:大家對於其他人會投資不抱有太大的信心 教授:換種說法就是,最開始大概是均分的,這對那些投資的人是很不利的。我們開始時是各占一半,投資的機率低於90%的臨界值,對吧?從此以後就發生了巨變。這個思路的意思是說,初始狀態可能會影響結果。假如我們第一次進行這個賽局的時候,93%的人選擇了投資,這種情況下93%的人會賺到錢,雖然我無法給出證明,但是我猜我們會趨向於另一個均衡,最終會達到較優均衡,這樣說得通嗎?人們發現,第一次不投資的人實際上採取的是最佳對策,他們按兵不動,而那些投資的人開始時,很多人都不投資,然後大家陷入不投資的漩渦,最後也就沒人投資了。但如果我們開始時投資機率高於90%的臨界值,假如你們第一次就賺到錢了,那些選擇不投資的人可能就會後悔,然後可能會轉而選擇投資,然後我們可能會趨向另一個均衡。我並沒有說一定會,我只是說可能會。請把麥克風遞給他。 學生:如果只有70%選擇投資會怎樣呢? 教授:這是個很有水準的問題。如果剛開始接近但是低於臨界值,我也不知道情況會怎樣,我沒有做過類似的實驗,不過應該是越高的投資率、越接近臨界值的話,越可能趨近於較優均衡。我只是猜測一下,如果初始值小於臨界值會趨近較劣均衡,如果初始值高於臨界值會趨近較優均衡。但這可不是定理,我只不過是推測一下情況會怎麼發展,是根據你的推測再繼續推測。這個賽局有兩個均衡,一個較優一個較劣,較劣的那個處於帕累托劣勢。 我們再來回顧一下。我們不斷趨向於一個均衡,正好和之前說的納許均衡的一個特點相符,那就是關於自我實施的預測。如果你認為別人都不會去投資,你就不會去投資,自我實施的預測阻止你去投資;相反,如果你認為人們都會選擇投資,那麼大家就會達成較優的均衡。我覺得這和之前坐在中間的先生說的有關,就是關於空頭市場還是多頭市場的觀點。如果是空頭市場,人們對於其他人選擇投資並不抱有信心,由於這是一個自我實施的預測,最後導致大家都不去投資了。 我們早就見過這樣較劣結果的案例,比如第一講中的囚徒困境。我強調一下,雖然我們得到了較劣結果,但這並非是囚徒困境,為什麼這不是囚徒困境?它們是有不同之處的,儘管兩個均衡的收益都是較劣。囚徒困境的較劣均衡導致的結果是,大家都不去打掃房間或者都要坐牢。但這個賽局的較劣均衡不是囚徒困境,請你後面的人來回答一下。 學生:沒有人活受罪,但也沒有人獲得收益 教授:或許結果也沒那麼糟。你說得很對,我可以把結果編得更糟糕的,我可以讓收益降到非常低,還有別的理由嗎?你後面的那位女士。 學生:因為這裡沒有嚴格劣勢策略 教授:在囚徒困境中選α永遠是最佳對策,之所以在囚徒困境中會得到較劣結果,是因為保守策略、非合作策略。不打掃房間的策略α總是最佳的策略,這個賽局裡的較好較道德的做法是選擇投資,但這不等同於說不投資優於投資。實際上,如果所有人都投資你也應該投資,沒錯吧?這是個社會問題,但這可不是社會問題的囚徒困境。那這是一種什麼樣的社會問題呢?請你前面的同學回答。 學生:這可能是一種合作問題 教授:沒錯,如果人們合作結果會更好,但我們來換一個說法,我們用第一天講到的術語-協調。這是一個協調賽局,為了使那些紐約客的讀者習慣,我在讀O的時候變音了,為什麼說這是一個協調賽局?因為我們希望教室裡的每一個同學透過協調都選擇投資,實際上,如果協調成功就會皆大歡喜,而且沒有人會變卦,這樣我們就達成了一個均衡。然而,不幸的是,我們總是協調失敗。要麼大家都不投資,要麼和第一講一樣,大家存在分歧,使有人要蒙受損失。 我認為這種情況在社會上並不少見,現實生活中有很多協同謬誤。很多事都像協調賽局一樣,而且協調賽局經常導致較劣的結果。所以我們多花點時間來探討一下,因為我認為這對你很重要,不管你是不是經濟學家。好了,我們開始探討吧!哪些情況是協調賽局能導致如下的後果?如協調失敗,或者協調的方向有問題,而最終達成了較劣均衡呢?我們來找幾個案例,後面有人舉手了,請把麥克風遞到後面去-對,就是那裡,感謝,等麥克風到了再大聲說。 學生:在校園裡的派對是一種協調賽局 教授:對,校園派對是一種協調賽局,因為大家需要協調好去一個地點,對嗎?你是這個意思嗎?請繼續說。 學生:是這樣的,如果參加的人不多,那麼參加聚會的人玩得並不快樂。但參加的人很多,大家都會玩得開心。 教授:這是個不錯的想法,派對有兩方面可能出現協同謬誤,一個是參加的人要是不多,沒有意思,因此你也就不想參加;相反,如果參加的人很多,就很有趣,這樣大家就都想參加了。第二點是-這裡也有兩個均衡,大家都參加或者都不參加。同樣,派對的地點-我以為你要說的是這個呢。這也是一個類似的協同謬誤。 在紐黑文曾經有很多酒吧,但現在可能不多見了。曾經在校園附近有很多不同的酒吧,但是你們都不允許去酒吧,但反正事實是,學校周圍有很多酒吧,大家想協調好在週五晚上到酒吧聚會,研究生們通常安排在週四晚上,這些在商業區的酒吧有一家是戲劇學院的據點,另一家是經濟學院的據點,而且他們沒有聚到同一個據點,看來這個還真是個不錯的均衡。你們到了一座陌生的城市,首先要知道哪裡常舉行你喜歡參加的派對。當然你們也可能會協調失敗,大家各玩各的,然後不小心遭到打劫了。還有別的協同謬誤的案例嗎?坐在後面角落的-就是他。 學生:內戰時交戰中的黨派簽協約算不算? 教授:這也可以算作一個協同謬誤,這在某種意義上和囚徒困境類似,我先解除武裝,然後你也要解除武裝,這算一個吧!這也是一個協同謬誤,但這個也有些囚徒困境的意味。很好,繼續說,還有其他例子嗎?那位同學-就在你周圍,就是門旁邊的,對,就是他。 學生:在大型體育賽事中,人們在考慮到底給哪個隊伍呐喊助威。 教授:我不知道這是個較優結果還是較劣結果,這就是傳說中的揮手致意吧!既然美國人堅持揮手致意,我猜他們認為那是個較優結果,對嗎?還有其他的案例嗎? 學生:性別之戰 教授:我們以後再來考慮這個問題,先保留這個想法,下一講我們再來討論。你說的是個不錯的案例,下一講再討論,還有其他的嗎?那我們再深入研究一下會面地點吧!我們討論過在酒吧碰面或者在派對碰面,但就是沒說過網站。比如那些聊天網站或者交友網站,這些網站和派對的作用其實是差不多的。你希望大家都協調好去同一個網站,那有沒有經濟學裡的案例呢?誰能想到一個經濟學的案例?除會面地點以外,還有沒有別的外部效應? 學生:我覺得除了剛才他們說過的,報紙之類的應該是相關的案例吧!可能我們都只需要一個全球新聞網就夠了。 教授:有趣的想法,而且兩面還都說得通。只有一份報紙的壞處是顯而易見的,但從另一個方面來看,當午餐後大家坐在一起討論時,這倒是能讓大家找到聊到一起的話題。當然了,看電視劇也有從眾效應的。如果所有美國人都看同一部電視劇,比如說這幾天大紅大紫的美國偶像,那你們共進午餐時就有聊天的話題了。不過請注意,這可不是什麼好協調的,美國偶像這樣的例子多得很。我小時候在英格蘭生活時-看來我又要暴露自己的年齡了。那時候大家都想成為潮人,那你就要穿喇叭褲,喇叭褲可是每個潮人的必備,這是一個多麼可怕的潮流啊!你們要是不信在英國也有這麼滑稽的潮流,那你們回想一下,是不是在美國也有過這樣滑稽可笑的潮流呢?你要是還不相信,想想美國中西部,我可什麼都沒說,把這段剪掉別播出啊!還有別的案例嗎?請這位先生說說你的想法。 學生:比如微軟壟斷的形成過程。每個軟體都和微軟的系統相容,所以以後就有更多的人用了。 教授:好想法,我忘了你叫什麼了? 學生:斯蒂文 教授:斯蒂文的意思是,一種軟體可能會帶來循環效應,越多的人使用微軟的軟體產品,我使用微軟產品的優勢就更明顯。我可以安裝不同的程式,我可以跟合夥人交換檔案,可以協調達成使用不同軟體的各種均衡,當然你也可能達成了較劣的均衡。很多人對此頗有微詞,但我保持中立。很多人都認為微軟的產品不是最好的選擇,這樣的連帶產品多得很,這些都屬於連帶外部效應。比如我們舉高畫質電視這個例子,我們需要制定一個統一的技術標準,這樣大家都會遵循此標準,因為如此,大家都可以生產符合標準的電視及周邊產品了。當然,每家公司都希望自己的產品標準成為行業的通用標準,我們同樣可能會選擇不合理的標準,或者說達成了較劣的均衡。那政壇選舉呢?在政治領域,尤其是初選的時候,無論是民主黨還是共和黨,初選時集中投票給一個候選人大有益處,因為這樣能夠加快黨內選舉,而且顯得黨內意見很統一。對此我同樣表示中立,但這樣可能會導致不合適的候選人勝出,這就是政治上的潮流效應。誰贏了新罕布夏和愛荷華誰就獲勝了,這也是一個案例。還有別的經濟學案例嗎?請那個小夥子來回答。 學生:證券交易所 教授:具體說是掛牌交易的證券交易所。在一家大型證券交易所裡,有大量的證券交易是很有優勢的,這樣可以分攤固定成本。當然這也考慮到了流動性和其他的問題,但主要考慮的還是固定成本的問題。趨勢是,最後會只有一家證券交易所,我們現在還沒有到這一步,但這只是時間的問題了。可是這未必是家有實力的證券交易所,或者會導致該交易所獲得壟斷力量。我再舉幾個例子吧!比如說銀行擠兌的案例,什麼是銀行擠兌?誰來回答一下? 學生:銀行擠兌就是公眾們對於銀行失去信任,擔心自己存在銀行資金的安全,蜂擁而至去提款。 教授:我們可以很自然地把銀行看成是有兩種均衡的,較優均衡是大家對銀行抱有信心,紛紛把錢存到銀行裡去,然後銀行就可以把其中一部分資金以更高的利率貸出去-銀行可不喜歡把錢都鎖在金庫裡面,他們希望把錢貸出去收利息。對於每個人來說,這是一個較優均衡。 但是如果人們對銀行失去了信心,開始瘋狂的提款時,銀行金庫沒有足夠的現金來兌現,這樣銀行就要關門了。我以前總在課堂上講,你們誰也沒見過銀行擠兌是什麼樣的,因為差不多30年代中期以後再沒發生過,這在19世紀30年代以前的美國經常發生,但自從聯邦存款保障體系建立後,這種情況基本就沒發生過了,不過我可不敢保證以後也不會發生,因為現在就有一樁銀行擠兌事件。 我說的銀行擠兌發生在英國,有一家叫北岩銀行的金融機構就被擠兌破產了,不信你回去看昨天的紐約時報,就會看見報導說,在這家銀行的倫敦支行門外,人們排起長隊蜂擁而至來提款,英格蘭銀行試圖干預並恢復人們的信心。但請注意,這可不是那麼簡單的,這不是抵押貸款危機那麼簡單。這家銀行的確有抵押貸款業務,但並不是由於抵押貸款業務經營不善而引起了公眾的注意。實際上就是公眾對這家銀行信心不足。較優均衡下,人人都來存款;較劣均衡下,大家就都來提款。在美國電影裡也講過銀行擠兌,在哪部電影裡面講過銀行擠兌呢? 學生:是在《風雲人物》裡面講過 教授:當然在《歡樂滿人間》裡面也講過,但你說《風雲人物》也沒錯,有多少人看過《風雲人物》?誰看過《風雲人物》這部電影?我看看大概多少人沒看過,先不要放下手。大家請記住,如果你持有綠卡,快去看《風雲人物》,不然會被吊銷的。《風雲人物》裡面的銀行擠兌案例,其實說的只不過是存款取款的事兒,但無所謂了,就把它當做一家銀行吧。所幸的是,電影裡面的銀行沒有倒閉,為什麼《風雲人物》裡面的銀行沒有倒閉?為什麼它沒有倒閉呢?穿綠衣服的小夥子你來回答,請把麥克風遞給他好嗎? 學生:大家達成一致,只取出日常開支,不要取出全部的存款。 教授:有些人可能沒聽見,我來重複一下。人們達成一致,只取出小額的生活開支,有的甚至不取了,銀行擠兌就結束了。人們後來發現銀行不會破產,他們就又把錢都存到銀行裡了。人們確實達成一致了,是什麼原因讓人們恢復信心了呢?這多虧了詹姆斯·史都華的功勞,大家還記得這部電影吧?詹姆斯·史都華站出來,做了一個演說,他可能不會像我這麼跟大家解釋,但是如果他學過這門課,他就會這麼說-他會說這裡有兩個均衡。我不會學賓夕法尼亞州西部人的口音,但反正這裡有兩個均衡,大家都提款的均衡是較劣的均衡,最後會導致大家一無所有;大家仍然把錢存在銀行是較優均衡,這對每個人來說是較優的,所以我們還是把錢存到銀行吧!我覺得他說得應該比我說得更鼓舞人心,最後大家還是又把錢存進銀行了。 那我隨便來叫一名同學提問,看看是不是大家都聽明白了。這裡面存在兩個均衡,一個較優另一個較劣。我們再來進行一次這個賽局,我們再做出自己的選擇,但開始之前,我先把麥克風給派翠克,給他五秒鐘來說服各位投資,請起立吧!派翠克將用五秒鐘的時間,用他的方法說服大家來投資。 學生:很顯然,如果我們都投資,就會有所回報,所以請大家都投資吧! 教授:那好,我們看看是否起到了效果,我們看看接下來結果會怎樣?選擇投資的同學請舉手?選擇不投資的請舉手?我們差不多成功了,我們差不多說服了所有人來投資,那這到底是怎麼回事呢?請大家再給派翠克一點掌聲,他做得很棒。從中我們可以總結出一條結論,結論就是這個賽局本身並沒有改變,這個就是我們進行了三次的賽局,而且這是我們第四次進行了,但是這次大家的選擇卻和以前不同,絕大多數的人,應該是超過90%的人都選擇了投資,看來派翠克的演說起到了作用。只不過派翠克並沒有出資,沒有賄賂你們,也沒有簽合同,也沒有威脅說要打斷你們的腿。他只是說這樣做是明智的做法。讓我們回憶一下囚徒困境。如果在囚徒困境中,派翠克跟大家說,在囚徒困境裡面,如果我們都選β,要比選α更好-差不多就是這樣的說法。你們處於囚徒困境中會怎麼做?你們還是會選擇α。派翠克想要說服大家,他想跟大家溝通,並告訴大家,在囚徒困境裡選β會更好,但這毫無效果。還沒下課呢!但溝通在這裡卻有效。為什麼?這個賽局裡派翠克能說服大家,但在囚徒困境裡卻不行呢?請把麥克風給凱特好嗎?為什麼此賽局中他能說服大家,而之前不行? 學生:因為他並沒有勸大家選嚴格劣勢策略 教授:因為他並沒有勸大家選嚴格劣勢策略。除此以外,他想讓大家怎麼樣?想讓大家達成納許均衡,從中又可以總結出一條結論。協同謬誤和囚徒困境不同,它和囚徒困境不一樣。僅透過溝通而非簽署合同就可以改善結果。具體說,我們可以說服大家共同去達成另外一個納許均衡,這就又為達成納許均衡提供了合理的動機。想要化解囚徒困境就必須簽署合同,需要單邊轉移支付,我們必須改變賽局的收益,但納許均衡是自我實施的協約,納許均衡本身就有強制力。這個賽局裡,我們大家都選擇投資,我們確實不需要單邊轉移支付,不用威脅別人,也不同簽署合同,更不需要訴諸法律。我感覺派翠克也沒有那麼暴力,我們最後會做出正確的選擇,因為這符合自身的利益。協同謬誤在現實中並不少見,小到銀行擠兌,大到市場泡沫,甚至還有中西部的時尚。總之包羅萬象,溝通能夠起到很大的作用,我們下週一再來繼續學習。 2007年9月19日 *****