換位思考

講座二

在講座的開始,我們介紹了遊戲的「組成要素」:參與者,他們的策略和收益。然後回到上堂課的主要結論:不要採取劣勢策略,並且要換位思考。首先,我們將這些運用在對抗漢尼拔將軍以捍衛羅馬帝國;然後運用在上堂課遊戲中所選擇的一個數字。我們學習到,當你以他人的立場換位思考時,你不僅應該考慮他們的目標,也應該考慮他們有多老練,(他們是理性的嗎?),以及他們對你的瞭解多少(他們知道你是理性的嗎?)。我們介紹了一個新...

講座二:換位思考

    Ben Polak 教授:上節課我們做了這樣一個遊戲,大家透過選擇α和β來確定各自的成績,這個表格列出了可能的結果,具體說就是你和對手分別得什麼成績。比如說你選了β而你的對手選了α,你會得到C而你的對手會得到A。 有一點需要強調一下,這還不能稱之為賽局,它缺少了一些東西。這個遊戲有不同的結果,我們用結果矩陣來表示,但它不是一個賽局,因為我們必須知道收益才能進行賽局。後來我們分析了可能的收益,現在它變成一個賽局了。用專業術語來說,這個賽局屬於標準式的賽局,在這裡,我們假設這些收益是那些只關注自己成績的人的收益,我覺得你們很多人就是這樣,但坐在那邊的先生不是這樣,但對很多人就是這樣。 我們指出,此賽局中α嚴格優於β,這是什麼意思呢?我們說如果這是你的收益,那麼不論你的對手選什麼,你選擇α總會比選擇β得到更好的收益。在繼續講下面的內容之前。我們先來回顧一下上節課的結論。其中的一個結論是,不要採用嚴格劣勢策略,大家都記得這個結論吧?在這之後,我們透過研究更複雜的收益,以及更複雜的賽局,我們得出了另外一個結論;站在別人的立場去思考他們會怎麼做。 實際上,我們從中學到的是,不僅你自己的收益很重要,這當然很重要,但別人的收益也同樣重要,因為你要儘量想到別人會怎麼做,然後做出恰當的回應。我們今天繼續探討這兩個結論,今天這兩個結論還會再出現。今天所講的很多內容會很抽象,但我想要提醒大家,賽局理論與現實世界是緊密聯繫的。 其次,好心提醒一下大家,這個賽局被稱為囚徒困境,我寫在那裡了,囚徒困境。注意一下,囚徒是複數形式,上節課我們列舉了幾個例子,讓我再次重申並強調一下,我們會涉及到更多的案例,這樣你筆記內容就會更豐富了。比如說你和別人要進行一個合作專案,可能是家庭作業,或者像他們正在進行的視頻採集專案,它能變成一個囚徒困境。為什麼呢?因為大家都想偷懶。價格競爭,兩家互相打價格戰的企業可能會陷入囚徒困境。為什麼?因為不管你對手怎麼定價,你總有想削弱他們的動機,如果雙方都採取這種策略,那麼價格將會下降到邊際成本,行業利潤將會遭受損失。 在第一個案例中,如果大家都偷懶,成果會糟得不堪設想。在第二個案例中,如果兩家企業互相削弱,最終會壓低價格,這對消費者有利,但對企業不利。讓我來舉第三個例子。假如這裡有一個可利用的公共資源,比如是個魚群,或者是新鮮的空氣,這其中也會導致囚徒困境。你有過量捕魚的動機,為什麼呢?因為如果其他國家擁有這個魚群,假設這個魚群在大西洋,如果其他國家打算正常捕撈,你應該也會正常捕撈。如果其他國家不打算減少捕撈量,那麼你現在就想先把魚都撈起來,因為沒準明天就會無魚可撈了。 下一個囚徒困境的案例,是全球暖化和碳排放量問題。拋開科學層面來說,我相信在座的一些同學比我知道的還多。碳排放問題也是個囚徒困境。通常我們每個人都有排碳的動機,如果大家都想減排,我沒必要跟風。如果別人真的減排了又與我何干?我照樣用著熱水,開著大排量汽車。這些情況都導致了糟糕的結果。所以這點在社會層面上很重要。這不僅僅是耶魯課堂上的抽象概念,從上課一開始,我們就應該開始思考這些問題解決方案,現在我們已經談論了一些了。需要指出,這不僅僅是溝通失敗,溝通本身並不能化解囚徒困境。你可以在減排問題上一直高談闊論,但當你回家時,你仍然會開著你的悍馬,每天洗十六次熱水澡,我們依然在大量排碳。 你大談特談你在多麼努力地做家庭作業,但是回家後如果你依舊偷懶,這還是無濟於事。實際上,如果其他人正在努力工作,或者正在儘量減少碳排量,你總會有想偷懶的動機,或者總是繼續大量排碳。我們需要跳出這個思維定勢,我們可以考慮制定協約,我們可以考慮各國之間簽訂協約,我們可以考慮制定規章制度,只要改變收益,這些方法都有效。這不是說說而已,但它確實改變了結果。改變了收益,也改變了動機。另一個重要的東西是,我們可以考慮把單次賽局轉化成重複賽局,然後看看是否有效。我們以後再來學習這部分內容。 還有一種方法,但我們必須慎用,就是透過教育來改變收益。我認為這就像毛澤東思想的理論似的,把人們鎖到教室裡教育他們要做個好人,這似乎無濟於事,我對此也並不樂觀,但至少我們得承認,它改變了收益。 就先回顧到這裡吧!我們繼續講課。上節課我們還有一個問題還沒搞定,我們在上節課最後做了一個遊戲,你們每個人都選了一個數字,你們所有的人都選擇了一個數字,選擇的數字最接近全班平均數的三分之二的人就是贏家。現在我們已經知道誰是贏家了。我知道你們都想知道自己是不是贏家,對嗎?我留下個懸念,我會告訴你們誰是贏家,我們已經算好了,我會告訴你們的。但我們得先幹點事,我先在這裡留下懸念,以防那些只想著贏的人蹺課走了。 我們在課上會經常透過遊戲學習賽局,我們還會舉行隨堂討論等等,但是我們也需要花費一些時間來慢慢研究一些問題。接下來的二十多分鐘就是這樣的,抱歉接下來的二十多鐘分可能有點枯燥,我們來做點正經事,就是我希望大家都夠理解,賽局的要素有哪些。具體來說,我們需要搞清楚怎麼樣才能形成賽局。 賽局由以下要素組成;參與人,首先我們得規定一下表述法,就是參與人的表述法。我們用小寫i和小寫j來表示吧!在那個數字遊戲中,你們每個人都寫下了一個數字,然後在下課前交了上來,誰是參與人呢?你們就是參與人。我的意思是說,你們都是參與人。在數字遊戲中,每位同學都是參與人。我再強調下,你們都是參與人。 賽局的第二個要素是策略,良心的建議,請大家和我一起記筆記,策略;表述法,我們用小寫si來表示參與人i的某個策略。例如他在那個遊戲裡選擇了數字13,大家都聽明白了吧?我們需要把這個特定的策略,和參與人i的可能策略集合區別開來。我們用大寫的Si來表示什麼?來表示策略集合,即參與人i的所有可能策略的集合。上節課我們最後做的遊戲,策略的集合是什麼樣的呢?這個集合由1、2、3,一直到100組成。 當需要表示策略集合中的一個特定策略時,說到這,我們來定義第三個標記符號。我們用不帶下標的小寫s來表示某一次賽局,這是什麼意思呢?上節課大家都交上來了一個數字,所以每個人都有對應的數字,這就是每個人都有一個策略。我手裡的是我收上來的策略集合,這些就是你們上節課交上來的表單,這就是一次特定的賽局。 我有你們每個人的名字和所選數字,即每個人的策略,我們還製作了一張試算表,所有資訊都收錄到了試算表中,你們每個人的名字和所選數都在這裡,這就是一次賽局。給它起個名字,我們稱它為一個策略組合,你會看到有的課本中稱它為策略組合,策略向量或者策略列表,這無關緊要,它表示每個參與人都有一個對應的策略。 這就是數字遊戲的試算表,或者說這是其試算表的一個樣本。我需要把這塊黑板拉下來,以便你們還能夠看到,讓我擦一下黑板,你可能覺得我們搞定了,對嗎?我們有參與人,我們有他們可能選擇的策略,就是策略集合,我們有每個人的策略,我們還有他們每個人已經選擇的策略,即策略組合,看起來我們好像得到了進行一次賽局所需的所有的要素。 我們少了什麼?大聲喊出來。我們缺少收益。為了使它成為賽局,我們需要收益。我們用符號來表示收益。在本課中,我用符號U來表示參與人的收益,Ui取決於參與人1的策略,這些都是影響參與人I收益的因素,一直到參與人N的策略。參與人i的收益Ui由所有參與人的策略決定,當然也包括她自己的策略,簡寫應該是Ui(s),它由策略組合決定。 那麼,在數字遊戲中它是怎樣的呢?在數字賽局中Ui(s)代表這兩件事,如果你贏了就是五美元減去你的誤差,我覺得也有可能是平局,這點暫時先不去考慮,除此以外就是一無所獲。現在這個賽局的所有要素都有了,參與人、策略和收益。現在我們不妨作一個假設,這個假設在接下來的十多周都要用到,差不多是整個課程都要用到。我們假設這些都是已知的,我們假設每個人都知道其他人可能選擇的策略,每個人都知道其他人的收益,這不是一個很符合實際的假設,在期末的時候我們再來推翻這個假設,但是就這個假設下的內容,就足夠我們接下來的十個星期學的了。 我需要再引入一個符號,之後我們再繼續研究。s-i是什麼意思呢?它表示除了i外其參與人的策略,這個符號是我們會經常用到的。它表示除i外其他參與人每人的策略,具體來說,如果你是參與人1,那麼si-可能表示s2、s3、s4,直到sn,但是不包括s1。這個表述法有用,為什麼?因為有時候,考慮在i和對手在不同選擇下的收益是很有必要的,這是一個有效的思路。 現在我們暫停一下,根據之前的教學經驗,我知道有些人有數學恐懼症,如果你有數學恐懼症你不必舉手示意,既然有人是,那麼讓我們深呼吸一下,在家看視頻的數學恐懼症患者也一起做,現在大家不那麼緊張了吧?你今天坐在這,你知道一切都會好起來的。現在我將會在黑板上寫一些數學運算,深呼吸,這沒有你想像的那麼難,我只不過寫下了一些符號,這裡不會有數學運算,我只是在寫符號。 我不希望你們因為對數學,或是數學符號的恐懼而放棄這門課。所以如果你是因為懼怕數學,而可能會選擇放棄這門課,歡迎來找我和助教傾訴,我們會幫你搞定的。數學恐懼症沒什麼大不了的,我害怕很多東西,不一定是數學,也可能是各種各樣的事物。很多人面對符號往往都望而卻步,看起來它比這個更可怕。而在這裡,其實僅僅是符號而已,我們舉個例子來幫助理解。 稍等一下,讓我來擦下黑板,讓我來舉一些例子,來幫助那些對這些符號感到困惑的同學。我們來簡單地看一下下面這個賽局。此賽局有兩個參與人,分別為I和II,參與人I有兩個選擇,上和下;參與人II有三個選擇,左中右,這是一個很簡單的抽象案例,讓我們設想收益是這樣分配的。它們不是特別有趣,它就是一個為了解釋用的例子,收益是這樣的,(5, -1), (11, 3), (0, 0), (6, 4), (0, 2), (2, 0).。 讓我們來看一下這個賽局中的符號。首先,誰是參與人?沒什麼好解釋的,參與人是,讓我們把它寫在這吧!這次賽局中有兩個參與人,I和II,那麼策略集合是怎樣的呢?這是參與人I的策略集合,她有上下兩種選擇,用橫排來表示,即上下兩排。參與人II有三種選擇,這個賽局不是對稱的,所以他們可選策略數量不同,這無所謂。參與人II有三種選擇,左中右,用矩陣的左中右三列來表示。 順便說一下,到目前為止,我們所學的大部分是對稱賽局,但注意此賽局的策略與收益是非對稱的。賽局未必都是對稱的,收益,這也不是天書,沒那麼可怕的,我們隨便寫個收益吧!參與人I的收益,如果她選上,參與人II選中,我們來看一下上行和中列。參與人I對應第一個收益,即11,在這種情況下,參與人II的收益,即參與人I 選上參與人II選中時,注意下是上行和中列,但是現在我們要找參與人II的收益,也就是第二個收益,即3。 我相信有數學恐懼症的現在好多了吧!下面來看看這次賽局是如何進行的。這不是一次特別有趣的賽局,既然說到這裡了,不妨多討論一點,我們的麥克風準備好了沒?大家認為這個賽局會如何進行下去?我們隨便找個同學來回答一下,艾爾,那個穿藍襯衫的男孩,參與者I有劣勢策略嗎? 學生:不,參與者I沒有劣勢策略。例如,參與者II選擇左,參與者I會選擇下;但是若參與者II選擇中,參與者I會選擇中。 教授:好,太棒了,非常好,你應該站起來回答問題的,我忘記說了,不過沒關係,這位同學解釋的很清楚,謝謝。同學們都聽清楚了嗎?都聽懂了嗎?後面的同學聽見了嗎?這樣聲音還是太小,所以我希望之前的同學的解釋清晰正確,但以後請大家站起來大聲點說,否則後面的聽不到。你的名字是? 學生:派翠克 教授:派翠克剛所說的是,參與者I沒有劣勢策略。在左列下,選上比選下…我說錯了,在左列下選下比選上要好,因為6大於5。但在中列下,選上比選下好,因為11大於0,大家聽懂了嗎?也就是說選擇上並不總是最優的,上並不總是優於下,或者下並不總是優於上。這次舉手回答,參與者II呢?參與者II有劣勢策略嗎?你們都果斷得把手放下來怕被拍到嗎?艾爾,穿白衣服的小夥子站起來等著艾爾走過去,並且大聲地告訴我們答案。 學生:我認為參與者II選擇右是劣勢策略。因為如果參與者I選擇上,那麼參與者II會選中,並且如果-我弄混了,在我草稿上不是這樣的,但是右絕不是最優策略。 教授:很好,我們認真一點,你叫什麼? 學生:湯瑪斯 教授:湯瑪斯所說的是對的。但這的確與劣勢策略的定義不太相符,湯瑪斯所說右並非總是最優策略,這是對的。想要成為劣勢策略還要滿足別的條件,即需要參與人II存永遠占優勢的策略,這個例子可以證明。我們來看看。 在這次賽局中,我說中優於右,我們看看,如果參與者I選擇上,選中的收益是3,選右的收益為0,3大於0。如果參與者I選擇下,選中的收益是2,選右的收益是0,2大於0。所以這個賽局中,中嚴格優於右,你剛才說的是對的。但我想要得到與優勢有關的回答,從中我們得出參與者II不應該選右,目前為止,這些就是我們透過此賽局得到的全部與優勢有關資訊了。然而,我們來再深究一下。 上節課我給出了嚴格優勢的定義,並且講義中也有。順便說下,講義可以在網上看到,但是現在我們用這些符號,來重新作一下優勢策略的定義。定義是:參與者i的策略s'i,嚴格劣於參與者i的另一個策略si。現在我們要使用符號了。在其他參與人選擇s-i時,選擇si的收益UI(si)嚴格優於此情況下選s'i的收益UI(s'i)。最重要的一點是,對所有s-i均成立。 用文字來描述就是,參與人i的策略s'i嚴格劣於si,如果si總是更好的選擇,即總能給參與人i帶來更高的收益,而無論其他參與人怎麼選。這個定義和我們上次講的是一致的,只不過使用了些符號使它變得有點枯燥。大家都談符號色變,你們像被前照燈照到的小鹿那樣亂竄嗎?沒有,我看大家很冷靜。 那我們再來看另外一個案例。你們記完筆記了嗎?我要換黑板了。好的,這是一個更有趣的例子,想像一下這樣的例子。一個侵略者打算入侵一個國家,有兩條路,想像成兩個關口也行,侵略者必須透過一個才能進入。你是國家的防禦者,你必須決定在哪個進入關口,或者在哪條進軍路線上佈置你的防線。問題是,你只能防守二者之一。 現實世界也有這樣的例子。大概在西元前三世紀,如果我說錯了請大家來糾正,我記得是西元前三世紀,當時漢尼拔想翻越阿爾卑斯山,我說的不是漢尼拔·萊格,而是西元前三世紀的漢尼拔將軍,那個騎大象的漢尼拔將軍。好了,這裡的關鍵問題是,有兩條路,一條路崎嶇,需要翻越阿爾卑斯山,另一條路平坦,只需沿著海岸線走。如果侵略者選擇崎嶇的路,僅在穿越阿爾卑斯山的途中,他就要損失一個營的兵力,這就是選崎嶇之路的代價。如果他碰巧遇到了你設防的途徑,無論崎嶇之途還是平坦之途,他還要再損失一個營的兵力。 我還沒有說完,我給出了大致的選擇,入侵者選擇從哪個途徑入侵,而防衛者選擇在哪裡設防。但我們需要搞清收益後才能分析此賽局。這個賽局的收益是這樣的:這是一個簡單的二對二的賽局,這個是入侵者,即漢尼拔將軍,這個是防守者,我忘了哪位將軍是防守者,最好有人來告訴我。你要選擇兩條途徑中的一條設防,平坦之途的或崎嶇之途。同樣他也有兩條路入侵途徑,平坦之途和崎嶇之途。強調一下,平坦之途不用翻山越嶺,我們說的不是新澤西收費公路。 收益如下,我簡單來解釋一下入侵者的收益,是他攻入你國家時還剩餘多少兵力。他只有兩個營的兵力,而你的收益是入侵者損失多少兵力。舉個例子吧!如果入侵者與你在崎嶇之途上狹路相逢,他在翻越山嶺時損失一營,與你交戰再損失一營,那麼他全軍覆沒而你得到一場完勝。相反,如果他選擇崎嶇之途,而你卻防守平坦之路,那麼他僅僅損失一個營的兵力,他還留有一個營的兵力。他的確在翻山越嶺時損失一營,但是他只會損失一個營,因為你選擇了在錯誤的途徑設防。 大家明白了這個賽局的收益吧?現在想像自己是一位羅馬將軍,發揮你的想像力,想像你是一位羅馬將軍,我們來看看你應該怎麼辦。你是防守者,那麼你應該在哪設防呢?大家舉手表決,有多少人選擇防守平坦之途的?請舉手,讓裘德可以拍到你,先別放下手,再舉一小會,揮一下手,應該給你們弄桿軍旗來才對。這些都是鎮守平坦之途的羅馬士兵。那麼有多少人選擇防守崎嶇之途?我發現有很多同學不想成為羅馬將軍啊! 再來一次,不能棄權,準備好了嗎?即使你答錯我也不會為難你。那麼多少人選擇防守平坦的之途?再次舉起手來。有多少人選擇防守崎嶇之途?大多數人選擇平坦的路,絕大多數。接下來我們看看,防守平坦之途是否優於防守崎嶇之途呢?是這樣嗎?防守平坦之途是否,到底是不是優於防守崎嶇之途呢?你可以大聲喊出來,不,不是這樣。 我們來分析一下。如果入侵者選擇平坦之途,毫無疑問,如果你選平坦之途要比崎嶇之途更好,1比0。但如果入侵者選擇崎嶇之途,仍然是毫無疑問,這不是一個合理的答案。防守平坦之途並非優於防守崎嶇之途,你只是想剛好截擊到入侵者,然而大多數人都選擇防守平坦之途了。為什麼呢?有人知道原因嗎?把麥克風準備好,能不能到那邊的留鬍子的小夥子來說一下。請稍等片刻,等麥克風過去,你站起來大聲說出來吧,開始吧! 學生:因為你想使入侵羅馬的敵軍兵力最小化 教授:你想最小化入侵羅馬的兵力,沒錯,但是我們剛才說這裡沒有優勢策略,平坦之途並不總是優於崎嶇之途,還有其他原因嗎?我看到你舉手了,請那位坐在中間舉手的小夥子說說吧!還是一樣,請起立對著麥克大聲講,臉面向麥克風,好的。 學生:雖然看起來你好像沒有優勢策略,但似乎漢尼拔將軍最好的選擇是,他應該會選擇從平坦之途入侵。 教授:好的,為什麼似乎是這樣的呢?很好,我們要步入正軌了。為什麼他應該會選擇從平坦之途入侵? 學生:如果你沒有在平坦之途設防,他兵力不減。然而如果他從崎嶇之途進軍,那麼他將至少損失一個營。 教授:我們回頭看一下,來回顧一下想想我在剛上課時說的教訓。我們應該站在漢尼拔的立場來看問題,管他穿的是鞋子還是靴子呢?不管你是騎著大象也好,還是穿著別的也罷,我們應該從漢尼拔的立場來看待問題,並且試著推測漢尼拔會怎麼做。站在漢尼拔的立場,他應該不知道你會防守哪條路,但讓我們看看他的收益。 如果你們都選擇的是平坦之途,那麼他攻入你的國家時他只剩一個營,這與他選擇崎嶇之途別無二致。那麼如果你防守平坦的路,從他的立場出發,無論怎麼選擇,選崎嶇之途收益是1,而選擇平坦之途的收益也是1。但是如果你選擇防守崎嶇之途,即你要低於高山巨嶺,而他卻選擇的是平坦之途,他將兵力全存。而要是選崎嶇之途,他將全軍覆沒,這樣來看,選擇平坦之途要好些。 我們要更嚴謹一些。對漢尼拔而言,選擇平坦之途入侵並不是嚴格優於選擇崎嶇之途的,但是在這種情況下有一個弱優勢,對入侵者來說,我們再引入術語,對入侵者而言,平坦之途弱優於崎嶇之途。我所說的弱優於是什麼意思?它意味著選擇平坦之途較選擇崎嶇之途而言,至少要同樣的好,可能還稍微好些。 這裡我們給出第二個定義,也是今天的一個新定義,我們再一次用到術語。定義是,參與者i的策略s'i弱劣於其他策略si,下面我們會發現用符號的好處了。在對手選s-i的情況下,參與人i選擇si的收益,等於對手選s-i下她選s'i的收益,而且在任何情況下此條件均成立。除此之外,對手選s-i參與者i的策略si,嚴格優於其他策略s’i,至少在某種情況成立。 驗證一下,這和我們之前選擇平坦之途還是崎嶇之途是對應的。重申一下,參與者i的策略s'i弱劣於策略si,無論對手怎麼做,她選擇si的收益至少與選s'i的相等,有些情況下甚至是嚴格佔優的。這似乎是一節相當重要的課,我們說過,不要採用嚴格劣勢策略,你也不應該採用弱劣勢策略,不過這個更嚴密一些罷了。 對於這個定義,如果你還有些疑問,而且你想看用文字表述的,在講義中有,我已經上傳到網上了。裡面有第一節課的總結,也有這個定義的文字形式,不妨去對比一下這個定義的文字表述與黑板上的符號表述。好了,既然我們認為入侵者漢尼拔不會選擇弱劣勢策略,我們認為漢尼拔不會選擇崎嶇之途,他會選擇從平坦之途入侵,這種情況下,我們又該如何設防呢?我們應該防守平坦之途,大多數人都這麼選。 坦白地講,這是你們的理由嗎?有可能是,我們能理解這些道理。那麼我們從漢尼拔的角度來考慮一下。我們發現崎嶇之途是弱劣勢策略,他會選擇平坦之途,我們應該在此設防。然而事實上,漢尼拔選擇的是翻山越嶺,這有點和這個結論相悖,但這也沒有辦法了。 好吧,我承諾過會講上節課的數字遊戲,我們到現在講了很多了。上節課我們學到了,不要採用劣勢策略。然後今天我們學到了,我們有時可能不會選擇弱劣勢策略。我們還學會了站在別人立場上思考,然後推測出他們不會選擇嚴格劣勢策略或弱劣勢策略。這似乎是預測別人選擇策略的一個不錯的方法,那麼我們帶著這些方法,回到上次的數字遊戲中。 在家看視頻的人不必關心這個。上節課你們多少人來了?多少沒來?我問得有問題,上節課有多少人沒來啊?那我們再說一下那個數字遊戲吧!再來介紹一下這個數字遊戲。但是以防萬一,我來介紹下遊戲規則,那個遊戲是這樣的。 在不被你同桌看到的情況下,在方框裡寫下一個介於1到100之間的數字,我們將計算,實際上已經計算完了,班裡同學所寫數字的平均數,最接近平均數的三分之二的人,是這個遊戲的贏家。獎金是五美元減去所選值與答案之差。 上節課每位同學所填的數值都在我這兒,揭曉贏家前,我們先分析一下此遊戲,我先走下講臺看看各位,麻煩準備好麥克風。 那讓我看下大家填的是多少。你們坦誠點吧!我有所有的資料,有多少人選了32、33或是34?有一個人舉手了,實際上九個人這麼選的。我需要把名字念出來讓你們尷尬一下嗎?利奈特、魯克森、克裡絲汀、博貞,有九個人,再舉下手示意一下。到底有多少人選了32到34之間的數?很好,這次舉手的人多了,先別放下手,你們為什麼這麼選?把話筒遞給那位同學,你叫什麼名字?能站起來嗎?站起來一下,大點聲。你叫什麼? 學生:克裡斯 教授:克裡斯,你好像在這個名錄裡,也許你不在名錄裡,不要緊,你選了什麼? 學生:我想我選的是30 教授:30,是挺接近的。那你為什麼選擇30? 學生:因為我想每個人都會選45左右的數,因為66約等於一百的2/3,而大家會選比那小的,我就選了更小的數。 教授:謝謝,讓我們再問問另一位同學,這還有一位,選33、34的請再舉下手,坐在這裡的那位同學,你能站起來嗎?你在兩個麥克風之間,就是你,好的,大聲點。首先你叫什麼? 學生:瑞恩 教授:瑞恩,我這兒肯定也有你的數,不要緊,你選了什麼? 學生:我記得是33 教授:33,你的確是選了它,你是瑞恩•洛嗎? 學生:是的 教授:好的,瑞恩·洛,請講。 學生:實際上我的想法和克裡斯的相近,我也在想我們得選平均數的2/3,每個人都在1到100中選擇的話,最後結果可能是33,會接近於平均數的2/3。 教授:我再重複一遍。他剛才說,再提醒一下大家,說的時候大點聲,因為我感覺剛才有些人沒聽清楚,所以我重複一遍,讓大家都聽清楚。選擇33的理由是,如果大家在1到100之間隨機選擇,平均數會是50左右,而50的2/3大概是33,確切地說是33 1/3。這個思路聽起來很有道理,那麼這個思路到底存在什麼問題呢?請那位穿條紋襯衫的女士發言,我們很久沒找女性發言了,這次找個女士來回答吧! 學生:因為即使每個人都像你這麼想,33還是太高了。 教授:就是說如果每個人都像你這麼想,33還是太高了。如果其餘的每個人都那麼想的話,如果每個人都會選擇33或者34,那種情況下,平均數會是多少?抱歉,平均數的2/3會是多少?應該在22左右。 所以克裡斯和瑞恩的說法的漏洞在於,這並不是一個錯誤的說法,這是一個很好的出發點,但其中存在漏洞,其中的漏洞在於第一句話。第一句話是,如果教室裡的人隨機選擇,那平均數會落在50左右,這很對。問題是教室裡的人並不會隨機選擇,看看你們的周圍,看看你們自己,你們有人是亂數生成器嗎?實際上,有些人好像真是,我就不念出名字了,你們中有的人沒準真是亂數生成器。 總的來說,耶魯大學的學生不是亂數生成器,他們想要成為這個遊戲的贏家,所以他們並不大可能隨機選數。繼續分析,如果每個人都這麼想,而且你明白大家都會這麼想的話,那你會預計每個人都會選擇33,而這種情況下你應該選擇22。 你們當中有多少人,舉下手,你們當中有多少人選了21到23的數?絕對不止這麼少,難道要我念出來你們的名字嗎?應該有有十二個人,快舉手,應該有十二隻手舉起來,兩個、三個人舉手了,四個、五個,實際上有十二個人選了22,所以加上選23和21的會更多,我猜你們這些人是按照這個思路選的吧!請選了22的同學發言,這裡有一位,助教能遞話筒給他嗎?你叫什麼名字?請站起來大聲點說。 學生:裡安 教授:你選了22嗎? 學生:我選了22,因為我想大多數人在遊戲中,可能會多次求平均數的2/3,最後會得出30以下的數。 教授:如果你認為大家會按這種方式推理的話,確切地說就是如果你認為大家會依照瑞恩和克裡斯的策略而選擇33的話,22看起來是個不錯的選擇。但是你也低估了你的耶魯校友,事實上,22還是太高了。好吧,我們重申一下這個遊戲的要點,我們再來重申一下吧!這裡的要點是當你在進行遊戲時,你想要推測出其他人的想法,想要推測出他們可能的選擇,假設別人是亂數生成器可不是一個很好的出發點。他們都想贏,他們有自己的策略。 讓我把這張表寫上黑板,那麼這裡有沒有可以直接剔除的策略呢?我已經說了大家並不是隨機選數的,有沒有可以直接剔除的策略呢?我們知道大家不會選擇這些策略,找位同學來回答,綠衣服的你來答吧!請等艾爾過去,好了,請站起來,告訴我你叫什麼? 學生:我是尼克 教授:大點聲讓大家都聽清楚 學生:沒有人會選擇超過50的數 教授:沒有人會選擇超過50的數,好的,這個回答很好,雖然有人那麼選了,但這個回答很好。我本來想得到一個稍微……很好,我本來想得到一個不這麼直接的回答。有人選66了,那我們來分析一下,還有一些人選擇了大於67的數。當然,我們開始說的是66,順便把大於67的數一起分析了吧!選大於67的數有什麼不對的嗎?這樣選錯在哪裡?請舉手回答。錯在哪了?請穿紅上衣的小夥子回答,請起立,說出你的名字,大點聲說。 學生:彼得 教授:好的 學生:如果每人都選100,答案會是67 教授:好的,如果每個人,教室裡的每個人不是隨機選擇數字,而是全選了100,這好像不太可能,但如果每個人真的都選了100,就是最大的數,那平均數,抱歉,平均數的2/3會是66又2/3,此情況下67應該是個不錯的選項,那些選大於67數的人看起來挺傻的了。但他們傻不傻不是我們要關心的問題,那些選擇大於67的數的同學,如選68及以上的人,怎麼來評價呢?我們怎麼評價他們的選擇?找你身後的,你身後的那位女士,請大聲說。 學生:他們這麼做沒有收益 教授:他們沒有收益。用術語怎麼說?我們得用術語來說,哪位能喊出來,術語怎麼說?他們處於劣勢,這些策略是劣勢的。實際上只是弱劣勢,但這麼說也對,他們當然是劣勢的。準確地說,選擇80是劣於選擇67的,選擇67的話你總會獲得較好的收益,至少也是跟選80的收益一樣高,有時候比選80的收益更高,不管別人選擇的是什麼樣的策略,所以這種選擇是劣勢的。從上堂課中,我們學到了不要採用這類策略,他們是劣勢策略。 但還是有人選擇大於67的數,對嗎?我不會把他們的名字念出來,事實上你們當中有四名同學這麼選的,我也不打算讓你們舉手了。好吧,這四位同學,沒事了,你們下次要注意。一旦我們剔除了有人會選擇大於67的數的可能後,68到100之間的數就無關緊要了,就如同這遊戲的可選項只有1到67之間的數字了,是吧?我們知道沒人會選擇68及以上的數,所以可以忽略它們,我們可以剔除那些策略。一旦如此,剩下只有1到67的數。 有誰能幫我總結一下,目前為止我們能得到什麼結論?68到100的選項不存在了,或者說已經被剔除了,那我現在可以得出什麼結論?遞過來一個麥克風好嗎?請站起來等著麥克風,麥克風來了,好的,大點聲。 學生:那這樣45以上的也一樣被剔除了。 教授:很好,你叫- 學生:亨利 教授:亨利說,一旦我們明白了沒人會選大於67的數之後,我們可以再深入一些,如果這些類似策略不存在或者被剔除,那麼相似的策略也會被剔除,即大於45的數會被剔除。這裡我們須要認真一些,對於選擇大於45而小於67的數,我認為他們並不是,在原賽局中並不是劣勢策略。準確的說,我們僅僅論證了,如果教室裡每個人都選擇100,那選擇67會獲勝,所以在那種情況下,選擇45至67之間的數並不是劣勢策略。但一旦我們剔除了原劣勢策略,即選擇67及大於67的數之後,他們才是劣勢策略。 所以這些策略,對於這裡的弱一詞,我們要謹慎對待。這些策略在原賽局中並不是弱劣勢的,可是一旦我們排除掉了68至100的數,他們就成為了劣勢的策略,即弱劣勢策略。至此所有45到67的數也被剔除了。好的,我們看一看,有人選了嗎?請大家踴躍舉手,有誰選了45至67之間的數,或是46至67之間的數?沒人舉手。我知道誰選了,我有統計表的,至少有四名同學,我就不念名字了,但是我下次可能會念。注意有四名同學選擇這樣的策略。 請注意,這裡的不同之處在於,剔除67以上或者68以上的過程,僅僅用到了上堂課所提到的第一個結論,即不要採用劣勢策略。雖然這裡是弱劣勢,但同理,但排除45到67的第二個區間時,還牽涉到了別的內容。你需要從你的同學的角度思考,明白他們也不會選擇67及以上的數。 所以第一個過程是直截了當地。而第二個過程,我從別人的角度思考,發現他們並不會選擇劣勢策略,所以,意識到他們並不會選擇劣勢策略後,我也不應該選擇45至67的數,所以這是個換位思考式的過程。那接下來呢?我們該怎麼辦?請那位留鬍子的同學說一下。把麥克風給他,大聲說出你的名字。 學生:卡特。你就一直重複剛才的過程,最終你會得到1。 教授:我們會這麼做,但還是讓我們先一步步來。現在因為選擇68及以上的數的策略是弱劣勢策略,所以我們已經把它們剔除了,並且我們也排除了有人會選擇46至67之間的數的可能。因為一旦我們剔除原賽局的劣勢策略,這些策略也就變成劣勢策略了。 所以我們知道沒人會選擇大於45的數,就好像46及以上的數都不存在,所以可能被選擇的最大數也就是45,而45的2/3大約是-誰幫我算下?30,對,大概是30。所以可知,選擇30至45之間的數,這樣的策略在原賽局中並不是劣勢的,即使在剔除劣勢策略後,它們也不是劣勢的。但是當我們剔除原賽局中的劣勢策略,以及第一次剔除之後仍處於劣勢的策略後,它們就又繼續成為了劣勢策略。我不打算試著把這段話寫下來,但你們應該記到筆記裡面。 我們簡要寫一下這個結論,我們發現剔除掉30到45之間的策略,不是僅僅憑藉我們自己的收益,不僅僅靠換位思考來推斷出,別人不會採用這些弱勢策略,在別人站在他人的立場上換位思考,並推測他人可能選擇什麼策略時,我們也進一步地換位思考。所以這是一個不斷換位思考式的過程,注意一下這裡的措辭。這是一個換位再換位思考的過程,說明我們也要換來換去思考。 接下來怎麼辦呢?我們已經知道會繼續發生什麼了。既然我們能剔除掉68及以上的數,那我們也能剔除46及以上的數,然後我們就能剔除掉31及以上的數,再往下我們可以繼續剔除,是多少來著?20以上的數,在20到30之間的,而這會是一個三次換位思考的過程。選擇20到30的策略一開始不處於劣勢,在第一次剔除劣勢策略時也不處於劣勢,在第二次剔除勢策略之後也不處於劣勢,但是在第三次剔除劣勢策略之後,就變成劣勢策略了。我想你們明白我的意思了。 那麼最終的結果會是怎麼樣的呢?最後的結果是什麼呢?這個過程會一直持續下去一直到1,直到只剩下1了。我們一直重複這個過程最後就剩1了。注意,一旦我們剔除了劣勢策略,我們已知有四人選擇了在45到67之間的數,但是選擇30到45的有不少,有多少人選了30到45之間數?我敢保證絕對比這些多,我保證,多很多的。實際上選33的人是在這個範圍內選擇的,有很多人選了20至30之間的數,所以我們已經涉及到分佈的問題了。然而我們發現這些策略,會因為某種推理而被剔除。 現在我還不打算告訴你們誰是贏家,我打算進行做一次更抽象的推理,讓我們討論得再深入一點吧!我們來討論下理性對賽局結果的影響,這稍微有點哲學的色彩。如果你是一個理性的參與人,我的意思是說,對於一個賽局中尋求個人收益最大化的參與者,僅僅出於理性,僅僅作為理性參與人,就會剔除大於67的劣勢策略,所以那四位選擇大於67的同學,我雖然不念出來你們的名字,但以後要注意啊! 但是接下來就不僅僅是理性那麼簡單了。還需要什麼呢?這位同學,你可以再說下嗎?再說一次你的名字,抱歉我忘了。 學生:尼克 教授:大點聲說 學生:尼克 教授:好的 學生:你需要假設你對手也是理性的 教授:很好。這也是有點拗口,但他的意思就是,理性的你,知道你的對手也是理性的,接下來呢?我自己已經是理性的了,我也知道對手也是理性的,我還需要知道對手們明白,他們的對手也是理性的。要剔除這個範圍,需要理性因素。可能有些人知道,這一點在最近社會科學界廣受質疑,人是理性的這個假設是否正確。想要剔除這個範圍,我首先得理性,我需要理性的知識,我們記理性為KR。並且我們需要知道別人也是理性的,進一步推理就是,我是理性的,我知道別人是理性的,我知道別人知道大家是理性的,我知道別人知道大家知道,人們是理性的。 說得再具體點,那些選67以上的四位同學,你們犯了個大錯誤。那選擇45到67之間的四個人呢?這四個人應該怎麼評價?選45到60的四位同學,我要說出他們的名字嗎?也許我最好不要這麼做。從他們四位當中我們能總結出什麼?麥克風可能到不了那麼遠,試試看能不能把麥克拿到那,盡可能朝前靠,請大聲點說。 學生:他們認為他們的同學的都很蠢 教授:沒錯。選擇46到67的人,自身並不一定愚蠢,但他們可能認為剩下的人都很蠢。推論到這裡,人們不一定是愚蠢的,不應該認為別人是愚蠢的,只是你們認為他們是愚蠢的,抱歉,是他們認為剩下的人都是愚蠢的。為了使最後的結果到1,需要很多次的知道別人理性到知道別人是理性的推理。 有人知道這叫什麼嗎?如果我們假設有一個無限的,我知道你知道我知道你知道之類的序列,它叫什麼呀!信不信由你,他的術語是,在哲學上叫做共同知識。我不知道拼寫對不對,我看一下。共同知識是指,我知道一件事,你也知道這件事,你知道我知道這件事,我也知道你知道這件事,我知道你知道我知道這件事,以此類推,一個無限的迴圈。 但是如果大家都知道彼此是理性的,那麼最優策略就是1。有多少人選擇了1?我們來看看。環視一下教室,先別放下手,有多少人選了1?事實上你們中有很多人選了1,1是這個問題的最常見的答案,你們中很多人選了1,做的不錯,他們肯定已經他們肯定以為自己贏了。但是他們不是贏家。這個遊戲的最終結果,平均數大概是13又1/3,它的2/3是9,平均值的2/3是9,有人選了9,所以如果你選了9請起立。 以下同學選了9,不是這頁,選9的人的名單在哪?就在某頁上,抱歉,名錄頁碼實在太多了,找到了。以下同學選了9,如果你本人或者你是獲獎者的室友的話,請你們起立。張李星,張李星在嗎?如果在的話請起立。G•克裡斯多夫•貝勒拉,如果在的話站起來一下。威廉姆•菲謝爾在嗎?我不知道他來沒來。傑德•格裡克斯坦在嗎?如果傑德•格裡克斯坦在的話,請站起來。傑佛瑞•格林在的話請站起來。愛麗森•霍伊特在的話請站起來。愛麗森•霍伊特不在。有個叫約翰•羅賓森的,總共就這些人。站好,讓錄影機拍一下你們,每一個都拍一下。揮手,跟螢幕前的老媽打個招呼。我們為這些贏家鼓掌吧! 裘德確實帶來了一張5美元的鈔票,等我去取一下。這是5美元,我要把它撕成9份,但我會為此被捕然後被驅逐出境的。所以待會兒我會想辦法把它換成零錢,待會兒過來拿,你們都有權拿到5美元的九分之一。 為什麼經過一系列的推理,1不是最終的答案呢?為什麼選1不能獲勝啊?我們來問一下之前沒回答過問題的人,麥克風可以到後面嗎?把麥克風拿到你在的那排,看你能不能夠得到,很好,請起立,大聲說出來。 學生:1本該是獲勝的答案- 教授:再大聲一點 學生:如果大家都認為平均數會一直下降到1的話,1應該是最終的答案。但是由於一部分人選擇了,並不是說是錯誤的,但是卻高於平均值的數,就把平均數推高到了13。 教授:沒錯,所以這樣一來,很好,所以這樣一來,謝謝你。要讓平均數到1需要很多條件的,不僅需要你們都是理性的參與人,不僅需要你們知道對方是理性的,而且必須知道所有人都是理性的。我的意思是,我知道你們互相都認識,因為你們都在耶魯大學念書。但你們都那麼熟悉了就會發現,並不是所有的人都是理性的,而且你很確定,並非所有人都知道你是理性,以此類推,需要很多條件才能使最終結果是1。實際上這個遊戲一直都沒有到1。 前幾年的答案比這更高,今年還是比較低的年份。在2003,平均值是18.5;在2004,是21.5;在2005年,我想這個班的同學並不互相信任,因為平均值是23。今年是13又1/3,我認為今年比以前做得好多了。順便提一下,有趣的是,我就是順便提一下,班級中位數也是9,中位數正好也是遊戲的答案。 那麼現在我們再重新玩一次,我們沒有足夠的時間完整的來一遍,雖然我都發完紙了。請你在不被同桌知道的情況下,寫下一個數字,不要和別人討論,這算違規。寫下一個數字,如果你們沒有拿到我發的紙,就寫在你們的筆記本上寫下一個數字,都寫完了嗎?下面請大家來舉手。有多少人,錄影機會轉過來對準你們,多少人選了大於67的數?看樣子班裡面有幾個搗蛋鬼啊!多少人選了大於20的數字?多少人選了大於10的?多少人選了5至10之間的?多少人選了0?抱歉,選1到5的。 除了上次選1的人,多少人選了比你上次選擇的數還低的數字?把手舉一會兒,幾乎所有的人都選的比上一次低。為什麼?為什麼會出現這種情況呢?我猜這次的平均數字大約在3或者4,甚至可能更低。為什麼我們這次選的數字會變小呢?穿綠色衣服的女孩子,很抱歉我沒記住你的名字。 學生:因為我們剛剛上過課,你告訴我們選大數的人是不理性的。 教授:這對了一半。你們都明白了不應該選擇一個較大的數。還有別的原因嗎?我們換個人吧!那個在揮手的人,戴帽子的後面那位,就是你。 學生:因為我們在重複上次的遊戲 教授:沒錯,我們重複了這個遊戲,我們重複了這個遊戲,重複了又怎麼樣了呢?在我們講了這麼多之後,有什麼不同了嗎?我來推測一下吧!我覺得因為不僅你們自己玩這個數字遊戲玩得更好了,你們也瞭解到周圍的人也玩得更高了。對這個遊戲的分析,不僅讓每個人都更老練了,也使你們更瞭解別人老練的程度,並且你知道別人知道你知道如何玩好這個遊戲。 從中我們得出的主要結論是,不僅你要站在別人的立場上,思考別人的收益是什麼樣的,你還要站在別人的立場上,思考他們在賽局時有多老練。並且你需要考慮到,他們認為你有多老練。你還需要考慮到他們認為,你認為他們認為你在賽局時有多老練。這個是知識層面的問題了,這些知識層面會導致不同的結果。再具體點說,如果一家公司在和它的競爭對手競爭,可以肯定其競爭對手一定很老練,這家公司當然也很老練啦!如果一家公司在和客戶賽局,比如發放說次級貸款,可能假設不是那麼完備。把賽局理論運用到實際是很重要的,本學期我們會不斷學習類似的案例的。 現在我還有5分鐘,還有5分鐘下課對嗎?現在我們順便說說其他的。我們一直在討論知識和共同知識,現在做一個小小的實驗。所有人都坐在自己的位子上,我找來兩位助教,請艾爾和卡佳來到講臺上來。我想讓大家明白,共同知識並不是像我寫在黑板上的,是一個想當然的概念。 請站到講臺上來,麥克風隨便放一下就好。我們的兩個助教在這裡,事實上是兩個助教主管。把臉朝前,不要看到我的動作。我要給他們倆戴上帽子一個給艾爾,一個給卡佳。你們倆站在這吧!這樣大家都能看到。現在你們都能看清這兩頂帽子。如果他們轉過來,就也能看到對方的帽子。現在問一個問題,我這樣說,這是共同知識嗎?至少有一個人戴著粉色的帽子,這是共同知識嗎?這算共同知識嗎?我說這不是共同知識。 我們已知什麼?我已經告訴你們了,艾爾只知道卡佳戴著粉色帽子,所以艾爾確實知道,至少有一個人戴著粉色的帽子,而且卡佳也知道艾爾戴著粉色的帽子。他們看起來有點傻,不過沒關係。注意一下。艾爾不知道他頭上的帽子是什麼顏色,所以儘管他們都知道,儘管至少有一人戴粉色帽子是相互知識,艾爾不知道卡佳看到的是什麼顏色的帽子,所以艾爾不知道卡佳知道這裡有一頂粉色的帽子。事實上,從艾爾的角度看,這很有可能是頂藍色的帽子。但是他們都知道,至少有一個人戴著粉色帽子,至少有一頂粉色帽子是相互知識。但艾爾不知道卡佳知道他戴著粉色帽子,卡佳也不知道艾爾知道,卡佳戴著粉色帽子,他們每個人的帽子可能是藍色的呢! 所以要注意下,共同知識,謝謝你們二位。共同知識的定義是嚴格的,謝謝。共同知識有嚴格的定義,相互知識並不是共同知識。共同知識並不只是我知道什麼,還有我是否知道別人知道,我知道別人知道……以此類推。儘管這個例子很簡單,你們也可能會認為,這很明顯嘛!這就是共同知識。然而教室裡有一頂粉色帽子並不是共同知識。誰有年齡較小的兄弟姐妹的,粉色的帽子就送給你了,各位週三見啦! 2007年9月10日 *****