換位思考

講座二

在講座的開始，我們介紹了遊戲的「組成要素」：參與者，他們的策略和收益。然後回到上堂課的主要結論：不要採取劣勢策略，並且要換位思考。首先，我們將這些運用在對抗漢尼拔將軍以捍衛羅馬帝國；然後運用在上堂課遊戲中所選擇的一個數字。我們學習到，當你以他人的立場換位思考時，你不僅應該考慮他們的目標，也應該考慮他們有多老練，（他們是理性的嗎？），以及他們對你的瞭解多少（他們知道你是理性的嗎？）。我們介紹了一個新...

講座二：換位思考

Ben Polak 教授：上節課我們做了這樣一個遊戲，大家透過選擇α和β來確定各自的成績，這個表格列出了可能的結果，具體說就是你和對手分別得什麼成績。比如說你選了β而你的對手選了α，你會得到C而你的對手會得到A。有一點需要強調一下，這還不能稱之為賽局，它缺少了一些東西。這個遊戲有不同的結果，我們用結果矩陣來表示，但它不是一個賽局，因為我們必須知道收益才能進行賽局。後來我們分析了可能的收益，現在它變成一個賽局了。用專業術語來說，這個賽局屬於標準式的賽局，在這裡，我們假設這些收益是那些只關注自己成績的人的收益，我覺得你們很多人就是這樣，但坐在那邊的先生不是這樣，但對很多人就是這樣。我們指出，此賽局中α嚴格優於β，這是什麼意思呢？我們說如果這是你的收益，那麼不論你的對手選什麼，你選擇α總會比選擇β得到更好的收益。在繼續講下面的內容之前。我們先來回顧一下上節課的結論。其中的一個結論是，不要採用嚴格劣勢策略，大家都記得這個結論吧？在這之後，我們透過研究更複雜的收益，以及更複雜的賽局，我們得出了另外一個結論；站在別人的立場去思考他們會怎麼做。實際上，我們從中學到的是，不僅你自己的收益很重要，這當然很重要，但別人的收益也同樣重要，因為你要儘量想到別人會怎麼做，然後做出恰當的回應。我們今天繼續探討這兩個結論，今天這兩個結論還會再出現。今天所講的很多內容會很抽象，但我想要提醒大家，賽局理論與現實世界是緊密聯繫的。其次，好心提醒一下大家，這個賽局被稱為囚徒困境，我寫在那裡了，囚徒困境。注意一下，囚徒是複數形式，上節課我們列舉了幾個例子，讓我再次重申並強調一下，我們會涉及到更多的案例，這樣你筆記內容就會更豐富了。比如說你和別人要進行一個合作專案，可能是家庭作業，或者像他們正在進行的視頻採集專案，它能變成一個囚徒困境。為什麼呢？因為大家都想偷懶。價格競爭，兩家互相打價格戰的企業可能會陷入囚徒困境。為什麼？因為不管你對手怎麼定價，你總有想削弱他們的動機，如果雙方都採取這種策略，那麼價格將會下降到邊際成本，行業利潤將會遭受損失。在第一個案例中，如果大家都偷懶，成果會糟得不堪設想。在第二個案例中，如果兩家企業互相削弱，最終會壓低價格，這對消費者有利，但對企業不利。讓我來舉第三個例子。假如這裡有一個可利用的公共資源，比如是個魚群，或者是新鮮的空氣，這其中也會導致囚徒困境。你有過量捕魚的動機，為什麼呢？因為如果其他國家擁有這個魚群，假設這個魚群在大西洋，如果其他國家打算正常捕撈，你應該也會正常捕撈。如果其他國家不打算減少捕撈量，那麼你現在就想先把魚都撈起來，因為沒準明天就會無魚可撈了。下一個囚徒困境的案例，是全球暖化和碳排放量問題。拋開科學層面來說，我相信在座的一些同學比我知道的還多。碳排放問題也是個囚徒困境。通常我們每個人都有排碳的動機，如果大家都想減排，我沒必要跟風。如果別人真的減排了又與我何干？我照樣用著熱水，開著大排量汽車。這些情況都導致了糟糕的結果。所以這點在社會層面上很重要。這不僅僅是耶魯課堂上的抽象概念，從上課一開始，我們就應該開始思考這些問題解決方案，現在我們已經談論了一些了。需要指出，這不僅僅是溝通失敗，溝通本身並不能化解囚徒困境。你可以在減排問題上一直高談闊論，但當你回家時，你仍然會開著你的悍馬，每天洗十六次熱水澡，我們依然在大量排碳。你大談特談你在多麼努力地做家庭作業，但是回家後如果你依舊偷懶，這還是無濟於事。實際上，如果其他人正在努力工作，或者正在儘量減少碳排量，你總會有想偷懶的動機，或者總是繼續大量排碳。我們需要跳出這個思維定勢，我們可以考慮制定協約，我們可以考慮各國之間簽訂協約，我們可以考慮制定規章制度，只要改變收益，這些方法都有效。這不是說說而已，但它確實改變了結果。改變了收益，也改變了動機。另一個重要的東西是，我們可以考慮把單次賽局轉化成重複賽局，然後看看是否有效。我們以後再來學習這部分內容。還有一種方法，但我們必須慎用，就是透過教育來改變收益。我認為這就像毛澤東思想的理論似的，把人們鎖到教室裡教育他們要做個好人，這似乎無濟於事，我對此也並不樂觀，但至少我們得承認，它改變了收益。就先回顧到這裡吧!我們繼續講課。上節課我們還有一個問題還沒搞定，我們在上節課最後做了一個遊戲，你們每個人都選了一個數字，你們所有的人都選擇了一個數字，選擇的數字最接近全班平均數的三分之二的人就是贏家。現在我們已經知道誰是贏家了。我知道你們都想知道自己是不是贏家，對嗎？我留下個懸念，我會告訴你們誰是贏家，我們已經算好了，我會告訴你們的。但我們得先幹點事，我先在這裡留下懸念，以防那些只想著贏的人蹺課走了。我們在課上會經常透過遊戲學習賽局，我們還會舉行隨堂討論等等，但是我們也需要花費一些時間來慢慢研究一些問題。接下來的二十多分鐘就是這樣的，抱歉接下來的二十多鐘分可能有點枯燥，我們來做點正經事，就是我希望大家都夠理解，賽局的要素有哪些。具體來說，我們需要搞清楚怎麼樣才能形成賽局。賽局由以下要素組成；參與人，首先我們得規定一下表述法，就是參與人的表述法。我們用小寫i和小寫j來表示吧!在那個數字遊戲中，你們每個人都寫下了一個數字，然後在下課前交了上來，誰是參與人呢？你們就是參與人。我的意思是說，你們都是參與人。在數字遊戲中，每位同學都是參與人。我再強調下，你們都是參與人。賽局的第二個要素是策略，良心的建議，請大家和我一起記筆記，策略；表述法，我們用小寫si來表示參與人i的某個策略。例如他在那個遊戲裡選擇了數字13，大家都聽明白了吧？我們需要把這個特定的策略，和參與人i的可能策略集合區別開來。我們用大寫的Si來表示什麼？來表示策略集合，即參與人i的所有可能策略的集合。上節課我們最後做的遊戲，策略的集合是什麼樣的呢？這個集合由1、2、3，一直到100組成。當需要表示策略集合中的一個特定策略時，說到這，我們來定義第三個標記符號。我們用不帶下標的小寫s來表示某一次賽局，這是什麼意思呢？上節課大家都交上來了一個數字，所以每個人都有對應的數字，這就是每個人都有一個策略。我手裡的是我收上來的策略集合，這些就是你們上節課交上來的表單，這就是一次特定的賽局。我有你們每個人的名字和所選數字，即每個人的策略，我們還製作了一張試算表，所有資訊都收錄到了試算表中，你們每個人的名字和所選數都在這裡，這就是一次賽局。給它起個名字，我們稱它為一個策略組合，你會看到有的課本中稱它為策略組合，策略向量或者策略列表，這無關緊要，它表示每個參與人都有一個對應的策略。這就是數字遊戲的試算表，或者說這是其試算表的一個樣本。我需要把這塊黑板拉下來，以便你們還能夠看到，讓我擦一下黑板，你可能覺得我們搞定了，對嗎？我們有參與人，我們有他們可能選擇的策略，就是策略集合，我們有每個人的策略，我們還有他們每個人已經選擇的策略，即策略組合，看起來我們好像得到了進行一次賽局所需的所有的要素。我們少了什麼？大聲喊出來。我們缺少收益。為了使它成為賽局，我們需要收益。我們用符號來表示收益。在本課中，我用符號U來表示參與人的收益，Ui取決於參與人1的策略，這些都是影響參與人I收益的因素，一直到參與人N的策略。參與人i的收益Ui由所有參與人的策略決定，當然也包括她自己的策略，簡寫應該是Ui(s)，它由策略組合決定。那麼，在數字遊戲中它是怎樣的呢？在數字賽局中Ui(s)代表這兩件事，如果你贏了就是五美元減去你的誤差，我覺得也有可能是平局，這點暫時先不去考慮，除此以外就是一無所獲。現在這個賽局的所有要素都有了，參與人、策略和收益。現在我們不妨作一個假設，這個假設在接下來的十多周都要用到，差不多是整個課程都要用到。我們假設這些都是已知的，我們假設每個人都知道其他人可能選擇的策略，每個人都知道其他人的收益，這不是一個很符合實際的假設，在期末的時候我們再來推翻這個假設，但是就這個假設下的內容，就足夠我們接下來的十個星期學的了。我需要再引入一個符號，之後我們再繼續研究。s-i是什麼意思呢？它表示除了i外其參與人的策略，這個符號是我們會經常用到的。它表示除i外其他參與人每人的策略，具體來說，如果你是參與人1，那麼si-可能表示s2、s3、s4，直到sn，但是不包括s1。這個表述法有用，為什麼？因為有時候，考慮在i和對手在不同選擇下的收益是很有必要的，這是一個有效的思路。現在我們暫停一下，根據之前的教學經驗，我知道有些人有數學恐懼症，如果你有數學恐懼症你不必舉手示意，既然有人是，那麼讓我們深呼吸一下，在家看視頻的數學恐懼症患者也一起做，現在大家不那麼緊張了吧？你今天坐在這，你知道一切都會好起來的。現在我將會在黑板上寫一些數學運算，深呼吸，這沒有你想像的那麼難，我只不過寫下了一些符號，這裡不會有數學運算，我只是在寫符號。我不希望你們因為對數學，或是數學符號的恐懼而放棄這門課。所以如果你是因為懼怕數學，而可能會選擇放棄這門課，歡迎來找我和助教傾訴，我們會幫你搞定的。數學恐懼症沒什麼大不了的，我害怕很多東西，不一定是數學，也可能是各種各樣的事物。很多人面對符號往往都望而卻步，看起來它比這個更可怕。而在這裡，其實僅僅是符號而已，我們舉個例子來幫助理解。稍等一下，讓我來擦下黑板，讓我來舉一些例子，來幫助那些對這些符號感到困惑的同學。我們來簡單地看一下下面這個賽局。此賽局有兩個參與人，分別為I和II，參與人I有兩個選擇，上和下；參與人II有三個選擇，左中右，這是一個很簡單的抽象案例，讓我們設想收益是這樣分配的。它們不是特別有趣，它就是一個為了解釋用的例子，收益是這樣的，(5, -1), (11, 3), (0, 0), (6, 4), (0, 2), (2, 0).。讓我們來看一下這個賽局中的符號。首先，誰是參與人？沒什麼好解釋的，參與人是，讓我們把它寫在這吧!這次賽局中有兩個參與人，I和II，那麼策略集合是怎樣的呢？這是參與人I的策略集合，她有上下兩種選擇，用橫排來表示，即上下兩排。參與人II有三種選擇，這個賽局不是對稱的，所以他們可選策略數量不同，這無所謂。參與人II有三種選擇，左中右，用矩陣的左中右三列來表示。順便說一下，到目前為止，我們所學的大部分是對稱賽局，但注意此賽局的策略與收益是非對稱的。賽局未必都是對稱的，收益，這也不是天書，沒那麼可怕的，我們隨便寫個收益吧!參與人I的收益，如果她選上，參與人II選中，我們來看一下上行和中列。參與人I對應第一個收益，即11，在這種情況下，參與人II的收益，即參與人I 選上參與人II選中時，注意下是上行和中列，但是現在我們要找參與人II的收益，也就是第二個收益，即3。我相信有數學恐懼症的現在好多了吧!下面來看看這次賽局是如何進行的。這不是一次特別有趣的賽局，既然說到這裡了，不妨多討論一點，我們的麥克風準備好了沒？大家認為這個賽局會如何進行下去？我們隨便找個同學來回答一下，艾爾，那個穿藍襯衫的男孩，參與者I有劣勢策略嗎？學生：不，參與者I沒有劣勢策略。例如，參與者II選擇左，參與者I會選擇下；但是若參與者II選擇中，參與者I會選擇中。教授：好，太棒了，非常好，你應該站起來回答問題的，我忘記說了，不過沒關係，這位同學解釋的很清楚，謝謝。同學們都聽清楚了嗎？都聽懂了嗎？後面的同學聽見了嗎？這樣聲音還是太小，所以我希望之前的同學的解釋清晰正確，但以後請大家站起來大聲點說，否則後面的聽不到。你的名字是？學生：派翠克教授：派翠克剛所說的是，參與者I沒有劣勢策略。在左列下，選上比選下…我說錯了，在左列下選下比選上要好，因為6大於5。但在中列下，選上比選下好，因為11大於0，大家聽懂了嗎？也就是說選擇上並不總是最優的，上並不總是優於下，或者下並不總是優於上。這次舉手回答，參與者II呢？參與者II有劣勢策略嗎？你們都果斷得把手放下來怕被拍到嗎？艾爾，穿白衣服的小夥子站起來等著艾爾走過去，並且大聲地告訴我們答案。學生：我認為參與者II選擇右是劣勢策略。因為如果參與者I選擇上，那麼參與者II會選中，並且如果－我弄混了，在我草稿上不是這樣的，但是右絕不是最優策略。教授：很好，我們認真一點，你叫什麼？學生：湯瑪斯教授：湯瑪斯所說的是對的。但這的確與劣勢策略的定義不太相符，湯瑪斯所說右並非總是最優策略，這是對的。想要成為劣勢策略還要滿足別的條件，即需要參與人II存永遠占優勢的策略，這個例子可以證明。我們來看看。在這次賽局中，我說中優於右，我們看看，如果參與者I選擇上，選中的收益是3，選右的收益為0，3大於0。如果參與者I選擇下，選中的收益是2，選右的收益是0，2大於0。所以這個賽局中，中嚴格優於右，你剛才說的是對的。但我想要得到與優勢有關的回答，從中我們得出參與者II不應該選右，目前為止，這些就是我們透過此賽局得到的全部與優勢有關資訊了。然而，我們來再深究一下。上節課我給出了嚴格優勢的定義，並且講義中也有。順便說下，講義可以在網上看到，但是現在我們用這些符號，來重新作一下優勢策略的定義。定義是：參與者i的策略s'i，嚴格劣於參與者i的另一個策略si。現在我們要使用符號了。在其他參與人選擇s-i時，選擇si的收益UI(si)嚴格優於此情況下選s'i的收益UI(s'i)。最重要的一點是，對所有s-i均成立。用文字來描述就是，參與人i的策略s'i嚴格劣於si，如果si總是更好的選擇，即總能給參與人i帶來更高的收益，而無論其他參與人怎麼選。這個定義和我們上次講的是一致的，只不過使用了些符號使它變得有點枯燥。大家都談符號色變，你們像被前照燈照到的小鹿那樣亂竄嗎？沒有，我看大家很冷靜。那我們再來看另外一個案例。你們記完筆記了嗎？我要換黑板了。好的，這是一個更有趣的例子，想像一下這樣的例子。一個侵略者打算入侵一個國家，有兩條路，想像成兩個關口也行，侵略者必須透過一個才能進入。你是國家的防禦者，你必須決定在哪個進入關口，或者在哪條進軍路線上佈置你的防線。問題是，你只能防守二者之一。現實世界也有這樣的例子。大概在西元前三世紀，如果我說錯了請大家來糾正，我記得是西元前三世紀，當時漢尼拔想翻越阿爾卑斯山，我說的不是漢尼拔·萊格，而是西元前三世紀的漢尼拔將軍，那個騎大象的漢尼拔將軍。好了，這裡的關鍵問題是，有兩條路，一條路崎嶇，需要翻越阿爾卑斯山，另一條路平坦，只需沿著海岸線走。如果侵略者選擇崎嶇的路，僅在穿越阿爾卑斯山的途中，他就要損失一個營的兵力，這就是選崎嶇之路的代價。如果他碰巧遇到了你設防的途徑，無論崎嶇之途還是平坦之途，他還要再損失一個營的兵力。我還沒有說完，我給出了大致的選擇，入侵者選擇從哪個途徑入侵，而防衛者選擇在哪裡設防。但我們需要搞清收益後才能分析此賽局。這個賽局的收益是這樣的：這是一個簡單的二對二的賽局，這個是入侵者，即漢尼拔將軍，這個是防守者，我忘了哪位將軍是防守者，最好有人來告訴我。你要選擇兩條途徑中的一條設防，平坦之途的或崎嶇之途。同樣他也有兩條路入侵途徑，平坦之途和崎嶇之途。強調一下，平坦之途不用翻山越嶺，我們說的不是新澤西收費公路。收益如下，我簡單來解釋一下入侵者的收益，是他攻入你國家時還剩餘多少兵力。他只有兩個營的兵力，而你的收益是入侵者損失多少兵力。舉個例子吧!如果入侵者與你在崎嶇之途上狹路相逢，他在翻越山嶺時損失一營，與你交戰再損失一營，那麼他全軍覆沒而你得到一場完勝。相反，如果他選擇崎嶇之途，而你卻防守平坦之路，那麼他僅僅損失一個營的兵力，他還留有一個營的兵力。他的確在翻山越嶺時損失一營，但是他只會損失一個營，因為你選擇了在錯誤的途徑設防。大家明白了這個賽局的收益吧？現在想像自己是一位羅馬將軍，發揮你的想像力，想像你是一位羅馬將軍，我們來看看你應該怎麼辦。你是防守者，那麼你應該在哪設防呢？大家舉手表決，有多少人選擇防守平坦之途的？請舉手，讓裘德可以拍到你，先別放下手，再舉一小會，揮一下手，應該給你們弄桿軍旗來才對。這些都是鎮守平坦之途的羅馬士兵。那麼有多少人選擇防守崎嶇之途？我發現有很多同學不想成為羅馬將軍啊! 再來一次，不能棄權，準備好了嗎？即使你答錯我也不會為難你。那麼多少人選擇防守平坦的之途？再次舉起手來。有多少人選擇防守崎嶇之途？大多數人選擇平坦的路，絕大多數。接下來我們看看，防守平坦之途是否優於防守崎嶇之途呢？是這樣嗎？防守平坦之途是否，到底是不是優於防守崎嶇之途呢？你可以大聲喊出來，不，不是這樣。我們來分析一下。如果入侵者選擇平坦之途，毫無疑問，如果你選平坦之途要比崎嶇之途更好，1比0。但如果入侵者選擇崎嶇之途，仍然是毫無疑問，這不是一個合理的答案。防守平坦之途並非優於防守崎嶇之途，你只是想剛好截擊到入侵者，然而大多數人都選擇防守平坦之途了。為什麼呢？有人知道原因嗎？把麥克風準備好，能不能到那邊的留鬍子的小夥子來說一下。請稍等片刻，等麥克風過去，你站起來大聲說出來吧，開始吧! 學生：因為你想使入侵羅馬的敵軍兵力最小化教授：你想最小化入侵羅馬的兵力，沒錯，但是我們剛才說這裡沒有優勢策略，平坦之途並不總是優於崎嶇之途，還有其他原因嗎？我看到你舉手了，請那位坐在中間舉手的小夥子說說吧!還是一樣，請起立對著麥克大聲講，臉面向麥克風，好的。學生：雖然看起來你好像沒有優勢策略，但似乎漢尼拔將軍最好的選擇是，他應該會選擇從平坦之途入侵。教授：好的，為什麼似乎是這樣的呢？很好，我們要步入正軌了。為什麼他應該會選擇從平坦之途入侵？學生：如果你沒有在平坦之途設防，他兵力不減。然而如果他從崎嶇之途進軍，那麼他將至少損失一個營。教授：我們回頭看一下，來回顧一下想想我在剛上課時說的教訓。我們應該站在漢尼拔的立場來看問題，管他穿的是鞋子還是靴子呢？不管你是騎著大象也好，還是穿著別的也罷，我們應該從漢尼拔的立場來看待問題，並且試著推測漢尼拔會怎麼做。站在漢尼拔的立場，他應該不知道你會防守哪條路，但讓我們看看他的收益。如果你們都選擇的是平坦之途，那麼他攻入你的國家時他只剩一個營，這與他選擇崎嶇之途別無二致。那麼如果你防守平坦的路，從他的立場出發，無論怎麼選擇，選崎嶇之途收益是1，而選擇平坦之途的收益也是1。但是如果你選擇防守崎嶇之途，即你要低於高山巨嶺，而他卻選擇的是平坦之途，他將兵力全存。而要是選崎嶇之途，他將全軍覆沒，這樣來看，選擇平坦之途要好些。我們要更嚴謹一些。對漢尼拔而言，選擇平坦之途入侵並不是嚴格優於選擇崎嶇之途的，但是在這種情況下有一個弱優勢，對入侵者來說，我們再引入術語，對入侵者而言，平坦之途弱優於崎嶇之途。我所說的弱優於是什麼意思？它意味著選擇平坦之途較選擇崎嶇之途而言，至少要同樣的好，可能還稍微好些。這裡我們給出第二個定義，也是今天的一個新定義，我們再一次用到術語。定義是，參與者i的策略s'i弱劣於其他策略si，下面我們會發現用符號的好處了。在對手選s-i的情況下，參與人i選擇si的收益，等於對手選s-i下她選s'i的收益，而且在任何情況下此條件均成立。除此之外，對手選s-i參與者i的策略si，嚴格優於其他策略s’i，至少在某種情況成立。驗證一下，這和我們之前選擇平坦之途還是崎嶇之途是對應的。重申一下，參與者i的策略s'i弱劣於策略si，無論對手怎麼做，她選擇si的收益至少與選s'i的相等，有些情況下甚至是嚴格佔優的。這似乎是一節相當重要的課，我們說過，不要採用嚴格劣勢策略，你也不應該採用弱劣勢策略，不過這個更嚴密一些罷了。對於這個定義，如果你還有些疑問，而且你想看用文字表述的，在講義中有，我已經上傳到網上了。裡面有第一節課的總結，也有這個定義的文字形式，不妨去對比一下這個定義的文字表述與黑板上的符號表述。好了，既然我們認為入侵者漢尼拔不會選擇弱劣勢策略，我們認為漢尼拔不會選擇崎嶇之途，他會選擇從平坦之途入侵，這種情況下，我們又該如何設防呢？我們應該防守平坦之途，大多數人都這麼選。坦白地講，這是你們的理由嗎？有可能是，我們能理解這些道理。那麼我們從漢尼拔的角度來考慮一下。我們發現崎嶇之途是弱劣勢策略，他會選擇平坦之途，我們應該在此設防。然而事實上，漢尼拔選擇的是翻山越嶺，這有點和這個結論相悖，但這也沒有辦法了。好吧，我承諾過會講上節課的數字遊戲，我們到現在講了很多了。上節課我們學到了，不要採用劣勢策略。然後今天我們學到了，我們有時可能不會選擇弱劣勢策略。我們還學會了站在別人立場上思考，然後推測出他們不會選擇嚴格劣勢策略或弱劣勢策略。這似乎是預測別人選擇策略的一個不錯的方法，那麼我們帶著這些方法，回到上次的數字遊戲中。在家看視頻的人不必關心這個。上節課你們多少人來了？多少沒來？我問得有問題，上節課有多少人沒來啊？那我們再說一下那個數字遊戲吧!再來介紹一下這個數字遊戲。但是以防萬一，我來介紹下遊戲規則，那個遊戲是這樣的。在不被你同桌看到的情況下，在方框裡寫下一個介於1到100之間的數字，我們將計算，實際上已經計算完了，班裡同學所寫數字的平均數，最接近平均數的三分之二的人，是這個遊戲的贏家。獎金是五美元減去所選值與答案之差。上節課每位同學所填的數值都在我這兒，揭曉贏家前，我們先分析一下此遊戲，我先走下講臺看看各位，麻煩準備好麥克風。那讓我看下大家填的是多少。你們坦誠點吧!我有所有的資料，有多少人選了32、33或是34？有一個人舉手了，實際上九個人這麼選的。我需要把名字念出來讓你們尷尬一下嗎？利奈特、魯克森、克裡絲汀、博貞，有九個人，再舉下手示意一下。到底有多少人選了32到34之間的數？很好，這次舉手的人多了，先別放下手，你們為什麼這麼選？把話筒遞給那位同學，你叫什麼名字？能站起來嗎？站起來一下，大點聲。你叫什麼？學生：克裡斯教授：克裡斯，你好像在這個名錄裡，也許你不在名錄裡，不要緊，你選了什麼？學生：我想我選的是30 教授：30，是挺接近的。那你為什麼選擇30？學生：因為我想每個人都會選45左右的數，因為66約等於一百的2/3，而大家會選比那小的，我就選了更小的數。教授：謝謝，讓我們再問問另一位同學，這還有一位，選33、34的請再舉下手，坐在這裡的那位同學，你能站起來嗎？你在兩個麥克風之間，就是你，好的，大聲點。首先你叫什麼？學生：瑞恩教授：瑞恩，我這兒肯定也有你的數，不要緊，你選了什麼？學生：我記得是33 教授：33，你的確是選了它，你是瑞恩•洛嗎？學生：是的教授：好的，瑞恩·洛，請講。學生：實際上我的想法和克裡斯的相近，我也在想我們得選平均數的2/3，每個人都在1到100中選擇的話，最後結果可能是33，會接近於平均數的2/3。教授：我再重複一遍。他剛才說，再提醒一下大家，說的時候大點聲，因為我感覺剛才有些人沒聽清楚，所以我重複一遍，讓大家都聽清楚。選擇33的理由是，如果大家在1到100之間隨機選擇，平均數會是50左右，而50的2/3大概是33，確切地說是33 1/3。這個思路聽起來很有道理，那麼這個思路到底存在什麼問題呢？請那位穿條紋襯衫的女士發言，我們很久沒找女性發言了，這次找個女士來回答吧! 學生：因為即使每個人都像你這麼想，33還是太高了。教授：就是說如果每個人都像你這麼想，33還是太高了。如果其餘的每個人都那麼想的話，如果每個人都會選擇33或者34，那種情況下，平均數會是多少？抱歉，平均數的2/3會是多少？應該在22左右。所以克裡斯和瑞恩的說法的漏洞在於，這並不是一個錯誤的說法，這是一個很好的出發點，但其中存在漏洞，其中的漏洞在於第一句話。第一句話是，如果教室裡的人隨機選擇，那平均數會落在50左右，這很對。問題是教室裡的人並不會隨機選擇，看看你們的周圍，看看你們自己，你們有人是亂數生成器嗎？實際上，有些人好像真是，我就不念出名字了，你們中有的人沒準真是亂數生成器。總的來說，耶魯大學的學生不是亂數生成器，他們想要成為這個遊戲的贏家，所以他們並不大可能隨機選數。繼續分析，如果每個人都這麼想，而且你明白大家都會這麼想的話，那你會預計每個人都會選擇33，而這種情況下你應該選擇22。你們當中有多少人，舉下手，你們當中有多少人選了21到23的數？絕對不止這麼少，難道要我念出來你們的名字嗎？應該有有十二個人，快舉手，應該有十二隻手舉起來，兩個、三個人舉手了，四個、五個，實際上有十二個人選了22，所以加上選23和21的會更多，我猜你們這些人是按照這個思路選的吧!請選了22的同學發言，這裡有一位，助教能遞話筒給他嗎？你叫什麼名字？請站起來大聲點說。學生：裡安教授：你選了22嗎？學生：我選了22，因為我想大多數人在遊戲中，可能會多次求平均數的2/3，最後會得出30以下的數。教授：如果你認為大家會按這種方式推理的話，確切地說就是如果你認為大家會依照瑞恩和克裡斯的策略而選擇33的話，22看起來是個不錯的選擇。但是你也低估了你的耶魯校友，事實上，22還是太高了。好吧，我們重申一下這個遊戲的要點，我們再來重申一下吧!這裡的要點是當你在進行遊戲時，你想要推測出其他人的想法，想要推測出他們可能的選擇，假設別人是亂數生成器可不是一個很好的出發點。他們都想贏，他們有自己的策略。讓我把這張表寫上黑板，那麼這裡有沒有可以直接剔除的策略呢？我已經說了大家並不是隨機選數的，有沒有可以直接剔除的策略呢？我們知道大家不會選擇這些策略，找位同學來回答，綠衣服的你來答吧!請等艾爾過去，好了，請站起來，告訴我你叫什麼？學生：我是尼克教授：大點聲讓大家都聽清楚學生：沒有人會選擇超過50的數教授：沒有人會選擇超過50的數，好的，這個回答很好，雖然有人那麼選了，但這個回答很好。我本來想得到一個稍微……很好，我本來想得到一個不這麼直接的回答。有人選66了，那我們來分析一下，還有一些人選擇了大於67的數。當然，我們開始說的是66，順便把大於67的數一起分析了吧!選大於67的數有什麼不對的嗎？這樣選錯在哪裡？請舉手回答。錯在哪了？請穿紅上衣的小夥子回答，請起立，說出你的名字，大點聲說。學生：彼得教授：好的學生：如果每人都選100，答案會是67 教授：好的，如果每個人，教室裡的每個人不是隨機選擇數字，而是全選了100，這好像不太可能，但如果每個人真的都選了100，就是最大的數，那平均數，抱歉，平均數的2/3會是66又2/3，此情況下67應該是個不錯的選項，那些選大於67數的人看起來挺傻的了。但他們傻不傻不是我們要關心的問題，那些選擇大於67的數的同學，如選68及以上的人，怎麼來評價呢？我們怎麼評價他們的選擇？找你身後的，你身後的那位女士，請大聲說。學生：他們這麼做沒有收益教授：他們沒有收益。用術語怎麼說？我們得用術語來說，哪位能喊出來，術語怎麼說？他們處於劣勢，這些策略是劣勢的。實際上只是弱劣勢，但這麼說也對，他們當然是劣勢的。準確地說，選擇80是劣於選擇67的，選擇67的話你總會獲得較好的收益，至少也是跟選80的收益一樣高，有時候比選80的收益更高，不管別人選擇的是什麼樣的策略，所以這種選擇是劣勢的。從上堂課中，我們學到了不要採用這類策略，他們是劣勢策略。但還是有人選擇大於67的數，對嗎？我不會把他們的名字念出來，事實上你們當中有四名同學這麼選的，我也不打算讓你們舉手了。好吧，這四位同學，沒事了，你們下次要注意。一旦我們剔除了有人會選擇大於67的數的可能後，68到100之間的數就無關緊要了，就如同這遊戲的可選項只有1到67之間的數字了，是吧？我們知道沒人會選擇68及以上的數，所以可以忽略它們，我們可以剔除那些策略。一旦如此，剩下只有1到67的數。有誰能幫我總結一下，目前為止我們能得到什麼結論？68到100的選項不存在了，或者說已經被剔除了，那我現在可以得出什麼結論？遞過來一個麥克風好嗎？請站起來等著麥克風，麥克風來了，好的，大點聲。學生：那這樣45以上的也一樣被剔除了。教授：很好，你叫－學生：亨利教授：亨利說，一旦我們明白了沒人會選大於67的數之後，我們可以再深入一些，如果這些類似策略不存在或者被剔除，那麼相似的策略也會被剔除，即大於45的數會被剔除。這裡我們須要認真一些，對於選擇大於45而小於67的數，我認為他們並不是，在原賽局中並不是劣勢策略。準確的說，我們僅僅論證了，如果教室裡每個人都選擇100，那選擇67會獲勝，所以在那種情況下，選擇45至67之間的數並不是劣勢策略。但一旦我們剔除了原劣勢策略，即選擇67及大於67的數之後，他們才是劣勢策略。所以這些策略，對於這裡的弱一詞，我們要謹慎對待。這些策略在原賽局中並不是弱劣勢的，可是一旦我們排除掉了68至100的數，他們就成為了劣勢的策略，即弱劣勢策略。至此所有45到67的數也被剔除了。好的，我們看一看，有人選了嗎？請大家踴躍舉手，有誰選了45至67之間的數，或是46至67之間的數？沒人舉手。我知道誰選了，我有統計表的，至少有四名同學，我就不念名字了，但是我下次可能會念。注意有四名同學選擇這樣的策略。請注意，這裡的不同之處在於，剔除67以上或者68以上的過程，僅僅用到了上堂課所提到的第一個結論，即不要採用劣勢策略。雖然這裡是弱劣勢，但同理，但排除45到67的第二個區間時，還牽涉到了別的內容。你需要從你的同學的角度思考，明白他們也不會選擇67及以上的數。所以第一個過程是直截了當地。而第二個過程，我從別人的角度思考，發現他們並不會選擇劣勢策略，所以，意識到他們並不會選擇劣勢策略後，我也不應該選擇45至67的數，所以這是個換位思考式的過程。那接下來呢？我們該怎麼辦？請那位留鬍子的同學說一下。把麥克風給他，大聲說出你的名字。學生：卡特。你就一直重複剛才的過程，最終你會得到1。教授：我們會這麼做，但還是讓我們先一步步來。現在因為選擇68及以上的數的策略是弱劣勢策略，所以我們已經把它們剔除了，並且我們也排除了有人會選擇46至67之間的數的可能。因為一旦我們剔除原賽局的劣勢策略，這些策略也就變成劣勢策略了。所以我們知道沒人會選擇大於45的數，就好像46及以上的數都不存在，所以可能被選擇的最大數也就是45，而45的2/3大約是－誰幫我算下？30，對，大概是30。所以可知，選擇30至45之間的數，這樣的策略在原賽局中並不是劣勢的，即使在剔除劣勢策略後，它們也不是劣勢的。但是當我們剔除原賽局中的劣勢策略，以及第一次剔除之後仍處於劣勢的策略後，它們就又繼續成為了劣勢策略。我不打算試著把這段話寫下來，但你們應該記到筆記裡面。我們簡要寫一下這個結論，我們發現剔除掉30到45之間的策略，不是僅僅憑藉我們自己的收益，不僅僅靠換位思考來推斷出，別人不會採用這些弱勢策略，在別人站在他人的立場上換位思考，並推測他人可能選擇什麼策略時，我們也進一步地換位思考。所以這是一個不斷換位思考式的過程，注意一下這裡的措辭。這是一個換位再換位思考的過程，說明我們也要換來換去思考。接下來怎麼辦呢？我們已經知道會繼續發生什麼了。既然我們能剔除掉68及以上的數，那我們也能剔除46及以上的數，然後我們就能剔除掉31及以上的數，再往下我們可以繼續剔除，是多少來著？20以上的數，在20到30之間的，而這會是一個三次換位思考的過程。選擇20到30的策略一開始不處於劣勢，在第一次剔除劣勢策略時也不處於劣勢，在第二次剔除勢策略之後也不處於劣勢，但是在第三次剔除劣勢策略之後，就變成劣勢策略了。我想你們明白我的意思了。那麼最終的結果會是怎麼樣的呢？最後的結果是什麼呢？這個過程會一直持續下去一直到1，直到只剩下1了。我們一直重複這個過程最後就剩1了。注意，一旦我們剔除了劣勢策略，我們已知有四人選擇了在45到67之間的數，但是選擇30到45的有不少，有多少人選了30到45之間數？我敢保證絕對比這些多，我保證，多很多的。實際上選33的人是在這個範圍內選擇的，有很多人選了20至30之間的數，所以我們已經涉及到分佈的問題了。然而我們發現這些策略，會因為某種推理而被剔除。現在我還不打算告訴你們誰是贏家，我打算進行做一次更抽象的推理，讓我們討論得再深入一點吧!我們來討論下理性對賽局結果的影響，這稍微有點哲學的色彩。如果你是一個理性的參與人，我的意思是說，對於一個賽局中尋求個人收益最大化的參與者，僅僅出於理性，僅僅作為理性參與人，就會剔除大於67的劣勢策略，所以那四位選擇大於67的同學，我雖然不念出來你們的名字，但以後要注意啊! 但是接下來就不僅僅是理性那麼簡單了。還需要什麼呢？這位同學，你可以再說下嗎？再說一次你的名字，抱歉我忘了。學生：尼克教授：大點聲說學生：尼克教授：好的學生：你需要假設你對手也是理性的教授：很好。這也是有點拗口，但他的意思就是，理性的你，知道你的對手也是理性的，接下來呢？我自己已經是理性的了，我也知道對手也是理性的，我還需要知道對手們明白，他們的對手也是理性的。要剔除這個範圍，需要理性因素。可能有些人知道，這一點在最近社會科學界廣受質疑，人是理性的這個假設是否正確。想要剔除這個範圍，我首先得理性，我需要理性的知識，我們記理性為KR。並且我們需要知道別人也是理性的，進一步推理就是，我是理性的，我知道別人是理性的，我知道別人知道大家是理性的，我知道別人知道大家知道，人們是理性的。說得再具體點，那些選67以上的四位同學，你們犯了個大錯誤。那選擇45到67之間的四個人呢？這四個人應該怎麼評價？選45到60的四位同學，我要說出他們的名字嗎？也許我最好不要這麼做。從他們四位當中我們能總結出什麼？麥克風可能到不了那麼遠，試試看能不能把麥克拿到那，盡可能朝前靠，請大聲點說。學生：他們認為他們的同學的都很蠢教授：沒錯。選擇46到67的人，自身並不一定愚蠢，但他們可能認為剩下的人都很蠢。推論到這裡，人們不一定是愚蠢的，不應該認為別人是愚蠢的，只是你們認為他們是愚蠢的，抱歉，是他們認為剩下的人都是愚蠢的。為了使最後的結果到1，需要很多次的知道別人理性到知道別人是理性的推理。有人知道這叫什麼嗎？如果我們假設有一個無限的，我知道你知道我知道你知道之類的序列，它叫什麼呀!信不信由你，他的術語是，在哲學上叫做共同知識。我不知道拼寫對不對，我看一下。共同知識是指，我知道一件事，你也知道這件事，你知道我知道這件事，我也知道你知道這件事，我知道你知道我知道這件事，以此類推，一個無限的迴圈。但是如果大家都知道彼此是理性的，那麼最優策略就是1。有多少人選擇了1？我們來看看。環視一下教室，先別放下手，有多少人選了1？事實上你們中有很多人選了1，1是這個問題的最常見的答案，你們中很多人選了1，做的不錯，他們肯定已經他們肯定以為自己贏了。但是他們不是贏家。這個遊戲的最終結果，平均數大概是13又1/3，它的2/3是9，平均值的2/3是9，有人選了9，所以如果你選了9請起立。以下同學選了9，不是這頁，選9的人的名單在哪？就在某頁上，抱歉，名錄頁碼實在太多了，找到了。以下同學選了9，如果你本人或者你是獲獎者的室友的話，請你們起立。張李星，張李星在嗎？如果在的話請起立。G•克裡斯多夫•貝勒拉，如果在的話站起來一下。威廉姆•菲謝爾在嗎？我不知道他來沒來。傑德•格裡克斯坦在嗎？如果傑德•格裡克斯坦在的話，請站起來。傑佛瑞•格林在的話請站起來。愛麗森•霍伊特在的話請站起來。愛麗森•霍伊特不在。有個叫約翰•羅賓森的，總共就這些人。站好，讓錄影機拍一下你們，每一個都拍一下。揮手，跟螢幕前的老媽打個招呼。我們為這些贏家鼓掌吧! 裘德確實帶來了一張5美元的鈔票，等我去取一下。這是5美元，我要把它撕成9份，但我會為此被捕然後被驅逐出境的。所以待會兒我會想辦法把它換成零錢，待會兒過來拿，你們都有權拿到5美元的九分之一。為什麼經過一系列的推理，1不是最終的答案呢？為什麼選1不能獲勝啊？我們來問一下之前沒回答過問題的人，麥克風可以到後面嗎？把麥克風拿到你在的那排，看你能不能夠得到，很好，請起立，大聲說出來。學生：1本該是獲勝的答案－教授：再大聲一點學生：如果大家都認為平均數會一直下降到1的話，1應該是最終的答案。但是由於一部分人選擇了，並不是說是錯誤的，但是卻高於平均值的數，就把平均數推高到了13。教授：沒錯，所以這樣一來，很好，所以這樣一來，謝謝你。要讓平均數到1需要很多條件的，不僅需要你們都是理性的參與人，不僅需要你們知道對方是理性的，而且必須知道所有人都是理性的。我的意思是，我知道你們互相都認識，因為你們都在耶魯大學念書。但你們都那麼熟悉了就會發現，並不是所有的人都是理性的，而且你很確定，並非所有人都知道你是理性，以此類推，需要很多條件才能使最終結果是1。實際上這個遊戲一直都沒有到1。前幾年的答案比這更高，今年還是比較低的年份。在2003，平均值是18.5；在2004，是21.5；在2005年，我想這個班的同學並不互相信任，因為平均值是23。今年是13又1/3，我認為今年比以前做得好多了。順便提一下，有趣的是，我就是順便提一下，班級中位數也是9，中位數正好也是遊戲的答案。那麼現在我們再重新玩一次，我們沒有足夠的時間完整的來一遍，雖然我都發完紙了。請你在不被同桌知道的情況下，寫下一個數字，不要和別人討論，這算違規。寫下一個數字，如果你們沒有拿到我發的紙，就寫在你們的筆記本上寫下一個數字，都寫完了嗎？下面請大家來舉手。有多少人，錄影機會轉過來對準你們，多少人選了大於67的數？看樣子班裡面有幾個搗蛋鬼啊!多少人選了大於20的數字？多少人選了大於10的？多少人選了5至10之間的？多少人選了0？抱歉，選1到5的。除了上次選1的人，多少人選了比你上次選擇的數還低的數字？把手舉一會兒，幾乎所有的人都選的比上一次低。為什麼？為什麼會出現這種情況呢？我猜這次的平均數字大約在3或者4，甚至可能更低。為什麼我們這次選的數字會變小呢？穿綠色衣服的女孩子，很抱歉我沒記住你的名字。學生：因為我們剛剛上過課，你告訴我們選大數的人是不理性的。教授：這對了一半。你們都明白了不應該選擇一個較大的數。還有別的原因嗎？我們換個人吧!那個在揮手的人，戴帽子的後面那位，就是你。學生：因為我們在重複上次的遊戲教授：沒錯，我們重複了這個遊戲，我們重複了這個遊戲，重複了又怎麼樣了呢？在我們講了這麼多之後，有什麼不同了嗎？我來推測一下吧!我覺得因為不僅你們自己玩這個數字遊戲玩得更好了，你們也瞭解到周圍的人也玩得更高了。對這個遊戲的分析，不僅讓每個人都更老練了，也使你們更瞭解別人老練的程度，並且你知道別人知道你知道如何玩好這個遊戲。從中我們得出的主要結論是，不僅你要站在別人的立場上，思考別人的收益是什麼樣的，你還要站在別人的立場上，思考他們在賽局時有多老練。並且你需要考慮到，他們認為你有多老練。你還需要考慮到他們認為，你認為他們認為你在賽局時有多老練。這個是知識層面的問題了，這些知識層面會導致不同的結果。再具體點說，如果一家公司在和它的競爭對手競爭，可以肯定其競爭對手一定很老練，這家公司當然也很老練啦!如果一家公司在和客戶賽局，比如發放說次級貸款，可能假設不是那麼完備。把賽局理論運用到實際是很重要的，本學期我們會不斷學習類似的案例的。現在我還有5分鐘，還有5分鐘下課對嗎？現在我們順便說說其他的。我們一直在討論知識和共同知識，現在做一個小小的實驗。所有人都坐在自己的位子上，我找來兩位助教，請艾爾和卡佳來到講臺上來。我想讓大家明白，共同知識並不是像我寫在黑板上的，是一個想當然的概念。請站到講臺上來，麥克風隨便放一下就好。我們的兩個助教在這裡，事實上是兩個助教主管。把臉朝前，不要看到我的動作。我要給他們倆戴上帽子一個給艾爾，一個給卡佳。你們倆站在這吧!這樣大家都能看到。現在你們都能看清這兩頂帽子。如果他們轉過來，就也能看到對方的帽子。現在問一個問題，我這樣說，這是共同知識嗎？至少有一個人戴著粉色的帽子，這是共同知識嗎？這算共同知識嗎？我說這不是共同知識。我們已知什麼？我已經告訴你們了，艾爾只知道卡佳戴著粉色帽子，所以艾爾確實知道，至少有一個人戴著粉色的帽子，而且卡佳也知道艾爾戴著粉色的帽子。他們看起來有點傻，不過沒關係。注意一下。艾爾不知道他頭上的帽子是什麼顏色，所以儘管他們都知道，儘管至少有一人戴粉色帽子是相互知識，艾爾不知道卡佳看到的是什麼顏色的帽子，所以艾爾不知道卡佳知道這裡有一頂粉色的帽子。事實上，從艾爾的角度看，這很有可能是頂藍色的帽子。但是他們都知道，至少有一個人戴著粉色帽子，至少有一頂粉色帽子是相互知識。但艾爾不知道卡佳知道他戴著粉色帽子，卡佳也不知道艾爾知道，卡佳戴著粉色帽子，他們每個人的帽子可能是藍色的呢! 所以要注意下，共同知識，謝謝你們二位。共同知識的定義是嚴格的，謝謝。共同知識有嚴格的定義，相互知識並不是共同知識。共同知識並不只是我知道什麼，還有我是否知道別人知道，我知道別人知道……以此類推。儘管這個例子很簡單，你們也可能會認為，這很明顯嘛!這就是共同知識。然而教室裡有一頂粉色帽子並不是共同知識。誰有年齡較小的兄弟姐妹的，粉色的帽子就送給你了，各位週三見啦! 2007年9月10日 *****