在足球運動及商業夥伴關係中的最佳對策

講座四

我們繼續上堂課的概念，即我們認為別人會怎麼做時所採取的最佳對策是什麼。我們特別發展出一個概念就是，不要選擇在任何信念下都非最佳對策的策略。我們用這種概念來分析足球運動中的罰球。然後，我們用它來分析一個利潤分享的夥伴關係。課程最後，我們介紹一個新概念：納許均衡。

講座四：在足球運動及商業夥伴關係中的最佳對策

Ben Polak 教授：上一講我們引入了一個新概念，這個新概念就是最佳對策。這是什麼意思呢？在你已經對別人如何行動有一定信念時，你能想到的最佳的策略。你的對手會怎麼做，其他人又會怎麼做，你可以把它看成，你可以把這個信念理解成讓你的策略合理化的理由。所以如果你為別人打工，你的老闆問你為什麼做出這樣的選擇，如果你針對自己的信念做出了最佳對策，你就可以說，我之所以這麼做，是因為我認為其他人會那麼做，因為那的確是在這種信念下的最佳策略，你也就不會因此被炒魷魚了。我說過今天我們將討論全世界最重要的一個賽事，正如我上次所說的，它就是罰球。所以這是一個有關足球的賽局。我先告訴在座不是球迷的同學，為什麼說這個很重要，因為上屆世界盃冠軍就是罰球決定的。拿英格蘭做例子吧!英格蘭每次在世界盃或者歐洲盃中出局，都因為栽到了罰球上，尤其是對陣德國的時候。再舉個最近的例子吧!比如這週末，在場的各位都覺得世界上最重要的事，是國會對伊拉克採取何種行動。但我覺得最重要的事發生在英格蘭。我最喜愛的足球隊，朴茨茅斯隊，對抗助教長卡茄最喜愛的利物浦隊。大約在比賽進行了三分之一的時候，裁判判罰了一個罰球，過會我會告訴你們最後怎麼樣了。請大家注意一下，上周發生的事與這一講有關的，是朴茨茅斯隊對利物浦隊的比賽。主助教卡茄是斯堪的納維亞人，我也很好奇為什麼他要支持利物浦隊，不過我猜他大概這麼拼寫利物浦。接下來，我們來用數字表示。在不同角度踢罰球射門，能夠得分的機率。為了確保每個人都能理解，需要我描述一下大致情況嗎？大家都懂足球吧？有一名隊員會準備起跑，並主罰這個罰球，對方門將站在球門線上，罰球者的目標是射進這個球，知道這些也就夠了。你們都看過足球比賽，對吧？要是你沒看過，你應該去看看。你這輩子該幹的兩件事是，讀莎士比亞的書還有去看場足球比賽。大概的資料如下，一會我會提供更精確的資料，我一會兒會給大家更精確地資料，目前為止這些資料就夠用。罰球隊員可以選擇三種不同射門路徑。他可以選擇左路、中路、右路，我不應該只說他，應該說他或她，如果我以後又沒注意，請大家多多包涵。門將可以選擇撲向左路或者右路，原則上說，門將也可以守在中路不動，我們等會再討論這一點。這邊代表罰球隊員，稱他為射手吧! 這邊代表門將，差不多就是這樣。我先把收益寫一下吧!一會再來解釋。你們會注意到，我會先寫一個正數，然後再寫出它的相反數，收益大概如下：(4,-4)，分別為(4,-4)、(9, -9)、(6, -6)、(6, -6)、(9,-9)和(4, -4)，4在這裡表示進球機率是40%，前提是你從左路射門，而門將也撲向左路。收益u1(l,L)表示門將撲向左路時，罰球者從左路進攻的收益是4，也就是說球被射入球門的機率是40%。對罰球者來說，他的收益是進球的機率，而門將的收益是其相反數。我們把問題簡化一下。正如之前所說的，現在我們先不考慮門將可能選擇留在中路的情況，我們應該如何來分析這個重要的賽局呢？我們可以運用到幾周以前，還是一周以前學到的知識，使用優勢策略的觀點來分析。有哪個參與人有劣勢策略嗎？兩者中的任何一人有劣勢策略嗎？很顯然都沒有。我們先來看看罰球球員，你可能認為中路比左路好，那請你仔細看一下。在門將撲向左路時，從中路射門的收益確實比左路高，如果門將撲向右邊，中路反而不如左路了。因此毫無爭議地說，如果門將撲向左路，你最好選擇從右路射門，其次是從中路射門，最差的選擇是從左路射門，這是門將撲向左路時的情況。如果門將撲向右邊，你最好從左路射門，其次從中路射門，從右路射門是最差的選擇。這些都是常識了吧？好了，如果我們只學了第一周的內容，即如果我們只學到了剔除劣勢策略的話，我們沒招了，我們無法解釋這個賽局。但我之前說了，這是個很重要的賽局，這對賽局理論來說可不是個好消息。幸好我們還可以做更深入的研究。但是開始之前，我想在班上做個調查。有多少人會，假設你為一個球隊效力，比如說是美國國家隊吧!可能有些難以啟齒，沒關係。如果你們為美國隊效力，現在由你們來主罰罰球，而且那是世界盃上一個制勝球，請你們舉手，有多少人選擇從左路射門？有多少人選擇中路？又有多少人選擇右路？看來大家的意見分佈得比較平均。我們假設這些資料都是準確無誤的，我們來分析一下意見如此分佈的原因。我們從何下手呢？我建議用上次的方法，作圖來表示我對門將的策略。存在某種信念下我的預期收益，這和上一講的圖像是一個類型的。橫軸表示的是我的信念，我的信念表示我認為門將撲向右路的機率。和我上次做的一樣，畫兩個縱軸來幫助我們作圖。這裡是0，這裡是1，你們筆記本裡有行，但是黑板上沒有，我只能自己畫了。這裡分別是2、4、6、8、10，標注上2、4、6、8、10，這裡也是2、4、6、8、10，一樣標上2、4、6、8、10，這張圖的框架就畫好了。我們從左路射門這種情況開始分析，我們用紅線表示，我從左路射門而門將也撲向左路時，我的收益是4。如果我從左路射門，而門將不會去撲向右路，也就是說他會撲向左路，此時我的收益是4，也就是說我進球的機率是40%。如果我從左路射門而門將撲向右路，那我有90%的機率進球，即我的收益就是9。順便問一下，為什麼是90%而不是100%？因為我可能會踢飛，這種情況也會經常發生，機率是10%。我們已知兩者之間是線性關係的，所以我們用直線連接兩點，這條線表示什麼？它表示參與人1從左路射門的預期收益，與門將撲向右路的機率有關。同樣的，我們按順序來吧! 如果我選擇從中路射門而門將撲向左路，這種情況下，我的收益是6。如果我從中路射門而門將撲向右路，此時的機率仍然是60%，同樣這也是線性的關係。這條線表示從中路射門時罰球者的收益，是門將撲向右路機率的一個函數。最後，用綠線來表示吧!我們來看看我從右路射門的預期收益。如果我從右路射門而門將撲向左路，我進球的機率是90%，即收益是9。相反，如果我從右路射門而門將撲向右路，我進球的機率是40%，收益是4。這條綠線表示作為一個罰球球員，我從右路射門的收益，是門將撲向右路機率的一個函數。大家都知道我怎麼畫的這個圖了嗎？這比上一講的圖要簡單。從中我們能得出什麼結論？我們首先能得出什麼樣的結論呢？假設這些數字都是真實準確的，你能從這張圖中看出什麼？能把麥克風遞到這裡嗎？艾爾，給穿紅上衣的小夥子，讓他回答。你叫什麼名字？大聲說出來。學生：在6那條線，即從中路射門的線上，任何一點都無法使你獲得較高的收益。教授：很好，完全正確，我希望大家都能從圖中看出來。得出這一點的橫座標是½不難，如果門將撲向右路的機率小於½的時候，此時你的最佳策略用這段綠線表示，即你應該從右路射門。如果門將從右路射門的機率小於½的話，抱歉，是門將撲向右路的機率小於½，你應該從右路射門。相反，如果你認為門將撲向右側的機率大於½的情況下，此時你最佳策略用粉線表示，即從左路射門。也就是說，如果你覺得門將撲向右路的機率大於½的話，你最好選擇從左路射門。在給出的這些資料下，無論你認為門將有多大機率會撲向右路，從中路射門絕對不是一個合理的選擇。我說的沒錯吧!或者換個說法，從中路射門，無論在何種信念下，都不是一個最佳對策。這就是我們得到的結論，尤其是在我們之前講的例子裡。假如你在世界盃的賽場上，你為英格蘭效力，你不單要向隊友和經理人解釋，還要向六千萬的憤怒的球迷解釋你為什麼會這麼做。我們從中得到了什麼結論？我希望大家都清楚結論是什麼。結論是，無論如何千萬不要從中路射門。我來簡單證明一下，德國人就不用聽了，你們愛幹什麼就幹什麼吧! 這週末，在我支持的朴茨茅斯對戰卡茄支持的利物浦的比賽進行1/3時，裁判判罰了一個罰球，朴茨茅斯獲得一個罰球，主罰罰球的球員站在球門前，一腳把球射向中路，門將撲救成功。這個罰球不僅毀了我的大好週末，還讓我錯失了調侃卡茄的機會，真是虧大了。這週末的罰球未射進，絕對是因為罰球球員不懂這個規律。從中可以總結出一個更普遍的規律，這個普遍規律就是，不要選擇一個在任何情況下都不是最佳對策的策略，或者說這個規律就是，不要選擇這樣的策略，不要選擇任何信念下都非最佳對策的策略。我再提一下，上一講最後的結論，強調一下，我並不是說信念是這種形式的，即門將會撲向左路或者門將會撲向右路，它包含了所有可能下的機率。所以，打個比方，這裡也可以包括門將撲向左右兩路機率相同的情況。但任何信念下這麼選都不合理。我們從這個賽局中可以得出，我們能夠剔除其中的一個策略，在本案例中是從中路射門，儘管這裡並沒有劣勢策略。因此，當我們尋找並剔除劣勢策略時，我們是無從下手的。但現在，至少我們有點辦法了，我們至少剔除了從中路射門的策略。現在如果你能讓英格蘭或者朴茨茅斯球員學會這個規律的話，我會非常高興的。在我們結束討論之前，我來強調一下，我們應該回到現實中。這是一個很簡單的足球模型，我來看一下，有人是耶魯足球隊的嗎？沒有啊!有人為自己學院踢球的嗎？有一兩個。有多少人踢過足球啊？多少人踢過足球？好吧，剛才我還有點擔心。在上一講，當我們從一個模型中總結結論的時候，我們應該回過頭重新審視一下，看看我們是不是疏漏了什麼。所以我們也回頭看看，我走下講臺以方便裘德拍攝，我們忽略了什麼嗎？在這個足球的模型中我們忽略了什麼？這是一個賽局的模型，對吧？我們忽略了什麼？為什麼這不是一個絕對準確的模型？準備好麥克風，你來回答吧!你離麥克風很遠，大點聲說。學生：你最好從左路還是右路射門，和你是左撇子還是右撇子有關。教授：很好，我們忽略了這一點，我們忽視了實際上慣用右腳的球員從左路射門會更容易些。罰球球員的左路就是門將的右路，習慣用右腳射門的球員從左路進攻，會更容易把球射入球門，大家都同意這一點吧？有沒有人有過類似的經驗？從另一側擊球更容易發力，在棒球中這個道理也是適用的。從另一側擊球的話，更容易打出大力球。你還有什麼想法？學生：罰球球員事先沒有做好決定，而是見機行事。教授：沒錯，球員在罰罰球之前沒有主意，我覺得這也說得通，對嗎？我們可以認為罰球隊員在球被踢出的瞬間才做出決定，你完全可以在回到更衣室時才做出決定，也可以在中場休息的時候做決定，但最重要的是，希望這討厭的聲音不會再出現了，我覺得這不是從我麥克風裡發出的吧？以防萬一我還是把麥克風調低點吧!因為麥克風調低了，我得大點聲說了。什麼時候做決定不是很重要，直到比賽結束之前，門將都不會知道你會從哪路罰罰球，罰球隊員也不知道門將會撲向哪路，這就好像所有決定都在罰球球員起跑的一瞬間完成的。還有別的想法嗎？請他來說，泰爾，把麥克遞給他吧!請起立，大點聲說。學生：門將可能會在中路等待教授：門將也可能守在中路，當然了，那也是個不錯的選擇，我把這一點從模型中給抽離了。實際上我們一會會回來討論，我準備把這一點作為習題集留給大家。你說的很對，這也是一個關鍵問題。還有嗎？現在我們用真實的資料來和我們的結論比對一下。我列舉的數字都是我很久前編出來的，在我需要在課上引用數字的時候就有了，有人還為此做了調查。實際上剔除了從中路射門，剔除中路會……這些是真實資料，這些資料來自基亞波裡及其同伴一起，發表於《美國經濟評論》的一篇論文，耶魯大學的同學要是想看這篇論文，可以去JSTORE或者圖書館去查閱，如果你感興趣不妨去查閱一下。他們編制了下面這個表格，這會我們稍微嚴謹一點。現在我用反轉的方式表示左右，因為實際上，他們為此做了有關人自然方向與非自然方向的研究。就是說如果你習慣用右腳射門，那麼你從左路攻門就是自然方向，在這裡左路表示自然方向。當然了，如果你是左撇子那剛好相反。但是我要提前強調一下，研究的結果，機率分佈如下：63.6、94.4、89.3和43.7，所以事情不像是……我雖然沒有給出中路的機率，但是我們先不管這些數字到底是誰總結的，我們發現我們走運了。當你從自然方向攻門的時候，你進球的機率會稍微提高，這雖然不能成為劣勢策略，但我們還是能得出一樣的分析結果。實際上這和我編的數字相差也不是很遠，凡事並不總是絕對對稱的嘛!我忘了這是誰說的，但它絕對是真理。門將守在中路的確是個問題，我們會在習題集中研究它。但除此之外還有一個問題，我再來提出一個問題吧!另一個問題是，在你主罰罰球的時候，除了左路右路外還有別的需要考慮嗎？有人要主罰罰球了，他還要考慮什麼別的因素嗎？請那位女士回答，你還要考慮什麼？學生：你可以踢到頂角去教授：你可以選擇罰球的高度，這一點很對，很有道理，但是我指的不是這個。你說的沒錯，但是我想要別的答案，還有別的答案嗎？請這個小夥子來答。學生：踢弧線球教授：這個太高端了，來點正常的。很容易想到的是什麼？更容易讓大家想到的是什麼？把麥克風遞給你前面的同學。學生：球速教授：球速是正解。你還需要考慮，當你主罰罰球時，你是大力抽射還是小力輕擦，踢球的力度與射門的方向，這兩者是同樣重要的。比如你是這樣的一種人，我也不得不承認，我以前也是這種人。如果你是那種能夠大力抽射，但是精準度不高的人，那這些資料對你就不太准了。如果你只會大力抽射，但是缺乏精準，當你射向左路或者右路時，你有可能會射偏。另一方面，如果你射向中路，因為你踢球的力道較大，你反而更容易進球。如果你覺得這些聽起來稀奇古怪，且它們與你毫不相干，那我們就來看看這個圖像吧!以後我們不討論足球了，至少今天是不會討論了。如果你是那種力道很大，但是精準度不高的人，你從右路射門進球的機率可能不會很高，因為你可能會射偏。從左路射門進球的機率也不會很高，你同樣可能會射偏。然而如果你從中路射門，你進球的機率可能會提高，因為你一腳抽射，門將很難撲到它，這是中路射門的情況。如果你仔細看，我可能畫的不是很清楚，你會發現曾經賣傻似的中路射門法，現在竟然一下子變成佔優勢了。請大家看這條虛線，在這兩點中間的範圍內，就是這個小區間內，從中路射門也是個不錯的選擇。所以分析實際情況時要深思熟慮，比如說，我們需要把罰球隊員的射門力度跟精準度考慮在內，如果你們對足球感興趣的話，我發現，大多數美國的同學對此毫無興趣，但是那些美國以外的同學，如果你們對現實中的足球比賽很感興趣，就像我之前說的，我會把文章的詳細內容發佈到網站上。我強調一點，我給你們的資料是真實資料，但它是綜合了各種能力後的資料。這些資料一半來自強隊義大利隊，一半來自弱隊法國隊，天知道它到底有多少是可信的。好了，這就是我們今天的案例，也是我們今日理論聯繫實際的內容，我擦下黑板，然後我們講別的了。我們講點正經事兒，這就是我們今天的案例了。我還是回頭很形式主義地概括一下吧!順便提一下，比賽的結果是0比0，對我來說還算個精神勝利吧! 我想正式地描述一下我之前隨口說的事，尤其是我想給出最佳對策的正式定義。我寫出最佳對策的兩種不同形式定義，一個是參與人針對對手策略的定義，比如這裡的左路右路。另一個強調的是，最佳對策的廣義上的定義，我們接下來要用枯燥的符號表示了。參與人i的策略Ŝi，我把Ŝi帽讀出來是為了讓大家記住，是一個最佳對策，以後簡寫成BR了，是對手的策略S-i的最佳對策。以下我們使用符號表達更方便。如果參與人i在對手的策略S-i下，選Ŝi的收益弱優於其他策略Si'，這對於參與人i的所有si'都適用。在以前的定義中，「對所有的」這個限定詞，修飾的是其他參與人的策略，在這裡修飾的是我的策略。策略Ŝi是其他參與人策略S-i的最佳對策。如果此時我選Ŝi的收益弱優於此情況下選Si'的收益，這對於所有我可以選擇的策略都成立。還有一種書寫方式，可以這樣寫。Ŝi滿足下列情況，它最大化了對手選S-i時我的收益，希望你們都聽懂了，我希望大家都習慣地使用最大化一詞。解最大化問題時，如果其他人選了S-i，我如何最大化自己的收益呢？在座的有數學恐懼症的同學不必驚慌，這僅僅是用數學運算式，來表示我們今天學到的一些知識點罷了，其實是這一講和上一講的知識點。我想讓這個定義更具有普遍性，因為我想讓它適用於更廣義的信念中。我來寫一下，參與人i的策略，和之前一樣，Ŝi是最佳對策，但請注意，它是在你對其他參與人可能採取的策略持信念P時的最佳策略。但是當我們加入了預期之後，這就變得和以前不大一樣了。在參與人i仍持信念P的情況下，她選Ŝi的獲得預期收益，比在同樣的信念P下選其他的策略，獲得的預期收益都要高。最好再加上對於所有可選的Si'均成立，這和以前的概念差不多。唯一的不同就是，我這裡稍微用了一些數學符號，來表述策略帶來的收益與所持信念有關。這裡的收益指的是預期收益，即所持信念下的預期收益。我們也可以換一種方式表達。我從Si選擇可選策略時，Ŝi而非S-i，最大化了我的預期收益。預期收益是什麼意思呢？我來給大家解釋一下什麼是預期收益。比如此案例中，在參與人i持有信念p的情況下，他選擇左路攻門的預期收益等於門將撲向左路的機率，乘以兩人都選擇左路下參與人i的收益，再加上門將撲向右路的機率，乘以門將撲向右路，參與人i左路進攻時參與人i的收益。好了，其實在信念P下的預期和大家理解的預期意思是一樣的，這裡只是稍微用了點數學符號，還有簡單的公式，大家都聽懂了嗎？我就不全都寫下來了。我寫在黑板上的都是那些乏味的定義，我想你們忍受很久了。學生：（聽不清楚）教授：多謝指正，這些看起來就是一些毫無意義的運算式嘛!為了更好地學習這些概念，而不是這些運算式呢!接下來的半小時，我們來聯繫實際情形。雖然接下來的案例不如足球那麼重要，不過它們都是經濟學案例，所以我們可以用經濟學的知識來解讀。我把足球的案例擦掉吧!想一下，如果賽局中加入了合夥人會怎樣？暫且就成為合夥人賽局吧!我記得在沃森寫的教材裡介紹過，或者就是類似的內容，如果你沒聽懂可以回去看課本。大概是這樣的。有兩個實體共同完成一個協作專案，比如說可能是個律師事務所，這兩家公司平分利潤，也就是說這兩家公司互相賺錢。我說錯了，是交叉控股。另外一個例子是，兩名同學為了做作業組成了一個學習小組，總結起來就是兩家公司平分利潤，但是都要各自為協作專案付出努力。我們用正式點的語言來表達吧! 這兩個參與人都是公司的股東，他們都持有公司的股份，他們共同擁有這家公司並且平分利潤，即他們各自持有50%的股份，所以這是種共盈的夥伴關係，每個股東都要選擇為公司投入多少精力。比方說你是個律師，你就要計畫好為公司工作多長時間，對於大多數人來說，就是要決定你每天在公司工作20小時，還是每天工作21小時這樣的問題。你們一起做作業的時候，我希望作業不會消耗你們那麼多時間，比20小時少點就行了吧! 我們用小時數來表示策略吧!用0到4的數字來標記這些策略。你可以從0到4中任選工作的小時數，在繼續前，因為首次遇到它，我強調下。目前為止我們遇到的賽局，每個策略都是不連續的。比如那個數字遊戲，你能從1到100這100個數字中選擇。這裡的策略是連續的，你可以選擇0到4間的任意實數，也就是說你的策略是連續的。這點不是至關重要，但要強調一下。再強調下，是連續的策略空間。原則上，你可以按分鐘或者按秒鐘從你的客戶那裡收取費用，假設這個企業的利潤是已知的。這家合資公司，也就是律師事務所，利潤是按照下面的運算式計算的：4乘以參與人I的付出加參與人II的付出，再加參數B乘以二者付出的成績，這就是利潤運算式。先不討論B。我是說我們先不討論B到底多大，我們照常計算。假設B是0到1/4之間的已知量，我希望一會能改變一下這個資料。這個運算式說明了什麼？說明了參與人I努力工作對公司有利，同理可知，參與人II也一樣。但是二者的合作同樣起到了作用，我們怎麼考慮合作這個問題呢？你們怎麼看B*SI*S2這個運算式？比如你們兩個人交一份作業，你們交上來的只是S1+S2，那你會怎麼想？你會覺得沒有必要組成學習小組了。如果總收益只是投入的和或者倍數，那這樣合作也沒什麼意思了。但是現實是在你和他人合作中，你會獲得額外的收益，這樣合作才有價值，我說得沒錯吧？因此我們可以把合作理解為互補或協同，雖然協同這個詞現在不是很常用了。所以我們假設合作中就要有協同。有人擅長作業裡的一部分內容，別人擅長另外一部分內容。律師事務所也是一樣的。有人是知識產權達人，別人可能處理欺詐案件很有經驗。現在我們有股東、有策略，還知道了企業利潤的計算方法，我還需要告訴你們收益。說一下收益吧!很顯然，參與人I的收益取決於她和合夥人的策略，因為他們兩人平分利潤，所以是½*4(S1+S2+B*S1*S2)。她得到了一半利潤，但她成本是S1平方。也就是說她的投入是S1的平方，這是她的努力成本。由對稱可得，參與人II的收益是一樣的，運算式也是一樣的，只不過我們要減掉S2的平方。你的收益是公司的利潤，減去放棄了休息的負效用。第五排有一個同學可能很缺乏睡眠吧!旁邊的人把他叫醒吧!別拍他了，叫醒他就行。好了，你醒了吧!下次我就用錄影機拍下來了啊!現在我們已經獲得了所有分析此公司，還有分析這個案例原理所需的資訊了。不管你們是一起合作寫作業，還是開律師事務所。為了幫助大家理解，我的意思是，這確實有點程式化了，但是現今大多數企業都是合資企業，他們都類似分配利潤並且協作，因此對於商業來說這是個重要概念，毫無疑問。接下來，我們要用最佳對策的概念來分析了，這對於你們來說應該不陌生了吧!下面我想知道，怎樣計算參與人I在參與人II每個策略下的最佳對策呢？每個s2下參與人I的最佳對策是什麼？我應該如何著手呢？我們之前畫了有關機率的圖像，圖像是在參與人的某個信念下的，但問題是之前參與人II只有兩個策略，所以我們能畫出那個簡單的圖像。門將可以選擇撲向左側或者右側。現在問題是，參與人II的策略是連續的。想要把無限可能性的機率，做成圖都畫在黑板上是不可能的了，我們需要用別的方法。我們怎麼才能找出參與人I的最佳對策？有人回答嗎？請舉手，在角落那裡，給他麥克風，請起立，麥克風到你那裡。我們怎麼做呢？請大聲說，如何找出參與人I的最佳對策？學生：參與人I的收益是參與人II付出的函數教授：很好，這是我們要做的第一步，實際上我們已經得到了那個方程式，這個就是參與人I的收益的方程式。它是參與人I和II策略的函數，我們已經得到了，參與人I的收益是兩人付出的函數。那麼對於某個給定的S2，怎麼計算參與人I的最佳對策呢？學生：求出S1的導數教授：好的，求導。然後呢？學生：令它等於0 教授：很好，下面我們要用到微積分的知識，我們只用單變數微積分的知識就夠了。我們只把S1看為變數，多少人－錄影機先別拍他們了，多少人沒有學過微積分？請大家舉手吧!如果你們沒有見過我將要在板書上寫的運算式，或者說高中畢業你們就忘了，沒關係。課本的後面有一章，我記得是25章，會涵蓋這些內容，你們可以去重溫一下微積分。如果你以前沒有接觸過，或者說你們沒學過類似數學112的課程，來找我求助吧!我可能會開一個微積分速成班，專為沒學過微積分的人準備。如果我接下來的計算對你來說是天書，過來找我!我來幫你想辦法。接下來我們要求導了。下面我們要問問我們自己，選S1下利潤的最大值是多少呢？我先算½乘以4吧!這樣省事兒。利潤是2(S1+S2+B*S1*S2)-S1平方，我們來討論在S2已知的情況下，S1的最大值是多少。就像坐在後排的先生說的那樣，我們要去求導，然後令導數等於0。我差點就寫錯了。你們仔細看著我寫的板書對不對啊! 想要求它的導數，先讓我想想一階條件。好了，我們來求導吧!2還保留，S1求導後是1，這裡的S1會變成B*S2，大家都會吧？S1的平方變成了負2S1，這就是求導過程。我這麼求導大家都會，是吧？這是高中的方法對吧？你們的思維開始運轉了嗎？為了達到一階條件，我說在最佳對策下，在S1上寫個帽，在最佳對策下導數等於0。好的，泰爾，把麥克風給之前的傢伙。學生：為什麼不是2呢？算了，當我沒說。教授：你大聲說出來這點很好，我寫板書的時候容易犯錯誤，這樣我就對它求出導數了。這是一階導數，令它等於0，一會我們就要計算了，但我先確定一下是最大值還是最小值。我怎麼確定是最大值還是最小值呢？我需要求出二階導數，即需要尋找二階條件，我們再次對S1求導，暫時先不要考慮這裡的帽。S1在這裡面就都消掉了，最後只剩下-2了。-2是一個負數，這正是我想要的。最大值處的二階導數是負數，到這裡我滿足了一階條件，我們得出S2的最佳對策是Ŝ1，Ŝ1是這個方程式的解，它滿足一階條件。我們這麼寫，如果我除以2然後整理，可以得出Ŝ1等於1+B*S2，這就是在S2下參與人I的最佳對策。如果我照此計算，同理可得參與人II的－我就不算了，因為都是對稱的。大家都聽明白了嗎？我們能夠同理繼續分析參與人II的，但我們都知道答案是一樣的，同理可得Ŝ2等於1+B*S1，Ŝ2是參與人II的最佳對策，因為它與參與人I的策略S1有關。好了，我們已經找到了參與人I和參與人II互相的最佳對策了，這些是在參與人II有上面的可能策略，同時參與人I有下面的可能策略情況下。接下來我們來看看能不能研究得更深入。我們進一步繪製圖像吧! 下面我們繪製兩個函數圖像，看看圖像是什麼樣的。你們記完筆記了吧？我擦掉了啊!我來換根粉筆好了。好了，我們接下來來繪製圖像。S1是橫軸，S2是縱軸，參與人I有1一直到4的可選策略，這條是45°線，我好好畫一下，這樣會準確點。參與人I的可選策略從1一直到4，接著畫之前先來看看B是多少。好的，我們要畫這個案例的圖像，我要在圖中畫出參與人I的最佳對策，一會還要畫出參與人II的最佳對策。在這裡B等於1/4，我們之前也說過，B在0到1/4之間，這裡我們繪製B=1/4的情況吧!首先我們想要繪製的運算式是，參與人I的最佳對策是S2的函數，我們都知道它等於1+S2/4。對於任意定義域內的S2，我用紅色來表示參與人I的最佳對策，參與人II選0時，I的最佳對策是什麼？誰來說一下？學生：是1 教授：因為1+0/4=1，參與人II選0時I的最佳對策是1。要是參與人II選4了呢？此時參與人I的最佳對策是什麼呢？這回就是1+4/4，即1+1=2。所以此時參與人II的最佳對策是2。如果參與人I選4，參與人II要－說錯了，是參與人II選4而I選2，這兩點之間是一條直線。我畫的這條線表明，參與人I的最佳對策取決於參與人II的策略，大家看懂我畫的了嗎？我假設大家都認為它是直線了，但這確實是條直線。這個圖的作用是，給定一個S2，找到粉線對應的座標，然後就能找出參與人I的最佳對策，同理也可以畫出參與人II的圖像。參與人II的最佳對策取決於參與人I的策略，不用任何數學的方法，我就知道圖像是什麼樣的了。有人能舉手回答它是什麼樣的嗎？在同一個圖像裡面怎麼表示？參與人II的最佳對策是I策略的函數，找個沒回答過問題的人吧!他們之前回答過了，換個人。能不能把麥克遞給中間的小夥子？你從那邊過去好像容易些。大聲說，讓大家都聽清楚。學生：它關於45°線是對稱的。教授：沒錯，如果我畫了參與人II的圖像，即參與人II的最佳策略是SI的函數，我們只需要調換一下參與人，因為它們是關於45°線對稱的。他經過1到2這兩點，如圖所示，這就是在任意參與人I的可選策略下，參與人II的最佳對策。為了讓大家都明白，這條藍色線表示給定一個S1，即參與人I的付出。通過查找藍色的線，可以得出參與人II的最佳對策。好了，現在我們學到東西了。回憶一下今天學到的結論。結論二－結論一是不要從中路射門，第二個更普遍的結論是什麼？不要採用非最佳對策的策略。我承認我偷懶了，因為我忽略了信念，但請大家相信在這個賽局裡面是可以的。這些策略都不會成為最佳對策嗎？換句話說，參與人I的哪些策略永遠不會成為最佳對策。有人知道嗎？那我們來看一下吧! 參與人II選0時，參與人I最佳對策是1，這是最小值了。參與人I的小於1的策略，永遠都不會成為最佳對策。如果參與人II選4，協同導致參與人I的最佳對策變成2，參與人I的那些大於2的策略，也永遠不會成為最佳對策，對不對？也就是說，小於1及大於2的策略，都不是參與人I的最佳對策。同理，參與人I最低只能選0，此時參與人II應該會選1，小於1的策略不是參與人I的最佳對策，大於2的也不是參與人II的最佳對策。所以我們乾脆點，在筆記本上，你們動作輕點，我直接在劃掉這些非最佳對策的策略。參與人I的這些策略被剔除了，參與人I的這些策略也被剔除了，你們可能不太喜歡筆記太亂吧？參與人II的這些策略被剔除了，參與人II的這些策略也被剔除了，劃掉的都剔除後，最後剩什麼了？如果你們仔細觀察，會發現還剩一個小方格，我剔除了所有策略，所有非參與人I最佳對策的策略，還有非參與人II最佳對策的策略，最後只剩下了這個小方格。但是現在這個小方格看不太清楚，接下來我重新畫一下這個小方格，我們一起重新畫一下，從1到2，我把這個小方格畫大一點。這一點是(1,1)，上面這點是(2,2)，接下來我們把精度提高到1/4。這裡分別是5/4、6/4、7/4，我們在方格內填充粉色和藍色的線，這是那個小方格的放大圖。這些線如圖所示，粉色的線從這一點到這一點，藍色的線從這一點到這一點，大家回家後可以仔細畫一下。但並非意味著黑板上的不對。我只是把之前的圖像給放大了。有人見過這個圖嗎？誰以前見過這個圖啊？除了座標變了，其他的和以前一樣。一旦剔除了非最佳對策的策略，仔細研究剩下的策略時，圖像還和以前看起來是一樣的。儘管座標改變了，圖像放大了，目前為止我們學到了什麼呢？我們學到了參與人不應該選擇非最佳對策的策略，應該剔除它們。最後剩下什麼呢？接下來怎麼辦？這些沒有被剔除的策略，是某種情況下的最佳對策，但剩餘的最佳對策現在可能也要被剔除，是這樣吧？這和我們之前學過的迭代剔除劣勢策略類似。我要剔除的策略，並非都不是最佳對策，它們可能是某種情況下的最佳對策。我們都知道使他們成為最佳對策的策略，是不會有人採用的，因為這些策略本身又不是最佳對策。我能想到什麼樣的策略呢？我還要剔除掉哪些策略？舉個例子吧!參與人I知道參與人II不會選小於1的策略，所以參與人II最低只會選策略1，也就是說參與人II在任何情況下，只會選1及以上的策略，這樣參與人I不會選小於5/4的策略。參與人II最大只會選策略2，參與人I針對這種情況下，最大只會選擇6/4，即大於6/4的策略也會被剔除。我們注意一下，我現在剔除掉的策略，他們並非不是最佳對策，他們是某些情況下的最佳對策，但是使他們成為最佳對策的條件是不會發生的，所以它們就不成立。這樣我們又剔除了參與人小於5/4大於6/4的策略，參與人I只有1½的區間。同理可證，參與人II，如果我再進行一次，別在筆記上亂畫，我們只是想知道最後會怎樣，因為這些策略不會被人採用，所以我剔除掉它們。最後我得到了一個更小的方格。大家看清楚了嗎？剛開始，我發現了參與人I的最佳對策取決於參與人II的可選策略，同時也發現，參與人II的最佳對策取決於參與人I的可選策略。我剔除了非最佳對策的策略，然後我看看還剩下哪些策略，這些策略是已被我們的剔除策略的最佳對策，但仍不是最佳對策，我就剔除它們。剔除之後，我得到了更小的方格，我可以一次一次的重複這個過程。如果我不斷重複這個過程呢？最後結果會是怎麼樣的？大聲說，結果是什麼？會是一個交點對嗎？如果我不斷縮小這個方格，下一個方格會是這樣的，我就不去畫了，道理是一樣的。如果你不斷縮小方格，最後就會只剩交點了。如果我們知道人們不會採用最佳對策，說錯了，是不會採用非最佳對策，如果我們知道人們不會採用非最佳對策的策略，就知道人們不會採用非最佳對策的策略，以此類推了。這個賽局最後會歸為一點，每個人只有一個策略，就是交點處。交點的橫座標是S1，暫且這麼叫吧!S1*=1+BS2*，而S2*=1+BS1。實際上我們能得出更多，因為我們知道這個賽局是對稱的。我們知道S1*=S2，我們利用S1=S2這個等式，這由S1和S2關於45°線對稱可以得出，這樣用S1*=S2*可以簡化了。最後，實際上是看似三個方程式，實則只有兩個方程式，因為其中一個暗示了另一個。我們都會解這個方程式，如果解完方程式，我們會得到－我得仔細點別算錯，我們會得到1-BS1*=1，或S1*=S2*=1/(1-B)。還有，每回我在黑板上演算，你們都幫我檢查一下，看看有沒有算錯，這次算對了嗎？我覺得對。我代數總是算錯。最後解是S1*=S2*=1/(1-B)，剛才的只不過是無聊的數學運算，我剛才就是為瞭解方程式。從中我們能學到什麼呢？我們學到了，在剔除非最佳對策的策略後，要再剔除那些在對手最佳對策下不是最佳對策的策略，以此類推，最後每個參與人都只有一個策略了。每個參與人只有一個策略，而那個策略是這個方程式的解。如果我們是麥肯錫公司的管理顧問，或者給你們的作業提出點好的建議，或者對於現實中的律師事務所，我們都能夠預測出來，你可能會投入多少工作量。問題是，這個工作量是不是最優的工作量呢？你是在為麥肯錫工作，你被喬史密斯和安博客錄用，幫他們尋找合理策略，或者在學習小組裡一起做作業，你能算出來他們會投入多少工作量，但這個工作量合適嗎？是太多了還是太少了呢？怎麼來回答？要依據什麼呢？讓我換個表達方式吧!這些企業合夥人，或者兩個共同協作做作業的同學，他們是否實現了最優效率了呢？我們做一個調查吧!誰覺得超越了？請把錄影機對準觀眾。我們來看看，誰覺得超越了？誰覺得剛好達到？誰覺得未達到？好多人棄權了啊!我認為他們沒有達到最優效率，我讓你們回去做一次作業，你們就都明白了。事實上你會發現，如果有書面合同，或者有個規劃師的話，人們會超常發揮，我們來看看為什麼。為什麼這些律師事務所的律師、醫療合夥人或者其他類似的機構，還有一起做作業的學生，當我們研究過這些策略和賽局後，為何這樣的組合往往是收效甚微的？我來說個答案吧!我告訴大家，因為你們都想少幹活，人們因為什麼才會努力工作呢？有人知道嗎？把麥克風給他。學生：因為我們知道如果自己超額完成工作，其他人就可以少做點工作了。教授：沒錯，說得很有道理，但是你說的東西離題了。我的意思是，你給出的原因是一種囚徒困境，言外之意就是，我工作了其他人就偷懶，我覺得這裡有別的原因。更深層次的原因會是什麼呢？你說的我覺得是個好的開端，這裡面還有什麼別的原因嗎？學生：如果有兩個人一起工作，每個人大約只需要做工作量的一半。教授：說得沒錯，但這和偷懶沒什麼關係啊!這到底是怎麼回事？回顧一下經濟學115或者150，如果你們有人學過這些課的話，這裡潛在的問題到底是什麼呢？請那個穿粉紅色衣服的同學說一下。學生：他們只能得到50%的邊際收益教授：說對了，你叫什麼？學生：派翠克。教授：我認為派翠克說出了正確答案。這裡的問題不在於工作量多少，順便說一句，它和協同也沒什麼關係。你可能認為，這是因為他們沒有正確的考慮協同的作用，這不是問題所在。事實證明，即使沒有協同，此問題依舊存在。就像派翠克說的，問題出在邊際量上了。我是這家公司的員工，無論是律師事務所還是學習小組，我參與其中並承擔了邊際成本，我每多出一份力就多承擔等量邊際成本，但我只能獲得一半的好處。從邊際角度分析，我承擔了多付出的全部邊際成本，但我卻只能得到一半的邊際收益，因為利潤是均分的。這會導致大家都減少付出，經濟學裡與之有關的通用術語叫什麼？叫外部性，這裡邊存在了外部性。外部性。當我計算要為公司付出多少時，我沒考慮到利潤的一半會歸你所有，這和協同沒有什麼關係，這也不是什麼複雜的理論，它就是你們在經濟學115裡學到的知識。如果你是一個公司的股東，或者和別人一起做作業及其他合作專案，你們需要注意到，因為外部性，實際上每個人都付出了較少的努力，我的付出不僅使我受益了。雖然在板書上寫了，但再深入思考下，如果我們改變了協同的程度會怎樣？我們降低B的值會如何？B表示這些參與人之間的協同程度。如果我把B的值降低，圖像會怎麼變？我們重新畫一張清晰地圖像，圖像會是這樣子的。這是S1，這是S2。如果我們降低了協同度，在這種情況下，結果會是什麼樣的呢？圖像會變成什麼樣？誰知道？這是經濟學115的習題。我們要移動這些直線，你是不是叫亨利？把麥克風給他。學生：直線會變得更平緩，最後會分別變成水平和垂直兩種情況。教授：說得很好，但粉色的線會變陡峭，我理解你說的意思了。粉色的線最後會趨向垂直，藍色的線最後會趨向水平，請大家注意下，我們付出的努力會朝這個方向大幅減少。如果我們減少協同參數，不但我會少付出努力，而且你也知道我會少付出努力，因此你也會少付出努力，以此類推，最後會導致了剪刀效應。我們要從中吸取教訓，所以我們還是要繼續挖掘一下。在這個賽局中我們通過尋找最佳對策，剔除非最佳對策來做出決策，重新審視，繼續剔除非最佳對策然後以此類推。還好這個賽局中出現了交點，粉色的線和藍色的線交於一點，這個點叫什麼呢？藍粉兩線的交點叫什麼？這是這一講的重要結論，這一點就是傳說中的納什均衡。現在知道它叫什麼了。有多少人聽說過納什均衡？誰看過有關納什的影片？我們在下一講會繼續探討這個問題的，這就是納什均衡了，是個術語，而且這個知識點是相當重要的。因為你們大多數人之前都學過經濟學，而且都知道經濟學的交點都很重要，但這個交點說明了什麼呢？這和那條線有什麼關聯呢？粉色的線和藍色的線相交說明什麼？這一點有什麼特別的意義？這兩條線相交到底說明了什麼？請倒數第三排的紫衣人回答，請大點聲說。學生：意味著每個參與人都不想偏離那一點教授：正解。我們再從頭到尾看一遍。請問你叫什麼名字？學生：艾倫教授：艾倫認為，如果參與人I採取這個策略，而參與人II採取了相應的策略時，沒有人想要改變這種狀況。換句話說，沒有參與人想要採取別的策略了。所以當參與人I選擇S1*時，參與人II就會選擇最佳對策S2，如果參與人II選擇S2，參與人I就會選最佳對策S1，沒有人想要偏離這一點。簡單來說，參與人I和參與人II，在這兩條線的交點處，互相都採用的是最佳對策。參與人們都採用了自己的最佳對策，雙方都採用了各自的最佳對策，很顯然在這個賽局裡就是兩條線的交點。我們回到之前玩的數字遊戲，每個人都必須選擇一個號碼，贏家是所選數最接近平均數2/3的人。順便說下，贏家的獎金未必是那麼多，但也可能就是那麼多。那個數字遊戲中的納什均衡是什麼？是每個人都選擇1。我們怎麼知道1是納什均衡呢？我們怎麼知道在那個數字遊戲中，選擇1就是這個賽局的均衡呢？我們來下定義。如果每人都選1，平均數就是1，平均數的2/3是2/3，1是最小值，所以每個人的最佳對策就是選擇1。重複一下，如果每個人都選了1，那麼每個人的最佳對策也就是1，這就會成為納什均衡。誰在做這個遊戲時就想到納什均衡了嗎？我覺得絕對沒有人會。但是注意下，如果我們重複賽局會怎樣呢？當我們不斷地重複賽局，我們會發現最後會不斷接近1，沒錯吧？當我們反覆分析這個賽局，我們的分析最後會趨近均衡，雖然這不總會發生，但這也是納什均衡的一個亮點。有時結果會趨近這一點，納什均衡是現在直到期中的重點內容，週三我們會學習更多的有關案例。 2007年9月17日 *****