在足球運動及商業夥伴關係中的最佳對策

講座四

我們繼續上堂課的概念,即我們認為別人會怎麼做時所採取的最佳對策是什麼。我們特別發展出一個概念就是,不要選擇在任何信念下都非最佳對策的策略。我們用這種概念來分析足球運動中的罰球。然後,我們用它來分析一個利潤分享的夥伴關係。課程最後,我們介紹一個新概念:納許均衡。

講座四:在足球運動及商業夥伴關係中的最佳對策

    Ben Polak 教授:上一講我們引入了一個新概念,這個新概念就是最佳對策。這是什麼意思呢?在你已經對別人如何行動有一定信念時,你能想到的最佳的策略。你的對手會怎麼做,其他人又會怎麼做,你可以把它看成,你可以把這個信念理解成讓你的策略合理化的理由。所以如果你為別人打工,你的老闆問你為什麼做出這樣的選擇,如果你針對自己的信念做出了最佳對策,你就可以說,我之所以這麼做,是因為我認為其他人會那麼做,因為那的確是在這種信念下的最佳策略,你也就不會因此被炒魷魚了。 我說過今天我們將討論全世界最重要的一個賽事,正如我上次所說的,它就是罰球。所以這是一個有關足球的賽局。我先告訴在座不是球迷的同學,為什麼說這個很重要,因為上屆世界盃冠軍就是罰球決定的。拿英格蘭做例子吧!英格蘭每次在世界盃或者歐洲盃中出局,都因為栽到了罰球上,尤其是對陣德國的時候。再舉個最近的例子吧!比如這週末,在場的各位都覺得世界上最重要的事,是國會對伊拉克採取何種行動。但我覺得最重要的事發生在英格蘭。我最喜愛的足球隊,朴茨茅斯隊,對抗助教長卡茄最喜愛的利物浦隊。大約在比賽進行了三分之一的時候,裁判判罰了一個罰球,過會我會告訴你們最後怎麼樣了。請大家注意一下,上周發生的事與這一講有關的,是朴茨茅斯隊對利物浦隊的比賽。主助教卡茄是斯堪的納維亞人,我也很好奇為什麼他要支持利物浦隊,不過我猜他大概這麼拼寫利物浦。 接下來,我們來用數字表示。在不同角度踢罰球射門,能夠得分的機率。為了確保每個人都能理解,需要我描述一下大致情況嗎?大家都懂足球吧?有一名隊員會準備起跑,並主罰這個罰球,對方門將站在球門線上,罰球者的目標是射進這個球,知道這些也就夠了。你們都看過足球比賽,對吧?要是你沒看過,你應該去看看。你這輩子該幹的兩件事是,讀莎士比亞的書還有去看場足球比賽。 大概的資料如下,一會我會提供更精確的資料,我一會兒會給大家更精確地資料,目前為止這些資料就夠用。罰球隊員可以選擇三種不同射門路徑。他可以選擇左路、中路、右路,我不應該只說他,應該說他或她,如果我以後又沒注意,請大家多多包涵。門將可以選擇撲向左路或者右路,原則上說,門將也可以守在中路不動,我們等會再討論這一點。這邊代表罰球隊員,稱他為射手吧! 這邊代表門將,差不多就是這樣。我先把收益寫一下吧!一會再來解釋。你們會注意到,我會先寫一個正數,然後再寫出它的相反數,收益大概如下:(4,-4),分別為(4,-4)、(9, -9)、(6, -6)、(6, -6)、(9,-9)和(4, -4),4在這裡表示進球機率是40%,前提是你從左路射門,而門將也撲向左路。收益u1(l,L)表示門將撲向左路時,罰球者從左路進攻的收益是4,也就是說球被射入球門的機率是40%。 對罰球者來說,他的收益是進球的機率,而門將的收益是其相反數。我們把問題簡化一下。正如之前所說的,現在我們先不考慮門將可能選擇留在中路的情況,我們應該如何來分析這個重要的賽局呢?我們可以運用到幾周以前,還是一周以前學到的知識,使用優勢策略的觀點來分析。有哪個參與人有劣勢策略嗎?兩者中的任何一人有劣勢策略嗎?很顯然都沒有。 我們先來看看罰球球員,你可能認為中路比左路好,那請你仔細看一下。在門將撲向左路時,從中路射門的收益確實比左路高,如果門將撲向右邊,中路反而不如左路了。因此毫無爭議地說,如果門將撲向左路,你最好選擇從右路射門,其次是從中路射門,最差的選擇是從左路射門,這是門將撲向左路時的情況。如果門將撲向右邊,你最好從左路射門,其次從中路射門,從右路射門是最差的選擇。這些都是常識了吧? 好了,如果我們只學了第一周的內容,即如果我們只學到了剔除劣勢策略的話,我們沒招了,我們無法解釋這個賽局。但我之前說了,這是個很重要的賽局,這對賽局理論來說可不是個好消息。幸好我們還可以做更深入的研究。但是開始之前,我想在班上做個調查。有多少人會,假設你為一個球隊效力,比如說是美國國家隊吧!可能有些難以啟齒,沒關係。如果你們為美國隊效力,現在由你們來主罰罰球,而且那是世界盃上一個制勝球,請你們舉手,有多少人選擇從左路射門?有多少人選擇中路?又有多少人選擇右路? 看來大家的意見分佈得比較平均。我們假設這些資料都是準確無誤的,我們來分析一下意見如此分佈的原因。我們從何下手呢?我建議用上次的方法,作圖來表示我對門將的策略。存在某種信念下我的預期收益,這和上一講的圖像是一個類型的。 橫軸表示的是我的信念,我的信念表示我認為門將撲向右路的機率。和我上次做的一樣,畫兩個縱軸來幫助我們作圖。這裡是0,這裡是1,你們筆記本裡有行,但是黑板上沒有,我只能自己畫了。這裡分別是2、4、6、8、10,標注上2、4、6、8、10,這裡也是2、4、6、8、10,一樣標上2、4、6、8、10,這張圖的框架就畫好了。 我們從左路射門這種情況開始分析,我們用紅線表示,我從左路射門而門將也撲向左路時,我的收益是4。如果我從左路射門,而門將不會去撲向右路,也就是說他會撲向左路,此時我的收益是4,也就是說我進球的機率是40%。如果我從左路射門而門將撲向右路,那我有90%的機率進球,即我的收益就是9。順便問一下,為什麼是90%而不是100%?因為我可能會踢飛,這種情況也會經常發生,機率是10%。 我們已知兩者之間是線性關係的,所以我們用直線連接兩點,這條線表示什麼?它表示參與人1從左路射門的預期收益,與門將撲向右路的機率有關。同樣的,我們按順序來吧! 如果我選擇從中路射門而門將撲向左路,這種情況下,我的收益是6。如果我從中路射門而門將撲向右路,此時的機率仍然是60%,同樣這也是線性的關係。這條線表示從中路射門時罰球者的收益,是門將撲向右路機率的一個函數。 最後,用綠線來表示吧!我們來看看我從右路射門的預期收益。如果我從右路射門而門將撲向左路,我進球的機率是90%,即收益是9。相反,如果我從右路射門而門將撲向右路,我進球的機率是40%,收益是4。這條綠線表示作為一個罰球球員,我從右路射門的收益,是門將撲向右路機率的一個函數。 大家都知道我怎麼畫的這個圖了嗎?這比上一講的圖要簡單。從中我們能得出什麼結論?我們首先能得出什麼樣的結論呢?假設這些數字都是真實準確的,你能從這張圖中看出什麼?能把麥克風遞到這裡嗎?艾爾,給穿紅上衣的小夥子,讓他回答。你叫什麼名字?大聲說出來。 學生:在6那條線,即從中路射門的線上,任何一點都無法使你獲得較高的收益。 教授:很好,完全正確,我希望大家都能從圖中看出來。得出這一點的橫座標是½不難,如果門將撲向右路的機率小於½的時候,此時你的最佳策略用這段綠線表示,即你應該從右路射門。如果門將從右路射門的機率小於½的話,抱歉,是門將撲向右路的機率小於½,你應該從右路射門。 相反,如果你認為門將撲向右側的機率大於½的情況下,此時你最佳策略用粉線表示,即從左路射門。也就是說,如果你覺得門將撲向右路的機率大於½的話,你最好選擇從左路射門。在給出的這些資料下,無論你認為門將有多大機率會撲向右路,從中路射門絕對不是一個合理的選擇。我說的沒錯吧!或者換個說法,從中路射門,無論在何種信念下,都不是一個最佳對策。 這就是我們得到的結論,尤其是在我們之前講的例子裡。假如你在世界盃的賽場上,你為英格蘭效力,你不單要向隊友和經理人解釋,還要向六千萬的憤怒的球迷解釋你為什麼會這麼做。我們從中得到了什麼結論?我希望大家都清楚結論是什麼。結論是,無論如何千萬不要從中路射門。我來簡單證明一下,德國人就不用聽了,你們愛幹什麼就幹什麼吧! 這週末,在我支持的朴茨茅斯對戰卡茄支持的利物浦的比賽進行1/3時,裁判判罰了一個罰球,朴茨茅斯獲得一個罰球,主罰罰球的球員站在球門前,一腳把球射向中路,門將撲救成功。這個罰球不僅毀了我的大好週末,還讓我錯失了調侃卡茄的機會,真是虧大了。這週末的罰球未射進,絕對是因為罰球球員不懂這個規律。 從中可以總結出一個更普遍的規律,這個普遍規律就是,不要選擇一個在任何情況下都不是最佳對策的策略,或者說這個規律就是,不要選擇這樣的策略,不要選擇任何信念下都非最佳對策的策略。我再提一下,上一講最後的結論,強調一下,我並不是說信念是這種形式的,即門將會撲向左路或者門將會撲向右路,它包含了所有可能下的機率。所以,打個比方,這裡也可以包括門將撲向左右兩路機率相同的情況。 但任何信念下這麼選都不合理。我們從這個賽局中可以得出,我們能夠剔除其中的一個策略,在本案例中是從中路射門,儘管這裡並沒有劣勢策略。因此,當我們尋找並剔除劣勢策略時,我們是無從下手的。但現在,至少我們有點辦法了,我們至少剔除了從中路射門的策略。現在如果你能讓英格蘭或者朴茨茅斯球員學會這個規律的話,我會非常高興的。 在我們結束討論之前,我來強調一下,我們應該回到現實中。這是一個很簡單的足球模型,我來看一下,有人是耶魯足球隊的嗎?沒有啊!有人為自己學院踢球的嗎?有一兩個。有多少人踢過足球啊?多少人踢過足球?好吧,剛才我還有點擔心。在上一講,當我們從一個模型中總結結論的時候,我們應該回過頭重新審視一下,看看我們是不是疏漏了什麼。所以我們也回頭看看,我走下講臺以方便裘德拍攝,我們忽略了什麼嗎?在這個足球的模型中我們忽略了什麼?這是一個賽局的模型,對吧?我們忽略了什麼?為什麼這不是一個絕對準確的模型?準備好麥克風,你來回答吧!你離麥克風很遠,大點聲說。 學生:你最好從左路還是右路射門,和你是左撇子還是右撇子有關。 教授:很好,我們忽略了這一點,我們忽視了實際上慣用右腳的球員從左路射門會更容易些。罰球球員的左路就是門將的右路,習慣用右腳射門的球員從左路進攻,會更容易把球射入球門,大家都同意這一點吧?有沒有人有過類似的經驗?從另一側擊球更容易發力,在棒球中這個道理也是適用的。從另一側擊球的話,更容易打出大力球。你還有什麼想法? 學生:罰球球員事先沒有做好決定,而是見機行事。 教授:沒錯,球員在罰罰球之前沒有主意,我覺得這也說得通,對嗎?我們可以認為罰球隊員在球被踢出的瞬間才做出決定,你完全可以在回到更衣室時才做出決定,也可以在中場休息的時候做決定,但最重要的是,希望這討厭的聲音不會再出現了,我覺得這不是從我麥克風裡發出的吧?以防萬一我還是把麥克風調低點吧!因為麥克風調低了,我得大點聲說了。什麼時候做決定不是很重要,直到比賽結束之前,門將都不會知道你會從哪路罰罰球,罰球隊員也不知道門將會撲向哪路,這就好像所有決定都在罰球球員起跑的一瞬間完成的。還有別的想法嗎?請他來說,泰爾,把麥克遞給他吧!請起立,大點聲說。 學生:門將可能會在中路等待 教授:門將也可能守在中路,當然了,那也是個不錯的選擇,我把這一點從模型中給抽離了。實際上我們一會會回來討論,我準備把這一點作為習題集留給大家。你說的很對,這也是一個關鍵問題。還有嗎?現在我們用真實的資料來和我們的結論比對一下。我列舉的數字都是我很久前編出來的,在我需要在課上引用數字的時候就有了,有人還為此做了調查。 實際上剔除了從中路射門,剔除中路會……這些是真實資料,這些資料來自基亞波裡及其同伴一起,發表於《美國經濟評論》的一篇論文,耶魯大學的同學要是想看這篇論文,可以去JSTORE或者圖書館去查閱,如果你感興趣不妨去查閱一下。他們編制了下面這個表格,這會我們稍微嚴謹一點。現在我用反轉的方式表示左右,因為實際上,他們為此做了有關人自然方向與非自然方向的研究。就是說如果你習慣用右腳射門,那麼你從左路攻門就是自然方向,在這裡左路表示自然方向。當然了,如果你是左撇子那剛好相反。 但是我要提前強調一下,研究的結果,機率分佈如下:63.6、94.4、89.3和43.7,所以事情不像是……我雖然沒有給出中路的機率,但是我們先不管這些數字到底是誰總結的,我們發現我們走運了。當你從自然方向攻門的時候,你進球的機率會稍微提高,這雖然不能成為劣勢策略,但我們還是能得出一樣的分析結果。實際上這和我編的數字相差也不是很遠,凡事並不總是絕對對稱的嘛!我忘了這是誰說的,但它絕對是真理。 門將守在中路的確是個問題,我們會在習題集中研究它。但除此之外還有一個問題,我再來提出一個問題吧!另一個問題是,在你主罰罰球的時候,除了左路右路外還有別的需要考慮嗎?有人要主罰罰球了,他還要考慮什麼別的因素嗎?請那位女士回答,你還要考慮什麼? 學生:你可以踢到頂角去 教授:你可以選擇罰球的高度,這一點很對,很有道理,但是我指的不是這個。你說的沒錯,但是我想要別的答案,還有別的答案嗎?請這個小夥子來答。 學生:踢弧線球 教授:這個太高端了,來點正常的。很容易想到的是什麼?更容易讓大家想到的是什麼?把麥克風遞給你前面的同學。 學生:球速 教授:球速是正解。你還需要考慮,當你主罰罰球時,你是大力抽射還是小力輕擦,踢球的力度與射門的方向,這兩者是同樣重要的。比如你是這樣的一種人,我也不得不承認,我以前也是這種人。如果你是那種能夠大力抽射,但是精準度不高的人,那這些資料對你就不太准了。如果你只會大力抽射,但是缺乏精準,當你射向左路或者右路時,你有可能會射偏。另一方面,如果你射向中路,因為你踢球的力道較大,你反而更容易進球。 如果你覺得這些聽起來稀奇古怪,且它們與你毫不相干,那我們就來看看這個圖像吧!以後我們不討論足球了,至少今天是不會討論了。如果你是那種力道很大,但是精準度不高的人,你從右路射門進球的機率可能不會很高,因為你可能會射偏。從左路射門進球的機率也不會很高,你同樣可能會射偏。然而如果你從中路射門,你進球的機率可能會提高,因為你一腳抽射,門將很難撲到它,這是中路射門的情況。如果你仔細看,我可能畫的不是很清楚,你會發現曾經賣傻似的中路射門法,現在竟然一下子變成佔優勢了。 請大家看這條虛線,在這兩點中間的範圍內,就是這個小區間內,從中路射門也是個不錯的選擇。所以分析實際情況時要深思熟慮,比如說,我們需要把罰球隊員的射門力度跟精準度考慮在內,如果你們對足球感興趣的話,我發現,大多數美國的同學對此毫無興趣,但是那些美國以外的同學,如果你們對現實中的足球比賽很感興趣,就像我之前說的,我會把文章的詳細內容發佈到網站上。 我強調一點,我給你們的資料是真實資料,但它是綜合了各種能力後的資料。這些資料一半來自強隊義大利隊,一半來自弱隊法國隊,天知道它到底有多少是可信的。好了,這就是我們今天的案例,也是我們今日理論聯繫實際的內容,我擦下黑板,然後我們講別的了。我們講點正經事兒,這就是我們今天的案例了。我還是回頭很形式主義地概括一下吧!順便提一下,比賽的結果是0比0,對我來說還算個精神勝利吧! 我想正式地描述一下我之前隨口說的事,尤其是我想給出最佳對策的正式定義。我寫出最佳對策的兩種不同形式定義,一個是參與人針對對手策略的定義,比如這裡的左路右路。另一個強調的是,最佳對策的廣義上的定義,我們接下來要用枯燥的符號表示了。 參與人i的策略Ŝi,我把Ŝi帽讀出來是為了讓大家記住,是一個最佳對策,以後簡寫成BR了,是對手的策略S-i的最佳對策。以下我們使用符號表達更方便。如果參與人i在對手的策略S-i下,選Ŝi的收益弱優於其他策略Si',這對於參與人i的所有si'都適用。在以前的定義中,「對所有的」這個限定詞,修飾的是其他參與人的策略,在這裡修飾的是我的策略。 策略Ŝi是其他參與人策略S-i的最佳對策。如果此時我選Ŝi的收益弱優於此情況下選Si'的收益,這對於所有我可以選擇的策略都成立。還有一種書寫方式,可以這樣寫。Ŝi滿足下列情況,它最大化了對手選S-i時我的收益,希望你們都聽懂了,我希望大家都習慣地使用最大化一詞。解最大化問題時,如果其他人選了S-i,我如何最大化自己的收益呢?在座的有數學恐懼症的同學不必驚慌,這僅僅是用數學運算式,來表示我們今天學到的一些知識點罷了,其實是這一講和上一講的知識點。 我想讓這個定義更具有普遍性,因為我想讓它適用於更廣義的信念中。我來寫一下,參與人i的策略,和之前一樣,Ŝi是最佳對策,但請注意,它是在你對其他參與人可能採取的策略持信念P時的最佳策略。但是當我們加入了預期之後,這就變得和以前不大一樣了。在參與人i仍持信念P的情況下,她選Ŝi的獲得預期收益,比在同樣的信念P下選其他的策略,獲得的預期收益都要高。最好再加上對於所有可選的Si'均成立,這和以前的概念差不多。唯一的不同就是,我這裡稍微用了一些數學符號,來表述策略帶來的收益與所持信念有關。這裡的收益指的是預期收益,即所持信念下的預期收益。 我們也可以換一種方式表達。我從Si選擇可選策略時,Ŝi而非S-i,最大化了我的預期收益。預期收益是什麼意思呢?我來給大家解釋一下什麼是預期收益。比如此案例中,在參與人i持有信念p的情況下,他選擇左路攻門的預期收益等於門將撲向左路的機率,乘以兩人都選擇左路下參與人i的收益,再加上門將撲向右路的機率,乘以門將撲向右路,參與人i左路進攻時參與人i的收益。好了,其實在信念P下的預期和大家理解的預期意思是一樣的,這裡只是稍微用了點數學符號,還有簡單的公式,大家都聽懂了嗎?我就不全都寫下來了。我寫在黑板上的都是那些乏味的定義,我想你們忍受很久了。 學生:(聽不清楚) 教授:多謝指正,這些看起來就是一些毫無意義的運算式嘛!為了更好地學習這些概念,而不是這些運算式呢!接下來的半小時,我們來聯繫實際情形。雖然接下來的案例不如足球那麼重要,不過它們都是經濟學案例,所以我們可以用經濟學的知識來解讀。我把足球的案例擦掉吧!想一下,如果賽局中加入了合夥人會怎樣?暫且就成為合夥人賽局吧!我記得在沃森寫的教材裡介紹過,或者就是類似的內容,如果你沒聽懂可以回去看課本。 大概是這樣的。有兩個實體共同完成一個協作專案,比如說可能是個律師事務所,這兩家公司平分利潤,也就是說這兩家公司互相賺錢。我說錯了,是交叉控股。另外一個例子是,兩名同學為了做作業組成了一個學習小組,總結起來就是兩家公司平分利潤,但是都要各自為協作專案付出努力。我們用正式點的語言來表達吧! 這兩個參與人都是公司的股東,他們都持有公司的股份,他們共同擁有這家公司並且平分利潤,即他們各自持有50%的股份,所以這是種共盈的夥伴關係,每個股東都要選擇為公司投入多少精力。比方說你是個律師,你就要計畫好為公司工作多長時間,對於大多數人來說,就是要決定你每天在公司工作20小時,還是每天工作21小時這樣的問題。你們一起做作業的時候,我希望作業不會消耗你們那麼多時間,比20小時少點就行了吧! 我們用小時數來表示策略吧!用0到4的數字來標記這些策略。你可以從0到4中任選工作的小時數,在繼續前,因為首次遇到它,我強調下。目前為止我們遇到的賽局,每個策略都是不連續的。比如那個數字遊戲,你能從1到100這100個數字中選擇。這裡的策略是連續的,你可以選擇0到4間的任意實數,也就是說你的策略是連續的。這點不是至關重要,但要強調一下。再強調下,是連續的策略空間。原則上,你可以按分鐘或者按秒鐘從你的客戶那裡收取費用,假設這個企業的利潤是已知的。 這家合資公司,也就是律師事務所,利潤是按照下面的運算式計算的:4乘以參與人I的付出加參與人II的付出,再加參數B乘以二者付出的成績,這就是利潤運算式。先不討論B。我是說我們先不討論B到底多大,我們照常計算。假設B是0到1/4之間的已知量,我希望一會能改變一下這個資料。這個運算式說明了什麼?說明了參與人I努力工作對公司有利,同理可知,參與人II也一樣。但是二者的合作同樣起到了作用,我們怎麼考慮合作這個問題呢?你們怎麼看B*SI*S2這個運算式? 比如你們兩個人交一份作業,你們交上來的只是S1+S2,那你會怎麼想?你會覺得沒有必要組成學習小組了。如果總收益只是投入的和或者倍數,那這樣合作也沒什麼意思了。但是現實是在你和他人合作中,你會獲得額外的收益,這樣合作才有價值,我說得沒錯吧?因此我們可以把合作理解為互補或協同,雖然協同這個詞現在不是很常用了。所以我們假設合作中就要有協同。有人擅長作業裡的一部分內容,別人擅長另外一部分內容。律師事務所也是一樣的。有人是知識產權達人,別人可能處理欺詐案件很有經驗。 現在我們有股東、有策略,還知道了企業利潤的計算方法,我還需要告訴你們收益。 說一下收益吧!很顯然,參與人I的收益取決於她和合夥人的策略,因為他們兩人平分利潤,所以是½*4(S1+S2+B*S1*S2)。她得到了一半利潤,但她成本是S1平方。也就是說她的投入是S1的平方,這是她的努力成本。由對稱可得,參與人II的收益是一樣的,運算式也是一樣的,只不過我們要減掉S2的平方。 你的收益是公司的利潤,減去放棄了休息的負效用。第五排有一個同學可能很缺乏睡眠吧!旁邊的人把他叫醒吧!別拍他了,叫醒他就行。好了,你醒了吧!下次我就用錄影機拍下來了啊!現在我們已經獲得了所有分析此公司,還有分析這個案例原理所需的資訊了。不管你們是一起合作寫作業,還是開律師事務所。為了幫助大家理解,我的意思是,這確實有點程式化了,但是現今大多數企業都是合資企業,他們都類似分配利潤並且協作,因此對於商業來說這是個重要概念,毫無疑問。 接下來,我們要用最佳對策的概念來分析了,這對於你們來說應該不陌生了吧!下面我想知道,怎樣計算參與人I在參與人II每個策略下的最佳對策呢?每個s2下參與人I的最佳對策是什麼?我應該如何著手呢?我們之前畫了有關機率的圖像,圖像是在參與人的某個信念下的,但問題是之前參與人II只有兩個策略,所以我們能畫出那個簡單的圖像。 門將可以選擇撲向左側或者右側。現在問題是,參與人II的策略是連續的。想要把無限可能性的機率,做成圖都畫在黑板上是不可能的了,我們需要用別的方法。我們怎麼才能找出參與人I的最佳對策?有人回答嗎?請舉手,在角落那裡,給他麥克風,請起立,麥克風到你那裡。我們怎麼做呢?請大聲說,如何找出參與人I的最佳對策? 學生:參與人I的收益是參與人II付出的函數 教授:很好,這是我們要做的第一步,實際上我們已經得到了那個方程式,這個就是參與人I的收益的方程式。它是參與人I和II策略的函數,我們已經得到了,參與人I的收益是兩人付出的函數。那麼對於某個給定的S2,怎麼計算參與人I的最佳對策呢? 學生:求出S1的導數 教授:好的,求導。然後呢? 學生:令它等於0 教授:很好,下面我們要用到微積分的知識,我們只用單變數微積分的知識就夠了。我們只把S1看為變數,多少人-錄影機先別拍他們了,多少人沒有學過微積分?請大家舉手吧!如果你們沒有見過我將要在板書上寫的運算式,或者說高中畢業你們就忘了,沒關係。 課本的後面有一章,我記得是25章,會涵蓋這些內容,你們可以去重溫一下微積分。如果你以前沒有接觸過,或者說你們沒學過類似數學112的課程,來找我求助吧!我可能會開一個微積分速成班,專為沒學過微積分的人準備。如果我接下來的計算對你來說是天書,過來找我!我來幫你想辦法。 接下來我們要求導了。下面我們要問問我們自己,選S1下利潤的最大值是多少呢?我先算½乘以4吧!這樣省事兒。利潤是2(S1+S2+B*S1*S2)-S1平方,我們來討論在S2已知的情況下,S1的最大值是多少。就像坐在後排的先生說的那樣,我們要去求導,然後令導數等於0。我差點就寫錯了。你們仔細看著我寫的板書對不對啊! 想要求它的導數,先讓我想想一階條件。好了,我們來求導吧!2還保留,S1求導後是1,這裡的S1會變成B*S2,大家都會吧?S1的平方變成了負2S1,這就是求導過程。我這麼求導大家都會,是吧?這是高中的方法對吧?你們的思維開始運轉了嗎?為了達到一階條件,我說在最佳對策下,在S1上寫個帽,在最佳對策下導數等於0。好的,泰爾,把麥克風給之前的傢伙。 學生:為什麼不是2呢?算了,當我沒說。 教授:你大聲說出來這點很好,我寫板書的時候容易犯錯誤,這樣我就對它求出導數了。這是一階導數,令它等於0,一會我們就要計算了,但我先確定一下是最大值還是最小值。我怎麼確定是最大值還是最小值呢?我需要求出二階導數,即需要尋找二階條件,我們再次對S1求導,暫時先不要考慮這裡的帽。S1在這裡面就都消掉了,最後只剩下-2了。-2是一個負數,這正是我想要的。 最大值處的二階導數是負數,到這裡我滿足了一階條件,我們得出S2的最佳對策是Ŝ1,Ŝ1是這個方程式的解,它滿足一階條件。我們這麼寫,如果我除以2然後整理,可以得出Ŝ1等於1+B*S2,這就是在S2下參與人I的最佳對策。如果我照此計算,同理可得參與人II的-我就不算了,因為都是對稱的。大家都聽明白了嗎? 我們能夠同理繼續分析參與人II的,但我們都知道答案是一樣的,同理可得Ŝ2等於1+B*S1,Ŝ2是參與人II的最佳對策,因為它與參與人I的策略S1有關。好了,我們已經找到了參與人I和參與人II互相的最佳對策了,這些是在參與人II有上面的可能策略,同時參與人I有下面的可能策略情況下。接下來我們來看看能不能研究得更深入。我們進一步繪製圖像吧! 下面我們繪製兩個函數圖像,看看圖像是什麼樣的。你們記完筆記了吧?我擦掉了啊!我來換根粉筆好了。好了,我們接下來來繪製圖像。S1是橫軸,S2是縱軸,參與人I有1一直到4的可選策略,這條是45°線,我好好畫一下,這樣會準確點。參與人I的可選策略從1一直到4,接著畫之前先來看看B是多少。 好的,我們要畫這個案例的圖像,我要在圖中畫出參與人I的最佳對策,一會還要畫出參與人II的最佳對策。在這裡B等於1/4,我們之前也說過,B在0到1/4之間,這裡我們繪製B=1/4的情況吧!首先我們想要繪製的運算式是,參與人I的最佳對策是S2的函數,我們都知道它等於1+S2/4。對於任意定義域內的S2,我用紅色來表示參與人I的最佳對策,參與人II選0時,I的最佳對策是什麼?誰來說一下? 學生:是1 教授:因為1+0/4=1,參與人II選0時I的最佳對策是1。要是參與人II選4了呢?此時參與人I的最佳對策是什麼呢?這回就是1+4/4,即1+1=2。所以此時參與人II的最佳對策是2。如果參與人I選4,參與人II要-說錯了,是參與人II選4而I選2,這兩點之間是一條直線。我畫的這條線表明,參與人I的最佳對策取決於參與人II的策略,大家看懂我畫的了嗎?我假設大家都認為它是直線了,但這確實是條直線。 這個圖的作用是,給定一個S2,找到粉線對應的座標,然後就能找出參與人I的最佳對策,同理也可以畫出參與人II的圖像。參與人II的最佳對策取決於參與人I的策略,不用任何數學的方法,我就知道圖像是什麼樣的了。有人能舉手回答它是什麼樣的嗎?在同一個圖像裡面怎麼表示?參與人II的最佳對策是I策略的函數,找個沒回答過問題的人吧!他們之前回答過了,換個人。能不能把麥克遞給中間的小夥子?你從那邊過去好像容易些。大聲說,讓大家都聽清楚。 學生:它關於45°線是對稱的。 教授:沒錯,如果我畫了參與人II的圖像,即參與人II的最佳策略是SI的函數,我們只需要調換一下參與人,因為它們是關於45°線對稱的。他經過1到2這兩點,如圖所示,這就是在任意參與人I的可選策略下,參與人II的最佳對策。為了讓大家都明白,這條藍色線表示給定一個S1,即參與人I的付出。通過查找藍色的線,可以得出參與人II的最佳對策。好了,現在我們學到東西了。 回憶一下今天學到的結論。結論二-結論一是不要從中路射門,第二個更普遍的結論是什麼?不要採用非最佳對策的策略。我承認我偷懶了,因為我忽略了信念,但請大家相信在這個賽局裡面是可以的。這些策略都不會成為最佳對策嗎?換句話說,參與人I的哪些策略永遠不會成為最佳對策。有人知道嗎?那我們來看一下吧! 參與人II選0時,參與人I最佳對策是1,這是最小值了。參與人I的小於1的策略,永遠都不會成為最佳對策。如果參與人II選4,協同導致參與人I的最佳對策變成2,參與人I的那些大於2的策略,也永遠不會成為最佳對策,對不對?也就是說,小於1及大於2的策略,都不是參與人I的最佳對策。同理,參與人I最低只能選0,此時參與人II應該會選1,小於1的策略不是參與人I的最佳對策,大於2的也不是參與人II的最佳對策。 所以我們乾脆點,在筆記本上,你們動作輕點,我直接在劃掉這些非最佳對策的策略。參與人I的這些策略被剔除了,參與人I的這些策略也被剔除了,你們可能不太喜歡筆記太亂吧?參與人II的這些策略被剔除了,參與人II的這些策略也被剔除了,劃掉的都剔除後,最後剩什麼了?如果你們仔細觀察,會發現還剩一個小方格,我剔除了所有策略,所有非參與人I最佳對策的策略,還有非參與人II最佳對策的策略,最後只剩下了這個小方格。 但是現在這個小方格看不太清楚,接下來我重新畫一下這個小方格,我們一起重新畫一下,從1到2,我把這個小方格畫大一點。這一點是(1,1),上面這點是(2,2),接下來我們把精度提高到1/4。這裡分別是5/4、6/4、7/4,我們在方格內填充粉色和藍色的線,這是那個小方格的放大圖。這些線如圖所示,粉色的線從這一點到這一點,藍色的線從這一點到這一點,大家回家後可以仔細畫一下。但並非意味著黑板上的不對。 我只是把之前的圖像給放大了。有人見過這個圖嗎?誰以前見過這個圖啊?除了座標變了,其他的和以前一樣。一旦剔除了非最佳對策的策略,仔細研究剩下的策略時,圖像還和以前看起來是一樣的。儘管座標改變了,圖像放大了,目前為止我們學到了什麼呢?我們學到了參與人不應該選擇非最佳對策的策略,應該剔除它們。最後剩下什麼呢?接下來怎麼辦? 這些沒有被剔除的策略,是某種情況下的最佳對策,但剩餘的最佳對策現在可能也要被剔除,是這樣吧?這和我們之前學過的迭代剔除劣勢策略類似。我要剔除的策略,並非都不是最佳對策,它們可能是某種情況下的最佳對策。我們都知道使他們成為最佳對策的策略,是不會有人採用的,因為這些策略本身又不是最佳對策。我能想到什麼樣的策略呢?我還要剔除掉哪些策略? 舉個例子吧!參與人I知道參與人II不會選小於1的策略,所以參與人II最低只會選策略1,也就是說參與人II在任何情況下,只會選1及以上的策略,這樣參與人I不會選小於5/4的策略。參與人II最大只會選策略2,參與人I針對這種情況下,最大只會選擇6/4,即大於6/4的策略也會被剔除。我們注意一下,我現在剔除掉的策略,他們並非不是最佳對策,他們是某些情況下的最佳對策,但是使他們成為最佳對策的條件是不會發生的,所以它們就不成立。 這樣我們又剔除了參與人小於5/4大於6/4的策略,參與人I只有1½的區間。同理可證,參與人II,如果我再進行一次,別在筆記上亂畫,我們只是想知道最後會怎樣,因為這些策略不會被人採用,所以我剔除掉它們。最後我得到了一個更小的方格。 大家看清楚了嗎?剛開始,我發現了參與人I的最佳對策取決於參與人II的可選策略,同時也發現,參與人II的最佳對策取決於參與人I的可選策略。我剔除了非最佳對策的策略,然後我看看還剩下哪些策略,這些策略是已被我們的剔除策略的最佳對策,但仍不是最佳對策,我就剔除它們。剔除之後,我得到了更小的方格,我可以一次一次的重複這個過程。 如果我不斷重複這個過程呢?最後結果會是怎麼樣的?大聲說,結果是什麼?會是一個交點對嗎?如果我不斷縮小這個方格,下一個方格會是這樣的,我就不去畫了,道理是一樣的。如果你不斷縮小方格,最後就會只剩交點了。如果我們知道人們不會採用最佳對策,說錯了,是不會採用非最佳對策,如果我們知道人們不會採用非最佳對策的策略,就知道人們不會採用非最佳對策的策略,以此類推了。這個賽局最後會歸為一點,每個人只有一個策略,就是交點處。 交點的橫座標是S1,暫且這麼叫吧!S1*=1+BS2*,而S2*=1+BS1。實際上我們能得出更多,因為我們知道這個賽局是對稱的。我們知道S1*=S2,我們利用S1=S2這個等式,這由S1和S2關於45°線對稱可以得出,這樣用S1*=S2*可以簡化了。最後,實際上是看似三個方程式,實則只有兩個方程式,因為其中一個暗示了另一個。我們都會解這個方程式,如果解完方程式,我們會得到-我得仔細點別算錯,我們會得到1-BS1*=1,或S1*=S2*=1/(1-B)。還有,每回我在黑板上演算,你們都幫我檢查一下,看看有沒有算錯,這次算對了嗎?我覺得對。 我代數總是算錯。最後解是S1*=S2*=1/(1-B),剛才的只不過是無聊的數學運算,我剛才就是為瞭解方程式。從中我們能學到什麼呢?我們學到了,在剔除非最佳對策的策略後,要再剔除那些在對手最佳對策下不是最佳對策的策略,以此類推,最後每個參與人都只有一個策略了。每個參與人只有一個策略,而那個策略是這個方程式的解。 如果我們是麥肯錫公司的管理顧問,或者給你們的作業提出點好的建議,或者對於現實中的律師事務所,我們都能夠預測出來,你可能會投入多少工作量。問題是,這個工作量是不是最優的工作量呢?你是在為麥肯錫工作,你被喬史密斯和安博客錄用,幫他們尋找合理策略,或者在學習小組裡一起做作業,你能算出來他們會投入多少工作量,但這個工作量合適嗎?是太多了還是太少了呢? 怎麼來回答?要依據什麼呢?讓我換個表達方式吧!這些企業合夥人,或者兩個共同協作做作業的同學,他們是否實現了最優效率了呢?我們做一個調查吧!誰覺得超越了?請把錄影機對準觀眾。我們來看看,誰覺得超越了?誰覺得剛好達到?誰覺得未達到?好多人棄權了啊!我認為他們沒有達到最優效率,我讓你們回去做一次作業,你們就都明白了。 事實上你會發現,如果有書面合同,或者有個規劃師的話,人們會超常發揮,我們來看看為什麼。為什麼這些律師事務所的律師、醫療合夥人或者其他類似的機構,還有一起做作業的學生,當我們研究過這些策略和賽局後,為何這樣的組合往往是收效甚微的?我來說個答案吧!我告訴大家,因為你們都想少幹活,人們因為什麼才會努力工作呢?有人知道嗎?把麥克風給他。 學生:因為我們知道如果自己超額完成工作,其他人就可以少做點工作了。 教授:沒錯,說得很有道理,但是你說的東西離題了。我的意思是,你給出的原因是一種囚徒困境,言外之意就是,我工作了其他人就偷懶,我覺得這裡有別的原因。更深層次的原因會是什麼呢?你說的我覺得是個好的開端,這裡面還有什麼別的原因嗎? 學生:如果有兩個人一起工作,每個人大約只需要做工作量的一半。 教授:說得沒錯,但這和偷懶沒什麼關係啊!這到底是怎麼回事?回顧一下經濟學115或者150,如果你們有人學過這些課的話,這裡潛在的問題到底是什麼呢?請那個穿粉紅色衣服的同學說一下。 學生:他們只能得到50%的邊際收益 教授:說對了,你叫什麼? 學生:派翠克。 教授:我認為派翠克說出了正確答案。這裡的問題不在於工作量多少,順便說一句,它和協同也沒什麼關係。你可能認為,這是因為他們沒有正確的考慮協同的作用,這不是問題所在。事實證明,即使沒有協同,此問題依舊存在。就像派翠克說的,問題出在邊際量上了。我是這家公司的員工,無論是律師事務所還是學習小組,我參與其中並承擔了邊際成本,我每多出一份力就多承擔等量邊際成本,但我只能獲得一半的好處。從邊際角度分析,我承擔了多付出的全部邊際成本,但我卻只能得到一半的邊際收益,因為利潤是均分的。 這會導致大家都減少付出,經濟學裡與之有關的通用術語叫什麼?叫外部性,這裡邊存在了外部性。外部性。當我計算要為公司付出多少時,我沒考慮到利潤的一半會歸你所有,這和協同沒有什麼關係,這也不是什麼複雜的理論,它就是你們在經濟學115裡學到的知識。如果你是一個公司的股東,或者和別人一起做作業及其他合作專案,你們需要注意到,因為外部性,實際上每個人都付出了較少的努力,我的付出不僅使我受益了。 雖然在板書上寫了,但再深入思考下,如果我們改變了協同的程度會怎樣?我們降低B的值會如何?B表示這些參與人之間的協同程度。如果我把B的值降低,圖像會怎麼變?我們重新畫一張清晰地圖像,圖像會是這樣子的。這是S1,這是S2。如果我們降低了協同度,在這種情況下,結果會是什麼樣的呢?圖像會變成什麼樣?誰知道?這是經濟學115的習題。我們要移動這些直線,你是不是叫亨利?把麥克風給他。 學生:直線會變得更平緩,最後會分別變成水平和垂直兩種情況。 教授:說得很好,但粉色的線會變陡峭,我理解你說的意思了。粉色的線最後會趨向垂直,藍色的線最後會趨向水平,請大家注意下,我們付出的努力會朝這個方向大幅減少。如果我們減少協同參數,不但我會少付出努力,而且你也知道我會少付出努力,因此你也會少付出努力,以此類推,最後會導致了剪刀效應。我們要從中吸取教訓,所以我們還是要繼續挖掘一下。 在這個賽局中我們通過尋找最佳對策,剔除非最佳對策來做出決策,重新審視,繼續剔除非最佳對策然後以此類推。還好這個賽局中出現了交點,粉色的線和藍色的線交於一點,這個點叫什麼呢?藍粉兩線的交點叫什麼?這是這一講的重要結論,這一點就是傳說中的納什均衡。 現在知道它叫什麼了。有多少人聽說過納什均衡?誰看過有關納什的影片?我們在下一講會繼續探討這個問題的,這就是納什均衡了,是個術語,而且這個知識點是相當重要的。因為你們大多數人之前都學過經濟學,而且都知道經濟學的交點都很重要,但這個交點說明了什麼呢?這和那條線有什麼關聯呢?粉色的線和藍色的線相交說明什麼?這一點有什麼特別的意義?這兩條線相交到底說明了什麼?請倒數第三排的紫衣人回答,請大點聲說。 學生:意味著每個參與人都不想偏離那一點 教授:正解。我們再從頭到尾看一遍。請問你叫什麼名字? 學生:艾倫 教授:艾倫認為,如果參與人I採取這個策略,而參與人II採取了相應的策略時,沒有人想要改變這種狀況。換句話說,沒有參與人想要採取別的策略了。所以當參與人I選擇S1*時,參與人II就會選擇最佳對策S2,如果參與人II選擇S2,參與人I就會選最佳對策S1,沒有人想要偏離這一點。簡單來說,參與人I和參與人II,在這兩條線的交點處,互相都採用的是最佳對策。參與人們都採用了自己的最佳對策,雙方都採用了各自的最佳對策,很顯然在這個賽局裡就是兩條線的交點。 我們回到之前玩的數字遊戲,每個人都必須選擇一個號碼,贏家是所選數最接近平均數2/3的人。順便說下,贏家的獎金未必是那麼多,但也可能就是那麼多。那個數字遊戲中的納什均衡是什麼?是每個人都選擇1。我們怎麼知道1是納什均衡呢?我們怎麼知道在那個數字遊戲中,選擇1就是這個賽局的均衡呢?我們來下定義。如果每人都選1,平均數就是1,平均數的2/3是2/3,1是最小值,所以每個人的最佳對策就是選擇1。 重複一下,如果每個人都選了1,那麼每個人的最佳對策也就是1,這就會成為納什均衡。誰在做這個遊戲時就想到納什均衡了嗎?我覺得絕對沒有人會。但是注意下,如果我們重複賽局會怎樣呢?當我們不斷地重複賽局,我們會發現最後會不斷接近1,沒錯吧?當我們反覆分析這個賽局,我們的分析最後會趨近均衡,雖然這不總會發生,但這也是納什均衡的一個亮點。有時結果會趨近這一點,納什均衡是現在直到期中的重點內容,週三我們會學習更多的有關案例。 2007年9月17日 *****