有本書叫做《簡奧絲?。翰┺恼搶W(xué)家》的書,大家感興趣可以去看看。
一個(gè)博弈從簡單到復(fù)雜是通過兩個(gè)緯度進(jìn)行的。一個(gè)緯度是從靜態(tài)到動(dòng)態(tài),簡單說,就是一次性買賣,變成你來我往的多次交往。
另一個(gè)緯度,是從信息完全變?yōu)樾畔⒉煌耆蓚€(gè)緯度,四個(gè)象限,就是博弈論模型不斷復(fù)雜、不斷接近真實(shí)世界互動(dòng)的過程。
大家看下圖就一目了然。
圖1 1. 靜態(tài)完全信息博弈 首先,來看單次完全信息的博弈。
最簡單的是完全信息下的一次博弈,什么意思?就是咱倆都同時(shí)行動(dòng),行動(dòng)結(jié)束,游戲結(jié)束了。上面所說的簡單的囚徒困境就是一次博弈。在這樣的情景下,產(chǎn)生的均衡就是納什均衡。
最簡單的情形是只有一個(gè)均衡。說白了,就是我知道你的最好策略是什么,你也知道我的最好策略是什么,你知道我知道你的最好策略。反之亦然。
在囚徒困境的例子里,我知道對方肯定會背叛我,因?yàn)檫@樣對他最好,那么我也只能背叛。不存在合謀,沒有提前商量的空間,各選各的。
也有可能有多個(gè)均衡。舉個(gè)例子,我倆都喜歡吃豆?jié){搭配油條,牛奶配面包,但是我更喜歡豆?jié){油條,你更喜歡牛奶面包。你去買油條和面包,我去買牛奶和豆?jié){,每人各買各的,不溝通,只買一樣兒。
這種情況下,無論最終買回來的是豆?jié){油條,還是牛奶面包,都是均衡。因?yàn)?,無論是你還是我,單方面都不可能做得比現(xiàn)在更好。這就是均衡的意義。
但是在有些情況下,我們沒有絕對占優(yōu)的策略。
最近世界杯,咱們就舉個(gè)射點(diǎn)球的例子。射門的人是射左面還是射右面呢?沒有哪個(gè)更好,我只希望射門方向與門將撲球的方向相反。而門將所追求的,則是相同。
博弈論學(xué)家說了,這叫做沒有純策略均衡,只有混合策略均衡。也就是說,我們最終只會以一定的概率去踢左邊,一定的概率踢中間,一定的概率踢右邊,而門將也會有一定的概率撲左邊,一定概率不動(dòng),一定的概率撲右邊。按照這種概率分布,存在均衡。
證明任何博弈存在這樣一個(gè)混合策略均衡,就是納什的貢獻(xiàn)。
2. 動(dòng)態(tài)完全信息博弈 講完了納什均衡,咱們來讓博弈更復(fù)雜一些。按照時(shí)間的緯度上往前推一小步,一個(gè)單次的博弈會變成一個(gè)多次的互動(dòng)過程。
這種拓展有兩種情況,一種是重復(fù)的博弈。就是說一個(gè)博弈重復(fù)地進(jìn)行。很多人知道,在重復(fù)的博弈中,囚徒困境就可能得到解決,兩個(gè)人開始合作了。
有個(gè)策略讓這種合作成為可能,叫作“一觸即發(fā)”策略。就是說,你合作我就跟你合作,你要是敢背叛我,我也讓你不得好死,大不了一起死。這樣的策略讓合作可能。
另一種時(shí)間的拓展,不是單純的重復(fù)單次博弈,而是一個(gè)不斷延展的博弈,單次博弈是兩個(gè)人同時(shí)行動(dòng),但是在延展博弈中,你先來一下,我再來一下,然后你再來,跟下棋一樣。
在這樣的博弈里,有簡單的納什均衡,你可以從最終的結(jié)果找到符合納什均衡的解。但是,有些納什均衡實(shí)際上不會產(chǎn)生。你做了什么決定了我在這一步能做什么。這樣的均衡將那些實(shí)際上已經(jīng)被排除掉的真實(shí)情況考慮在內(nèi)了。所以,需要新的均衡概念。
每一次輪到自己走的時(shí)候,我們前面已經(jīng)有別人的行動(dòng),已經(jīng)是事實(shí)了。我們就要相機(jī)行事。我們所要做的,是去看,在此時(shí)此刻,給定之前的行為,我們能做到的最好是什么。也許在上一步做了另一個(gè)行為會讓我們更好,但是我們沒法改變事實(shí)。我們能做的,就是看眼下,我能做到的最好。
尋找這樣博弈的均衡,就是從最后一步開始,逐步往前推,一直推到開始。因?yàn)槭峭耆畔⒌模p方彼此仍然能知道在每一步對放會最優(yōu)的策略是什么。
3. 靜態(tài)非完全信息博弈 上述是對時(shí)間維度上的拓展。那么從簡單的一次完全信息博弈變?yōu)椴煌耆畔?,則是另一種情況。在這種情況下,我們對對方的一些信息是不了解的。比如,它的收益函數(shù),或者說它的偏好。
在這種情況下,我們無法預(yù)知對方在給定行為下的最好的策略,那么我們只能賦予對方采取不同策略概率,然后,根據(jù)這個(gè)概率估計(jì)選擇自己的策略。
還拿射點(diǎn)球?yàn)槔印?br>
對于門將而言,他不知道射門者的偏好,而只是對這個(gè)偏好進(jìn)行一個(gè)估計(jì)。如果是右撇子,他會估計(jì)說這個(gè)球員踢向門左側(cè)的策略會大一些。那么,根據(jù)這一估計(jì),他會以更大的概率按照這個(gè)方向去撲球。但是,射門的人完全有可能踢向另一個(gè)方向。
另外一個(gè)例子,就是出價(jià)買東西。買方喊出一個(gè)買價(jià)的時(shí)候,是不知道賣家心目中的合適價(jià)格的,怕喊高了,同樣的道理,要是賣價(jià)喊價(jià),也有可能喊低了。這樣的博弈都是非完全信息的博弈。
事實(shí)上,在真實(shí)的世界中,大部分博弈是非完全信息的。完全信息下世界是很美好的,非完全信息下,問題就變得復(fù)雜。要是我知道姑娘喜歡我,姑娘知道我知道她喜歡我,這世上尋找真愛的效率要提高多少?
4. 非完全信息的動(dòng)態(tài)博弈 把時(shí)間上的復(fù)雜性和信息不對稱都考慮在內(nèi),就是博弈論中較為復(fù)雜的情況,也是經(jīng)濟(jì)學(xué)家研究最多的領(lǐng)域。
在信息不對稱的情況下,我們會很自然地想到,通過某種方式傳遞信息。這里假設(shè)是我們無法直接告訴對方,或是不想告訴,刻意想迷惑對方。那么,在動(dòng)態(tài)的博弈中,這樣的信息傳遞就是有可能的。
這就是博弈論中最為經(jīng)典的“信號博弈”,Signaling game,斯賓塞(Michiel Spence)是最早的發(fā)明者,1971 年的論文。2001 年跟斯蒂格利茨、耶倫丈夫阿克洛夫獲得了諾獎(jiǎng)。
Signaling 可以很復(fù)雜,我在此試著概括一下。博弈雙方,一方對另一方的某一特性不了解,不知道它是什么類型,但是呢,我可以通過它發(fā)出的信號去推斷它的類型。
比如擇偶的例子中,
一個(gè)女孩選擇對象,當(dāng)她無法確認(rèn)追求者是否真正鐘情于她時(shí),她就需要通過追求者發(fā)出的信號來判斷。因?yàn)樵谧C明真愛方面,一句我愛你是沒有作用的,所以需要其他行動(dòng)。 發(fā)出信號是要有成本的,證明真愛,就要發(fā)出對你足夠的有成本的信號,以凸顯出你和別人不一樣。在這樣的博弈中,均衡是怎樣的呢?兩種情況。
一種是,
那些強(qiáng)烈愛的人和那些溫和愛的人競相花費(fèi)成本證明真愛,最終,停到某一時(shí)刻,那些溫和愛的人發(fā)現(xiàn),再不值得投入了,這時(shí)候愛的足夠深的人就勝出了。這叫做“分離均衡”。 一種是,
到最后,兩種人也沒完全區(qū)分出來,一些愛的不那么深的人也混在真愛中,繼續(xù)花費(fèi)成本發(fā)送信號對誰都不再值得。姑娘索性選一個(gè)人嫁了得了。這叫做混同均衡。大家發(fā)現(xiàn),后者,也許往往是現(xiàn)實(shí)世界的情況。 在這個(gè)經(jīng)典的博弈基礎(chǔ)上,經(jīng)濟(jì)學(xué)家們又研究,那種發(fā)送信號沒有成本的均衡情況會是怎樣。這個(gè)叫做 Cheap Talk。
最近幾年不斷有諾獎(jiǎng)產(chǎn)生的機(jī)制設(shè)計(jì)領(lǐng)域,是在這個(gè)領(lǐng)域基礎(chǔ)上的拓展。博弈論是給定人們偏好研究人們互動(dòng)本身,預(yù)測結(jié)果。機(jī)制設(shè)計(jì)則是倒過來,研究什么樣的機(jī)制能夠保證達(dá)成特定的結(jié)果,具體而言,在上面的信號博弈中,就是研究如何讓人們誠實(shí)地匯報(bào)自己的真實(shí)情況,而非隱瞞。
上面講了簡單博弈變成復(fù)雜博弈兩個(gè)緯度,一個(gè)是信息完全變成不完全。一個(gè)是從靜態(tài)單次變成動(dòng)態(tài)多回合。另外,從博弈玩家的人數(shù)上也可以從兩人變?yōu)槎嗳?雖然本質(zhì)上還是博弈雙方)一個(gè)非常經(jīng)典的博弈論模型叫作全局博弈(Global Game)。
Global Game 在政治學(xué)和經(jīng)濟(jì)學(xué)中各有一個(gè)很經(jīng)典的應(yīng)用。前者比如革命的群體協(xié)作,你是否揭竿而起不僅取決于你相信政權(quán)有多么脆弱,還同時(shí)取決于你相信別人是否參與。在經(jīng)濟(jì)學(xué)上一個(gè)很好的例子是銀行擠兌,你是否擠兌取決于你相信別人是否會擠兌,以及你相信銀行有多少錢。在這個(gè)博弈中,主觀的因素變得更加重要,而且往往具有自我預(yù)言實(shí)現(xiàn)的特點(diǎn),內(nèi)涵相當(dāng)精彩。
總而言之,博弈論是相當(dāng)強(qiáng)大的思維工具和方法論。雖然理論可以很復(fù)雜,但其內(nèi)涵卻都在日常生活中,理解起來并不困難。
當(dāng)然,
也許學(xué)習(xí)博弈論的最好辦法,或許是多談幾場戀愛吧。 (本文作者介紹:以紐約為支點(diǎn),全球線上線下互動(dòng),推動(dòng)金融學(xué)術(shù)交流,加強(qiáng)金融經(jīng)驗(yàn)分享,培養(yǎng)金融創(chuàng)業(yè)人才,實(shí)現(xiàn)金融商務(wù)合作。 )