作者: 谷小娜
申明:本網(wǎng)站內(nèi)容僅用于學(xué)術(shù)交流,如有侵犯您的權(quán)益,請(qǐng)及時(shí)告知我們,本站將立即刪除有關(guān)內(nèi)容。
摘要:文章通過對(duì)多人多次重復(fù)博弈的分析,解決了“囚徒困境”提出的個(gè)體理性與集體理性的矛盾,提出了新的“理性人”的人性假設(shè)。
關(guān)鍵詞:人性假設(shè),多人多次重復(fù)博弈
建立在亞當(dāng)?斯密的“看不見的手”理論以及“理性人”的人性假設(shè)基礎(chǔ)之上的西方經(jīng)濟(jì)學(xué),近年來受到了
來自博弈論的嚴(yán)峻挑戰(zhàn),被證實(shí)其存在嚴(yán)重的假設(shè)漏洞,艾克斯羅德對(duì)多人多次重復(fù)博弈的對(duì)策研究以及從他的研究得出的新的人性假設(shè)從某種程度上彌補(bǔ)了這個(gè)漏洞,下面本文將詳細(xì)論述這個(gè)新的理論突破。
一、傳統(tǒng)經(jīng)濟(jì)學(xué)的人性假設(shè)
早在200多年以前,西方經(jīng)濟(jì)學(xué)的鼻祖亞當(dāng)?斯密,提出了“看不見的手”原理。斯密寫了一段被廣為引用的著名的話:“每人都在力圖應(yīng)用他的資本,來使其生產(chǎn)品能得到最大的價(jià)值。一般地說:他并不企圖增進(jìn)公共之福利,也不知道他所增進(jìn)的公共福利為多少。他所追求的僅僅是他個(gè)人的安樂,僅僅是他個(gè)人的利益。在這樣做時(shí),有只看不見的手引導(dǎo)他去促進(jìn)一種目標(biāo),而這種目標(biāo)決不是他追求的東西。由于追逐他自己的利益,他經(jīng)常促進(jìn)了社會(huì)利益,其效果要比他真正想促進(jìn)社會(huì)利益時(shí)所得到的效果為大。”這段頌揚(yáng)資本主義的文字被稱為是斯密的“看不見的手”原理??梢院敛豢鋸埖卣f:整個(gè)現(xiàn)代主流西方經(jīng)濟(jì)學(xué)都是建立在“看不見的手”的原理之上的。
亞當(dāng)?斯密的“看不見的手”原理,既是經(jīng)濟(jì)學(xué)的一個(gè)最重要的假設(shè),同時(shí)也是一個(gè)非常重要的哲學(xué)假設(shè)。這個(gè)假定首先是指經(jīng)濟(jì)學(xué)考慮問題的時(shí)候,把基本的分析單位放在“個(gè)體”之上,即“個(gè)人”。其他所有問題,所有層次上的問題,被假定都可以還原到這個(gè)個(gè)體和個(gè)體之間的關(guān)系來解釋。其次,個(gè)體又被假定是一個(gè)理性的,理性思考的個(gè)體。經(jīng)濟(jì)學(xué)為了能夠更準(zhǔn)確地、精確地思考,對(duì)理性的定義就要比傳統(tǒng)哲學(xué)狹窄一點(diǎn)。從而把理性定義為“為自己的、為個(gè)人的利益充分,要把它這個(gè)人利益最大化”的一種思考方式,這種思考方式又有一個(gè)一貫的或者一致的特點(diǎn)。而個(gè)人就是一個(gè)符合邏輯思考的,在符合邏輯思考的情況下,處處想著要把自己的利益最大化的個(gè)體,即“理性人”。
亞當(dāng)?斯密認(rèn)為,每個(gè)人雖然都是只為自己考慮,但是假如有一個(gè)基本上能夠保持社會(huì)秩序的一個(gè)制度,或者說有這么一個(gè)市場(chǎng),那么盡管每個(gè)都為自己,最后的結(jié)果卻是一個(gè)社會(huì)的一個(gè)共同利益的發(fā)展。從亞當(dāng)?斯密開始至今的大部分經(jīng)濟(jì)學(xué)家認(rèn)為,只要人是完全理性的,在經(jīng)濟(jì)活動(dòng)中始終遵循個(gè)人的“理性原則”,那么,整個(gè)經(jīng)濟(jì)社會(huì),從產(chǎn)品市場(chǎng)到要素市場(chǎng)都會(huì)達(dá)到一種均衡的狀態(tài),整個(gè)社會(huì)的福利也會(huì)達(dá)到最大的狀態(tài)――“帕累托最優(yōu)”狀態(tài),這樣的社會(huì)就是一個(gè)完美的社會(huì)。此后的經(jīng)濟(jì)學(xué)家,盡管在不同方面上對(duì)這個(gè)理論進(jìn)行了修正,但他們始終是承認(rèn)在“看不見的手”引導(dǎo)下“理性人”是能夠達(dá)到社會(huì)福利最大化的。
二、博弈論對(duì)傳統(tǒng)人性假設(shè)的挑戰(zhàn)
博弈論研究人們的策略互動(dòng)行為。其認(rèn)為:人是理性的,即人人都會(huì)在約束條件下最大化自身的利益;人們?cè)诮煌献髦杏袥_突,行為互相影響,而且信息不對(duì)稱。博弈論研究人們的行為,在直接相互作用時(shí)的決策,以及決策的均衡問題。換句話說,博弈論研究如何使得人們?cè)谑袌?chǎng)經(jīng)濟(jì)中,自愿做出大家都遵守和實(shí)施的有效制度安排,以增進(jìn)社會(huì)的福利的機(jī)制。
博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域應(yīng)用的一個(gè)經(jīng)典的案例就是“囚徒的困境”。即警察抓住了兩個(gè)合伙犯罪的罪犯,但缺乏足夠的證據(jù)。如果其中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。警察將其分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里審訊。在這種情形下,兩個(gè)囚犯都可以做出自己的選擇:供出同伙或者保持沉默。
這兩個(gè)囚犯都知道,若他倆都保持沉默的話,就都會(huì)被釋放,但警察規(guī)定:如果他們中的一個(gè)人告發(fā)他的同伙,那么他就可以被無罪釋放。而他的同伙會(huì)被按照最重的罪來判決。當(dāng)然,若這兩個(gè)囚犯互相背叛,兩個(gè)人都會(huì)被按照最重的罪來判決。
那么,這兩個(gè)囚犯該怎么辦?是互相合作還是互相背叛?從表面上看,他們應(yīng)該互相合作,這樣他們倆都能得到最好的結(jié)果:自由。但他們要考慮對(duì)方可能采取的選擇。A犯和B犯都根本不相信他的同伙不會(huì)向警方提供對(duì)他不利的證據(jù)。這種想法的誘惑力實(shí)在太大了。
所以兩個(gè)囚犯唯一理性的選擇就是背叛同伙,所以結(jié)果就是,兩個(gè)囚犯按照不顧一切的邏輯得到了最糟糕的報(bào)應(yīng):坐牢。
從“囚徒的困境”可以看到與亞當(dāng)?斯密的“看不見的手”原理完全相反的結(jié)論,每個(gè)囚犯根據(jù)自己的“理性”判斷,做出了對(duì)自身來講是“最優(yōu)的”行為,但是他們兩個(gè)人構(gòu)成的整體的福利卻不是最大的。
“囚徒的困境”既揭示了個(gè)體理性與團(tuán)體理性之間的矛盾――從個(gè)體利益出發(fā)的行為往往不能實(shí)現(xiàn)團(tuán)體的最大利益,同時(shí)也揭示了個(gè)體理性自身的內(nèi)在矛盾――從個(gè)體利益出發(fā)的行為最終也不一定能實(shí)現(xiàn)個(gè)體的最大利益,甚至?xí)玫较喈?dāng)差的結(jié)果。
這樣,“囚徒的困境”被認(rèn)為是對(duì)亞當(dāng)?斯密體系的一個(gè)挑戰(zhàn),當(dāng)然它并沒有否定“看不見的手”,而只是揭示了“看不見的手”這個(gè)假設(shè)下的一些經(jīng)濟(jì)活動(dòng)的漏洞。
三、多人多次重復(fù)博弈所展示的人性假設(shè)
美國(guó)學(xué)者艾克斯羅德在《合作的進(jìn)化》一書中通過對(duì)多人多次重復(fù)博弈的對(duì)策研究,指出在博弈中產(chǎn)生合作的必要條件和獲勝策略的主要特征:當(dāng)策略群體是按各種策略的得分進(jìn)行淘汰和進(jìn)化時(shí),群體以一種不可逆轉(zhuǎn)的方式向合作的方向進(jìn)化,即群體的合作性隨進(jìn)化過程越來越大。
艾克斯羅德研究合作的兩個(gè)前提假設(shè):每個(gè)人都是自私的;沒有權(quán)威干預(yù)個(gè)人決策。即個(gè)人可以完全按照自己利益最大化的企圖進(jìn)行決策。在此基礎(chǔ)上,他設(shè)計(jì)了一個(gè)實(shí)驗(yàn),實(shí)驗(yàn)要求每個(gè)參賽者把追求得分最多的策略寫成計(jì)算機(jī)程序,然后用單循環(huán)賽的方式將參賽程序兩兩博弈,以找出什么樣的策略得分最高,游戲什么時(shí)候結(jié)束是不確定的。得分規(guī)則可用如圖1得益矩陣表示:
第一輪游戲有14個(gè)程序參加,再加上艾克斯羅德自己的一個(gè)隨機(jī)程序(即以50%的概率選取合作或不合作),運(yùn)轉(zhuǎn)了300次。結(jié)果得分最高的程序是加拿大學(xué)者羅伯布寫的“一報(bào)還一報(bào)”(tit for tat)。這個(gè)程序的特點(diǎn)是,第一次對(duì)局采用合作的策略,以后每一步都跟隨對(duì)方上一步的策略,對(duì)方上一次合作,我這一次就合作,對(duì)方上一次不合作,我這一次就不合作。艾克斯羅德還發(fā)現(xiàn),得分排在前面的程序有三個(gè)特點(diǎn):從不首先背叛,即“善良的”;不能對(duì)方一次背叛,就沒完沒了的報(bào)復(fù),以后對(duì)方只要改為合作,我也要合作,即“寬容性”;對(duì)于對(duì)方的背叛行為一定要報(bào)復(fù),不能總是合作,即“強(qiáng)硬的”。
為了進(jìn)一步驗(yàn)證上述結(jié)論,艾克斯羅德邀請(qǐng)了更多人再做了一次游戲,并把第一次的結(jié)果公開發(fā)表。第二次征集到了62個(gè)程序,加上他自己的隨機(jī)程序,又進(jìn)行了一次競(jìng)賽。結(jié)果,第一名的仍是“一報(bào)還一報(bào)”。艾克斯羅德總結(jié)這次游戲的結(jié)論是:“一報(bào)還一報(bào)”仍是最優(yōu)策略。前面提到的三個(gè)特點(diǎn)仍然有效,因?yàn)?3人中的前15名里,只有第8名的哈靈頓程序是“不善良的”,后15名中,只有1個(gè)總是合作的是“善良的”。可激怒性和寬容性也得到了證明。此外,好的策略還必須具有的一個(gè)特點(diǎn)是“清晰性”,即能讓對(duì)方在三、五步對(duì)局內(nèi)辨識(shí)出來?!耙粓?bào)還一報(bào)”就有很好的清晰性,讓對(duì)方很快發(fā)現(xiàn)規(guī)律,從而不得不采取合作的態(tài)度。
艾克斯羅德設(shè)計(jì)了一個(gè)實(shí)驗(yàn),假設(shè)63個(gè)對(duì)策者中,誰在第一輪中的得分高,他在第二輪的群體中所占比例就越高,而且是他的得分的正函數(shù)。這樣,群體的結(jié)構(gòu)就會(huì)在進(jìn)化過程中改變,由此可以看出群體是向什么方向進(jìn)化的。
聯(lián)系客服