中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
從“囚徒困境”到多人多次重復(fù)博弈的人性假設(shè)

      作者: 谷小娜
      申明:本網(wǎng)站內(nèi)容僅用于學(xué)術(shù)交流,如有侵犯您的權(quán)益,請(qǐng)及時(shí)告知我們,本站將立即刪除有關(guān)內(nèi)容。

      摘要:文章通過對(duì)多人多次重復(fù)博弈的分析,解決了“囚徒困境”提出的個(gè)體理性與集體理性的矛盾,提出了新的“理性人”的人性假設(shè)。
  
      關(guān)鍵詞:人性假設(shè),多人多次重復(fù)博弈
      建立在亞當(dāng)?斯密的“看不見的手”理論以及“理性人”的人性假設(shè)基礎(chǔ)之上的西方經(jīng)濟(jì)學(xué),近年來受到了
      來自博弈論的嚴(yán)峻挑戰(zhàn),被證實(shí)其存在嚴(yán)重的假設(shè)漏洞,艾克斯羅德對(duì)多人多次重復(fù)博弈的對(duì)策研究以及從他的研究得出的新的人性假設(shè)從某種程度上彌補(bǔ)了這個(gè)漏洞,下面本文將詳細(xì)論述這個(gè)新的理論突破。
      一、傳統(tǒng)經(jīng)濟(jì)學(xué)的人性假設(shè)
      早在200多年以前,西方經(jīng)濟(jì)學(xué)的鼻祖亞當(dāng)?斯密,提出了“看不見的手”原理。斯密寫了一段被廣為引用的著名的話:“每人都在力圖應(yīng)用他的資本,來使其生產(chǎn)品能得到最大的價(jià)值。一般地說:他并不企圖增進(jìn)公共之福利,也不知道他所增進(jìn)的公共福利為多少。他所追求的僅僅是他個(gè)人的安樂,僅僅是他個(gè)人的利益。在這樣做時(shí),有只看不見的手引導(dǎo)他去促進(jìn)一種目標(biāo),而這種目標(biāo)決不是他追求的東西。由于追逐他自己的利益,他經(jīng)常促進(jìn)了社會(huì)利益,其效果要比他真正想促進(jìn)社會(huì)利益時(shí)所得到的效果為大。”這段頌揚(yáng)資本主義的文字被稱為是斯密的“看不見的手”原理??梢院敛豢鋸埖卣f:整個(gè)現(xiàn)代主流西方經(jīng)濟(jì)學(xué)都是建立在“看不見的手”的原理之上的。
      亞當(dāng)?斯密的“看不見的手”原理,既是經(jīng)濟(jì)學(xué)的一個(gè)最重要的假設(shè),同時(shí)也是一個(gè)非常重要的哲學(xué)假設(shè)。這個(gè)假定首先是指經(jīng)濟(jì)學(xué)考慮問題的時(shí)候,把基本的分析單位放在“個(gè)體”之上,即“個(gè)人”。其他所有問題,所有層次上的問題,被假定都可以還原到這個(gè)個(gè)體和個(gè)體之間的關(guān)系來解釋。其次,個(gè)體又被假定是一個(gè)理性的,理性思考的個(gè)體。經(jīng)濟(jì)學(xué)為了能夠更準(zhǔn)確地、精確地思考,對(duì)理性的定義就要比傳統(tǒng)哲學(xué)狹窄一點(diǎn)。從而把理性定義為“為自己的、為個(gè)人的利益充分,要把它這個(gè)人利益最大化”的一種思考方式,這種思考方式又有一個(gè)一貫的或者一致的特點(diǎn)。而個(gè)人就是一個(gè)符合邏輯思考的,在符合邏輯思考的情況下,處處想著要把自己的利益最大化的個(gè)體,即“理性人”。
      亞當(dāng)?斯密認(rèn)為,每個(gè)人雖然都是只為自己考慮,但是假如有一個(gè)基本上能夠保持社會(huì)秩序的一個(gè)制度,或者說有這么一個(gè)市場(chǎng),那么盡管每個(gè)都為自己,最后的結(jié)果卻是一個(gè)社會(huì)的一個(gè)共同利益的發(fā)展。從亞當(dāng)?斯密開始至今的大部分經(jīng)濟(jì)學(xué)家認(rèn)為,只要人是完全理性的,在經(jīng)濟(jì)活動(dòng)中始終遵循個(gè)人的“理性原則”,那么,整個(gè)經(jīng)濟(jì)社會(huì),從產(chǎn)品市場(chǎng)到要素市場(chǎng)都會(huì)達(dá)到一種均衡的狀態(tài),整個(gè)社會(huì)的福利也會(huì)達(dá)到最大的狀態(tài)――“帕累托最優(yōu)”狀態(tài),這樣的社會(huì)就是一個(gè)完美的社會(huì)。此后的經(jīng)濟(jì)學(xué)家,盡管在不同方面上對(duì)這個(gè)理論進(jìn)行了修正,但他們始終是承認(rèn)在“看不見的手”引導(dǎo)下“理性人”是能夠達(dá)到社會(huì)福利最大化的。
      二、博弈論對(duì)傳統(tǒng)人性假設(shè)的挑戰(zhàn)
      博弈論研究人們的策略互動(dòng)行為。其認(rèn)為:人是理性的,即人人都會(huì)在約束條件下最大化自身的利益;人們?cè)诮煌献髦杏袥_突,行為互相影響,而且信息不對(duì)稱。博弈論研究人們的行為,在直接相互作用時(shí)的決策,以及決策的均衡問題。換句話說,博弈論研究如何使得人們?cè)谑袌?chǎng)經(jīng)濟(jì)中,自愿做出大家都遵守和實(shí)施的有效制度安排,以增進(jìn)社會(huì)的福利的機(jī)制。
      博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域應(yīng)用的一個(gè)經(jīng)典的案例就是“囚徒的困境”。即警察抓住了兩個(gè)合伙犯罪的罪犯,但缺乏足夠的證據(jù)。如果其中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。警察將其分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里審訊。在這種情形下,兩個(gè)囚犯都可以做出自己的選擇:供出同伙或者保持沉默。
      這兩個(gè)囚犯都知道,若他倆都保持沉默的話,就都會(huì)被釋放,但警察規(guī)定:如果他們中的一個(gè)人告發(fā)他的同伙,那么他就可以被無罪釋放。而他的同伙會(huì)被按照最重的罪來判決。當(dāng)然,若這兩個(gè)囚犯互相背叛,兩個(gè)人都會(huì)被按照最重的罪來判決。
      那么,這兩個(gè)囚犯該怎么辦?是互相合作還是互相背叛?從表面上看,他們應(yīng)該互相合作,這樣他們倆都能得到最好的結(jié)果:自由。但他們要考慮對(duì)方可能采取的選擇。A犯和B犯都根本不相信他的同伙不會(huì)向警方提供對(duì)他不利的證據(jù)。這種想法的誘惑力實(shí)在太大了。
      所以兩個(gè)囚犯唯一理性的選擇就是背叛同伙,所以結(jié)果就是,兩個(gè)囚犯按照不顧一切的邏輯得到了最糟糕的報(bào)應(yīng):坐牢。
      從“囚徒的困境”可以看到與亞當(dāng)?斯密的“看不見的手”原理完全相反的結(jié)論,每個(gè)囚犯根據(jù)自己的“理性”判斷,做出了對(duì)自身來講是“最優(yōu)的”行為,但是他們兩個(gè)人構(gòu)成的整體的福利卻不是最大的。
      “囚徒的困境”既揭示了個(gè)體理性與團(tuán)體理性之間的矛盾――從個(gè)體利益出發(fā)的行為往往不能實(shí)現(xiàn)團(tuán)體的最大利益,同時(shí)也揭示了個(gè)體理性自身的內(nèi)在矛盾――從個(gè)體利益出發(fā)的行為最終也不一定能實(shí)現(xiàn)個(gè)體的最大利益,甚至?xí)玫较喈?dāng)差的結(jié)果。
      這樣,“囚徒的困境”被認(rèn)為是對(duì)亞當(dāng)?斯密體系的一個(gè)挑戰(zhàn),當(dāng)然它并沒有否定“看不見的手”,而只是揭示了“看不見的手”這個(gè)假設(shè)下的一些經(jīng)濟(jì)活動(dòng)的漏洞。
      三、多人多次重復(fù)博弈所展示的人性假設(shè)
      美國(guó)學(xué)者艾克斯羅德在《合作的進(jìn)化》一書中通過對(duì)多人多次重復(fù)博弈的對(duì)策研究,指出在博弈中產(chǎn)生合作的必要條件和獲勝策略的主要特征:當(dāng)策略群體是按各種策略的得分進(jìn)行淘汰和進(jìn)化時(shí),群體以一種不可逆轉(zhuǎn)的方式向合作的方向進(jìn)化,即群體的合作性隨進(jìn)化過程越來越大。
      艾克斯羅德研究合作的兩個(gè)前提假設(shè):每個(gè)人都是自私的;沒有權(quán)威干預(yù)個(gè)人決策。即個(gè)人可以完全按照自己利益最大化的企圖進(jìn)行決策。在此基礎(chǔ)上,他設(shè)計(jì)了一個(gè)實(shí)驗(yàn),實(shí)驗(yàn)要求每個(gè)參賽者把追求得分最多的策略寫成計(jì)算機(jī)程序,然后用單循環(huán)賽的方式將參賽程序兩兩博弈,以找出什么樣的策略得分最高,游戲什么時(shí)候結(jié)束是不確定的。得分規(guī)則可用如圖1得益矩陣表示:
      第一輪游戲有14個(gè)程序參加,再加上艾克斯羅德自己的一個(gè)隨機(jī)程序(即以50%的概率選取合作或不合作),運(yùn)轉(zhuǎn)了300次。結(jié)果得分最高的程序是加拿大學(xué)者羅伯布寫的“一報(bào)還一報(bào)”(tit for tat)。這個(gè)程序的特點(diǎn)是,第一次對(duì)局采用合作的策略,以后每一步都跟隨對(duì)方上一步的策略,對(duì)方上一次合作,我這一次就合作,對(duì)方上一次不合作,我這一次就不合作。艾克斯羅德還發(fā)現(xiàn),得分排在前面的程序有三個(gè)特點(diǎn):從不首先背叛,即“善良的”;不能對(duì)方一次背叛,就沒完沒了的報(bào)復(fù),以后對(duì)方只要改為合作,我也要合作,即“寬容性”;對(duì)于對(duì)方的背叛行為一定要報(bào)復(fù),不能總是合作,即“強(qiáng)硬的”。
      為了進(jìn)一步驗(yàn)證上述結(jié)論,艾克斯羅德邀請(qǐng)了更多人再做了一次游戲,并把第一次的結(jié)果公開發(fā)表。第二次征集到了62個(gè)程序,加上他自己的隨機(jī)程序,又進(jìn)行了一次競(jìng)賽。結(jié)果,第一名的仍是“一報(bào)還一報(bào)”。艾克斯羅德總結(jié)這次游戲的結(jié)論是:“一報(bào)還一報(bào)”仍是最優(yōu)策略。前面提到的三個(gè)特點(diǎn)仍然有效,因?yàn)?3人中的前15名里,只有第8名的哈靈頓程序是“不善良的”,后15名中,只有1個(gè)總是合作的是“善良的”。可激怒性和寬容性也得到了證明。此外,好的策略還必須具有的一個(gè)特點(diǎn)是“清晰性”,即能讓對(duì)方在三、五步對(duì)局內(nèi)辨識(shí)出來?!耙粓?bào)還一報(bào)”就有很好的清晰性,讓對(duì)方很快發(fā)現(xiàn)規(guī)律,從而不得不采取合作的態(tài)度。
      艾克斯羅德設(shè)計(jì)了一個(gè)實(shí)驗(yàn),假設(shè)63個(gè)對(duì)策者中,誰在第一輪中的得分高,他在第二輪的群體中所占比例就越高,而且是他的得分的正函數(shù)。這樣,群體的結(jié)構(gòu)就會(huì)在進(jìn)化過程中改變,由此可以看出群體是向什么方向進(jìn)化的。

      “一報(bào)還一報(bào)”原來在群體中占1/63,經(jīng)過1000代的進(jìn)化,結(jié)構(gòu)穩(wěn)定下來時(shí),它占了24%。另外,有一些程序在進(jìn)化過程中消失了。其中有一個(gè)值得研究的程序,即原來前15名中唯一的那個(gè)“不善良的”哈靈頓程序,它的對(duì)策方案是,首先合作,當(dāng)發(fā)現(xiàn)對(duì)方一直在合作,它就突然來個(gè)不合作,如果對(duì)方立刻報(bào)復(fù)它,它就恢復(fù)合作,如果對(duì)方仍然合作,它就繼續(xù)背叛。這個(gè)程序一開始發(fā)展很快,但等到除了“一報(bào)還一報(bào)”之外的其它程序開始消失時(shí),它就開始下降了。因此,以合作系數(shù)來測(cè)量,群體是越來越合作的。
      進(jìn)化實(shí)驗(yàn)揭示了一個(gè)哲理:一個(gè)策略的成功應(yīng)該以對(duì)方的成功為基礎(chǔ)。“一報(bào)還一報(bào)”在兩個(gè)人對(duì)策時(shí),得分不可能超過對(duì)方,最多打個(gè)平手,但它的總分最高。它賴以生存的基礎(chǔ)是很牢固的,因?yàn)樗寣?duì)方得到了高分。哈靈頓程序就不是這樣,它得到高分時(shí),對(duì)方必然得到低分。它的成功是建立在別人失敗的基礎(chǔ)上的,而失敗者總是要被淘汰的,當(dāng)失敗者被淘汰之后,這個(gè)好占別人便宜的成功者也要被淘汰。
      艾克斯羅德通過數(shù)學(xué)化和計(jì)算機(jī)化的方法研究如何突破囚徒困境,達(dá)成合作,將這項(xiàng)研究帶到了一個(gè)全新境界,他在數(shù)學(xué)上的證明無疑是十分雄辯和令人信服的,而且,他在計(jì)算機(jī)模擬中得出的一些結(jié)論是非常驚人的發(fā)現(xiàn),比如,總分最高的人在每次博弈中都沒有拿到最高分。
      四、結(jié)束語
      艾克斯羅德所發(fā)現(xiàn)的“一報(bào)還一報(bào)”策略,從社會(huì)學(xué)的角度可以看作是一種“互惠式利他”,這種行為的動(dòng)機(jī)是個(gè)人私利,但它的結(jié)果是雙方獲利,并通過互惠式利他有可能覆蓋了范圍最廣的社會(huì)生活,人們通過送禮及回報(bào),形成了一種社會(huì)生活的秩序,這種秩序即使在多年隔絕,語言不通的人群之間也是最易理解的東西。有些看似純粹的利他行為,比如無償損贈(zèng),也通過某些間接方式,比如社會(huì)聲譽(yù)的獲得,得到了回報(bào)。研究這種行為,將對(duì)我們理解社會(huì)生活有很重要的意義。
      艾克斯羅德在《合作的進(jìn)化》一書結(jié)尾提出幾個(gè)結(jié)論:友誼不是合作的必要條件,即使是敵人,只要滿足了關(guān)系持續(xù),互相回報(bào)的條件,也有可能合作。預(yù)見性也不是合作的前提,但是,當(dāng)有預(yù)見性的人類了解了合作的規(guī)律之后,合作進(jìn)化的過程就會(huì)加快。這時(shí),預(yù)見性是有用的,學(xué)習(xí)也是有用的。
      在這里可以得出一個(gè)重要的結(jié)論:“一報(bào)還一報(bào)”應(yīng)當(dāng)是“理性人”的重要行為準(zhǔn)則,具備了“善意的、寬容的、強(qiáng)硬的、清晰的”性質(zhì)的“理性人”,才是一個(gè)完美的“理性人”,這樣,“囚徒困境”所提出的挑戰(zhàn)就會(huì)得到圓滿的解決。
      囚徒困境擴(kuò)展為多人博弈時(shí),就體現(xiàn)了一個(gè)更廣泛的問題──“社會(huì)悖論”,或“資源悖論”。人類共有的資源是有限的,當(dāng)每個(gè)人都試圖從有限的資源中多拿一點(diǎn)兒時(shí),就產(chǎn)生了局部利益與整體利益的沖突。人口問題、資源危機(jī)、交通阻塞,都可以在社會(huì)悖論中得以解釋,在這些問題中,關(guān)鍵是通過研究,制定游戲規(guī)則來控制每個(gè)人的行為。
      艾克斯羅德的一些結(jié)論在中國(guó)古典文化道德傳統(tǒng)中可以很容易地找到對(duì)應(yīng),“投桃報(bào)李”、“人不犯我,我不犯人”都體現(xiàn)了“tit for tat”的思想。但這些東西并不是最優(yōu)的,因?yàn)椤耙粓?bào)還一報(bào)”在充滿了隨機(jī)性的現(xiàn)實(shí)社會(huì)生活里是有缺陷的。對(duì)此,孔子在幾千年前就說出了“以德報(bào)德,以直報(bào)怨”這樣精彩的修正策略,所謂“直”,就是公正,以公正來回報(bào)對(duì)方的背叛,是一種修正了的“一報(bào)還一報(bào)”,修正的是報(bào)復(fù)的程度,本來會(huì)讓你損失5分,現(xiàn)在只讓你損失3分,從而以一種公正審判來結(jié)束代代相續(xù)的報(bào)復(fù),形成文明。
      參考文獻(xiàn):
      1、羅伯特?艾克斯羅德.對(duì)策中的致勝之道――合作的進(jìn)化[M].上海人民出版社,1998.
      2、高鴻業(yè).西方經(jīng)濟(jì)學(xué)[M].中國(guó)人民大學(xué)出版社,2000.
      3、謝識(shí)予.經(jīng)濟(jì)博弈論[M].復(fù)旦大學(xué)出版社,2002.
      (作者單位:上海財(cái)經(jīng)大學(xué)人文學(xué)院)
      

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
博弈論與納什平衡
博弈論
內(nèi)部審計(jì)中的博弈論(三)之審計(jì)定位
畫說博弈論:何為囚徒困境?
走出“不要輸在起跑線上”的囚徒困境
搜索:博弈論與納什平衡
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服