中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
什么才是長(zhǎng)期合作博弈的最佳策略

很多人都聽說過“囚徒博弈”,博弈雙方都朝著對(duì)自己最有利的方向進(jìn)行理性決策,最終卻無可奈何地得出“雙輸”的結(jié)果。

但現(xiàn)實(shí)并不是只博弈一次的一錘子買賣,參與博弈的對(duì)象往往也遠(yuǎn)多于兩個(gè)。那么,在長(zhǎng)期的、多次的、多人參加的博弈中,什么才是最佳策略呢?

1980年代,密歇根大學(xué)的社會(huì)學(xué)家/政治學(xué)家羅伯特·阿克塞爾羅德(Robert Axelord)組織了一個(gè)博弈競(jìng)賽,內(nèi)容就是囚徒困境,所有參與者(不同策略)兩兩博弈,看最終誰的收益最大。

可以預(yù)想,參與者設(shè)計(jì)了各種各樣復(fù)雜的博弈策略,但最終勝出的卻是一個(gè)非常簡(jiǎn)單的策略,英文叫“Tit for Tat”,一般翻譯作“以牙還牙”,更確切的含義可能是“針鋒相對(duì)”。

這個(gè)策略其實(shí)就兩條:

1、首先(第一輪)選擇合作;

2、復(fù)制上一輪對(duì)手的選擇。

上一輪對(duì)手選擇合作,我就選擇合作;上一輪對(duì)手背叛,我就選擇背叛。

這不就是中國(guó)古話說的,“人不犯我,我不犯人;人若犯我,我必犯人”?

沒想到這樣一個(gè)簡(jiǎn)單的策略竟取得了最好成績(jī)。阿克塞爾羅德也不太敢相信,又組織了第二次比賽,更多博弈論專家、計(jì)算機(jī)專家、心理學(xué)家參與進(jìn)來,出現(xiàn)了更復(fù)雜的算法,結(jié)果勝出的還是這個(gè)“以牙還牙”。

那么“以牙還牙”策略有什么特點(diǎn)呢?

1、友善:“以牙還牙”首先選擇合作,不主動(dòng)背叛;

2、報(bào)復(fù):遭到背叛,就一定還擊;

3、寬恕:對(duì)方再次合作,就既往不咎;

4、不嫉妒:每一輪最好的結(jié)果只是和對(duì)方打平。

“以牙還牙”策略顧及的是大局,集體利益為上,長(zhǎng)期利益為上。結(jié)果在復(fù)雜的多次多人重復(fù)博弈中,反而老實(shí)人獲得了最終的勝利。

于是上述四個(gè)特點(diǎn)似乎也可以成為我們?yōu)槿颂幨赖膮⒖?。其中兩條根本就是孔老夫子所說的“以直報(bào)怨,以德報(bào)德”嘛。

后來阿克塞爾羅德就寫了本書,叫《合作的進(jìn)化》,已經(jīng)是名著了。我還沒讀過,但是看豆瓣評(píng)分挺高。

不過且慢,“以牙還牙”實(shí)際上是一個(gè)很脆弱的策略。在計(jì)算機(jī)模擬中,這個(gè)策略很有效,但在現(xiàn)實(shí)中則未必,因?yàn)楝F(xiàn)實(shí)容易出差錯(cuò)。

設(shè)想下,如果某一輪,對(duì)手不小心操作失誤,或者像現(xiàn)實(shí)中經(jīng)常會(huì)遇到的可能是“無心之過”,結(jié)果你選擇了“以牙還牙”。那,既然大家都知道“以牙還牙”是個(gè)好策略,對(duì)方繼續(xù)“以牙還牙”。結(jié)果呢,就是陷入無限的報(bào)復(fù)……

明明只是選擇了“以直報(bào)怨”,卻因?yàn)楝F(xiàn)實(shí)中的差錯(cuò)或誤解,導(dǎo)致了“冤冤相報(bào)何時(shí)了”。

所以博弈論專家們發(fā)明了一個(gè)在現(xiàn)實(shí)中更“寬容”一些的策略,可以稱作“以牙還牙(改進(jìn)版)”或者“寬容以牙還牙”,英文是'Tit for tat with forgiveness' 。在這個(gè)策略里頭,對(duì)方背叛一次,我繼續(xù)合作;只有當(dāng)對(duì)方連續(xù)背叛兩次,我再報(bào)復(fù)。

假如人人都寬容一些,也許才更有利于全社會(huì)利益的最大化。

不過,直到前陣子,我才聽說關(guān)于這個(gè)問題,最佳策略又易主了。

哈佛大學(xué)教授馬丁·諾瓦克(Martin A. Nowak)在經(jīng)過無數(shù)次計(jì)算機(jī)模擬后,發(fā)現(xiàn)了一個(gè)更優(yōu)的策略,叫做“Win-stay, lose-shift”,意思是贏就繼續(xù)輸了就變,也有翻譯作“贏定輸移”。

諾瓦克也寫了本書,叫《超級(jí)合作者》,我還沒空看。

“贏定輸移”策略比“以牙還牙”策略勝在哪里呢?

第一,它比“以牙還牙”更冷酷。遇到好騙的,它就騙;只要能騙,就一直騙下去。

第二,它對(duì)認(rèn)知能力的要求更低。不需要觀察對(duì)手什么策略,只要看自己的得失,賺了就繼續(xù),虧了就換招。

這個(gè)策略,擊敗了“以牙還牙”和“寬容以牙還牙”。而且,它竟然更簡(jiǎn)潔。我們不由得懷疑它是不是已經(jīng)很接近最終“真理”了。

但是所有思想實(shí)驗(yàn)都是有邊界條件的,它們都能給我們啟發(fā),但都不會(huì)是復(fù)雜世界的簡(jiǎn)單真理。

“贏定輸移”這個(gè)策略其實(shí)也有瑕疵,就是它假定的是博弈雙方同時(shí)出招。但是,各位,我們現(xiàn)實(shí)中的博弈,哪有什么同時(shí)出招,都是有先后的(不過很多場(chǎng)合可簡(jiǎn)化視作同時(shí)出招)。

科學(xué)家們通過大量的實(shí)驗(yàn)發(fā)現(xiàn),在“同步型”的囚徒困境博弈中,“贏定輸移”是最優(yōu)策略;然而在“交替型”囚徒困境博弈中,“寬容以牙還牙”反而更勝一籌。大概,是因?yàn)椤皩捜菀匝肋€牙”更鼓勵(lì)合作,也更注重集體利益吧。

復(fù)雜的世界,既不會(huì)是純粹的“同步型”,也不會(huì)是純粹的“交替型”,甚至可能都不會(huì)是囚徒困境博弈。但話雖如此,這些有趣的思想實(shí)驗(yàn)對(duì)我們的決策模式還是有很大參考價(jià)值。

無論是“贏定輸移”策略,或者“寬容以牙還牙”策略,它們都有很重要的一點(diǎn),就是——重視反饋。歸納法誠(chéng)然有遇到許多謬誤,但從實(shí)踐的結(jié)果中不斷地去學(xué)習(xí)和調(diào)整,恐怕是我們不完美的人類所能做出的最佳選擇。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
博弈論經(jīng)典:囚徒困境,讓你走出現(xiàn)實(shí)中的困境
經(jīng)管 |《策略思維》:商界、政界及日常生活中的策略競(jìng)爭(zhēng)
博弈論案例分析
商戰(zhàn)“囚徒困境”有解
博弈的最佳策略是“一報(bào)還一報(bào)”
博弈論——納什均衡、囚徒困境
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服