書友你好,歡迎來到非凡精讀館,我是路一鳴。今天跟大家分享的這本書,叫《合作的進化》。
有人說這本書有資格跟《圣經(jīng)》相提并論,為什么評價這么高呢?因為它告訴了我們,一個人應(yīng)該怎么跟別人、跟社會打交道,甚至回答了一個困擾很多人一生的問題:好人究竟有沒有好報?你看《農(nóng)夫與蛇》《東郭先生與狼》,那說的都是好人沒好報,壞人恩將仇報的事。再看看現(xiàn)實當(dāng)中,那些吃虧上當(dāng)?shù)娜耸遣皇谴蠖嗍呛萌耍蠖嗍巧屏嫉娜??所以越來越多的人覺得好人沒好報。
這本書就是從博弈論的角度,幫我們分析并且判斷,在跟別人打交道的時候,在跟別人構(gòu)成的社會環(huán)境打交道的時候,應(yīng)該采取什么樣的策略?我們應(yīng)該做一個好人,還是應(yīng)該做一個壞人?怎么做好人才能讓自己有好報呢?當(dāng)好人遇到壞人的時候,好人應(yīng)該怎么做,才能讓這個社會上好人越來越多,壞人越來越少?
我們跟別人打交道的時候基本上有兩種選擇,就是我們要不做一個好人,要不做一個壞人。
什么叫做好人?做好人就是寬以待人。我很善良地對待你,我也不圖貪你的便宜,我也不設(shè)計一個局讓你吃虧,反正我就跟你合作。當(dāng)然我要考慮我個人的利益,但是我不損人利己,我在滿足我的利益的時候也保證你的利益,這就等于是做好人了。
做壞人恰恰反過來,我得想方設(shè)法地占你的便宜,我得讓你吃虧,我弄個當(dāng)讓你上上,這就叫做壞人。
我們平心而論,反正甭管做好人還是做壞人,不管我們選擇用好人的策略,還是壞人的策略跟別人打交道,我們的目的本來是不是都是獲得個人利益的最大化?
接下來的問題就是,什么時候做好人,什么時候做壞人,才能實現(xiàn)我的利益最大化呢?
很幸運,這也是很多學(xué)者們關(guān)心的問題,他們也非常想知道,在假設(shè)人人都利己的前提下,怎么會出現(xiàn)合作呢?人們?yōu)槭裁匆献髂兀渴裁礃拥暮献鞣绞讲攀亲钣行У哪兀?/font>
這本書的作者就是一位博弈論專家,他叫羅伯特·阿克塞爾羅德,是一個大學(xué)教授,他設(shè)計了博弈論研究領(lǐng)域里最著名的計算機競賽,對這個比賽結(jié)果的研究,就是這本書的基本內(nèi)容。
注意,前邊我們在說做好人,還是做壞人,但是在博弈論里用的詞不叫好人還是壞人,叫合作與背叛。選擇當(dāng)好人還是當(dāng)壞人,在博弈論的策略里就叫選擇合作策略,還是背叛策略。
一、做好人,還是做壞人,哪個更賺?
01 囚徒困境:坦白從寬,還是抗拒從寬?
為了更好地理解博弈論,我們先從它的起點,也就是囚徒困境開始。什么叫囚徒困境?兩個壞蛋被警察抓住了,警察說你們兩個誰先招供,誰就獲得獎勵。那個不招供的人就要受到處罰。
為什么叫囚徒困境呢?我們來看看這個矩陣(如下圖)。
在這張圖里,行和列分別代表了參與博弈的雙方。在博弈過程中,如果你是參與的一方,你的最優(yōu)策略是什么策略?
假設(shè)對方選擇合作:
情況1:對方合作,你選擇合作,兩個人各3分。
情況2:對方合作,你選擇背叛,對方0分,你5分。這個時候你選擇背叛比合作好,5分比3分高。
所以,如果對方合作,你就應(yīng)該背叛。
假設(shè)對方選擇背叛:
情況1:對方背叛,你選擇合作,你0分,對方5分,他占了你便宜.
情況2:對方背叛,你選擇背叛,他1分,你也1分。雖然只有1分,但是總比被對方占便宜好,比0分好。
所以如果對方背叛,你就應(yīng)該背叛。
前面第一種大的情況我們說的是什么?如果對方合作,你就應(yīng)該背叛。所以,對你來說最優(yōu)策略是,不管對方合作還是背叛,你都要選擇背叛。
反過來也一樣。對另一個參與者而言,他的最優(yōu)策略也是背叛。
好,那么現(xiàn)在困境來了。對單一參與者而言,不管對方怎么選擇,最優(yōu)策略都是我要背叛,結(jié)果兩個人共同的選擇都是背叛,收益是各1分。但是請注意,我們明明選擇了一個最優(yōu)策略(就是不管對方選擇什么,我的策略都能讓得到每種情況下的最高分),但最后怎么才得了1分?但是我們也知道,明明有一個更好的分?jǐn)?shù),是可以獲得3分的。就是我們雙方合作,各得3分不好嗎?這就是囚徒困境中的困境。我們選擇了最優(yōu)策略,卻失去了一個比最優(yōu)策略的結(jié)果更好的結(jié)果的機會。
到這里,我們可以從囚徒困境的基礎(chǔ)模型里,學(xué)到博弈論教給我們的第一個常識性結(jié)論:
一個人的收益,不僅來自于他選擇的策略,也來自于對方選擇的策略,是雙方的策略共同作用的結(jié)果。
我們翻譯成大白話,就是你跟別人打交道,重要的是對方選擇做好人還是壞人。
02 理想和現(xiàn)實的博弈,誰敗給誰?
最現(xiàn)實、刻骨銘心的一句話:理想很豐滿,現(xiàn)實很骨感。我們看到囚徒困境就明白了,這是因為你在跟社會、跟無數(shù)他人打交道的過程中,最后結(jié)果不是自己一方?jīng)Q定的,是雙方共同作用的結(jié)果。
你按照你的設(shè)想去給出一個策略、一個動作的時候,對方根本不按你的套路來,那最后磨平的過程,就是現(xiàn)實很骨感的過程。囚徒困境告訴我們的道理就是,好人到底有沒有好報,在單一的一次跟對方打交道的過程中,取決于對方是好人還是壞人。
如果你說我們吃一塹,長一智,知道陷入囚徒困境的原因是僅僅站在自己立場上,選擇了自己認(rèn)為的那個所謂最優(yōu)策略,那下一次學(xué)會了、學(xué)乖了,我們倆下次碰面的時候,會不會自然地就吃一塹,長一智,選擇合作呢?不會!
為什么?因為只要你們打交道的次數(shù)是限定的,次數(shù)是可預(yù)期的,那雙方都會采用背叛的策略,大家會再次陷入囚徒困境中。因為經(jīng)過這一次或者有次數(shù)限制的博弈后,你們倆就再也不打交道了,不管合作還是背叛都沒機會了,所以在這一次里,人們?nèi)匀灰x擇那個所謂最優(yōu)策略,也就是背叛。
二、人人利己,合作從哪兒來?
01 打破困境,實現(xiàn)最大收益
那如何打破囚徒困境呢?第一個條件就是要重復(fù)博弈。
大家第一次碰面,你也不認(rèn)識我,我也不認(rèn)識你,這個叫單次博弈。單次博弈就會陷入囚徒困境,打破囚徒困境首先要打破單次博弈。
第二個條件,收益預(yù)期要足夠大。
為了更好理解,我們舉個例子來說明什么叫重復(fù)博弈,什么叫未來收益足夠大。
我們有沒有這樣的體驗或者經(jīng)歷:旅游的時候,到車站、碼頭這些客流量大,你這輩子再去第二次的可能性又很低的地方。這種地方什么事多?假冒偽劣商品多,吃虧上當(dāng)?shù)臋C會多。怎么這些地方、賣旅游商品的地方容易坑人呢?為什么車站、火車站、碼頭假冒偽劣的東西就多呢?
我們想一想,提供這類商品和服務(wù)的商販們的策略是什么?他們對博弈的預(yù)期是什么?就是這里客流量很大,一天經(jīng)過十幾萬人,這些人下回再來的可能性很低,再來可能都要五年之后了,所以我和他之間是單次博弈。你買東西的時候不會意識到這一點,你忘了你們是單次博弈,所以他愿意用假冒偽劣來坑你一把,坑一把是一把。坑完你,你也就走了,經(jīng)過收益成本的分析,你也懶得再花時間、花精力,回來再起訴他,所以這是單次博弈。
什么叫未來收益預(yù)期足夠大?就是這人天天從車站里出來,就到某個商販這里買東西。如果真有這么一個旅客,店主給他提供的肯定是真的東西。因為一旦提供了假的東西,就是背叛了他,坑了他了,就會影響未來的收益。這里的未來預(yù)期收益是什么?就是這人下回再也不來買東西了。
所以這本書要解決的第一個問題就是,在利己主義者中間,什么條件下才會產(chǎn)生合作。
囚徒困境面對的情況是,在面對一件事情的時候,我們會有不同的選擇,但是這兩種選擇導(dǎo)致的結(jié)果不會是你死我活,這不是博弈論里的零和博弈。什么是零和博弈?它指的是我贏你就肯定輸,那叫下象棋,那是零和博弈,因為只有一方能贏。而囚徒困境是指,我們有多種策略選擇,在每一種策略選擇之下,收益的結(jié)果不一樣。面對不同策略,我們怎么選擇那個讓我們收益都變得更大的策略呢?它關(guān)心的是這個問題。
02 一報還一報的善良策略
回到我們在一開始就講的問題,那個每個人都要面對的問題:人這一生要跟那么多人打交道,跟他們打交道的時候,我到底做個好人,還是壞人?我要不要做個善良的人?我跟對方是合作,還是騙他一把,自己占點便宜?對應(yīng)在博弈論里就是,我應(yīng)該合作,還是背叛?我采用哪種策略呢?
作者一開始也不知道,所以他設(shè)計了一個計算機程序大賽。
他邀請全世界來自心理學(xué)、經(jīng)濟學(xué)、政治學(xué)、數(shù)學(xué)和社會學(xué)五個領(lǐng)域的專家,而且他們都是對博弈論是有過研究的人。讓這些人設(shè)計一套自己的策略程序,來看看哪一種策略在跟別人打交道的過程當(dāng)中最有優(yōu)勢,得分最高。
他一共收到了14個程序,這14個程序兩兩之間做博弈,打交道,一共是5輪比賽,每次200局,一共是12萬次對決,有24萬個不同的策略組合,這些策略每個都不一樣,各種各樣的,刁鉆的稀奇古怪的策略都有。最后誰贏了?是所有的程序里最簡單的那個程序得了最高分,這個程序就叫一報還一報。
一報還一報程序是怎么運行的?第一步他一定先選擇跟對方合作,從那以后他的選擇就是在重復(fù)對方上一步的選擇。第一步他跟對方合作,不管對方跟他打交道的第一步是合作還是背叛,一報還一報下一步的策略一定是重復(fù)、去模仿對方上一步的策略。你剛才跟我合作了,我接下來就跟你合作。你剛才背叛我了,我接下來就背叛你。
一報還一報是所有程序里最簡單的程序,但是得分最高。這還不是最令人震驚的,在前8名的程序里,所有程序都是善良的程序。
那你說第一次大家可能還不懂,設(shè)計的程序也太簡單,沒拿這當(dāng)回事。好,作者又組織了第二輪比賽。第二輪比賽做了進一步的升級,首先他邀請的參賽者更廣了,又增加了計算機科學(xué)、物理學(xué)、進化生物學(xué)的教授,這一次他一共收集到了63個程序,而且他把第一屆比賽的結(jié)果還告訴了所有人,讓大家看到第一輪比賽中哪些程序的得分是多少,排名是什么。
第二輪的比賽結(jié)果呢?誰贏了?誰是冠軍?還是一報還一報。一報還一報是所有的參賽程序里唯一沒有被改動過的程序,第二輪又贏了。
在第一輪里,前8名都是善良的程序。那第二輪比賽什么結(jié)果呢?第二輪比賽前15名的程序里,只有一個是不善良的,后15名只有一個是善良的。也就是好人排名都在前邊,壞人排名都在后邊。
有人還是不服氣,還是不放心,難道一報還一報這么厲害嗎?他們開始改游戲規(guī)則。游戲規(guī)則做了6次更改,讓一報還一報碰到的策略對手更多樣化、更刁鉆、更狡詐,當(dāng)然也有可能更單純。6個變形的比賽規(guī)則之下,一報還一報5次排名第一,1次排名第二。
從這樣的比賽結(jié)果中,我們可以得到這本書告訴我們的第二個重要的結(jié)論:
在跟別人打交道的過程中,我們首先要保持善良,然后根據(jù)對方的策略,隨時調(diào)整轉(zhuǎn)換我的策略,以其人之道還治其人之身,就是最好的策略。
現(xiàn)在我們來看看一報還一報厲害在哪兒,怎么就能在每一次不管面對什么對手的時候,都得高分呢?它的特點是什么?
善良性。
主動地跟對方合作,從來不主動讓自己陷入麻煩,所以第一步永遠是合作,不管對方是不是認(rèn)識的、熟悉的,在跟陌生人打交道的時候,第一步都是合作,這是它的善良性。
2. 可激怒性。
我不能白白吃虧,你只要坑我一回我就記住了。我第一步先合作,接下來我就模仿你上一步的策略,你跟我合作了我下一步還合作,你要是背叛了我,我下一步一定背叛你,這叫可激怒性。
3. 寬容性。
如果對方合作我馬上就合作,因為我在模仿你的策略。你要一直背叛我,我就一直背叛你,你有一次開始跟我合作了,我馬上就開始跟你合作,不計前嫌。
我們作為家長跟孩子之間該怎么打交道?我們都特別愛孩子,特別想滿足孩子的各種要求。帶孩子去商店,孩子突然看見一個特別好玩的玩具,他就要買。我覺得不能給他買,他坐地上打滾,好多人都圍觀,他讓我很難堪。我該怎么做?我一開始跟他合作,他有合理的要求我都滿足他,他撒潑打滾我就不能滿足他。那孩子知道錯了我要不要記仇?不用。明天還記這事嗎?不用記了。如果孩子下次懂禮貌、守規(guī)矩,我們就要表揚,甚至還提供獎勵,這叫寬容性。
有的程序設(shè)計成了你只要背叛我一次,我下次碰見你永遠背叛,不管你是什么反應(yīng),不管你合作還是背叛,我就一直背叛下去,這不叫人不犯我,我不犯人,人若犯我,我必犯人,這叫人若犯我,我記你一輩子。
這樣的策略得分很低。為什么得分低?因為每一次對對方的無限制的懲罰,都會遭致對方的背叛,導(dǎo)致自己的收益也降低。還記得博弈論告訴我們的第一個結(jié)論嗎?就是你跟對方打交道的過程中的收益,不僅取決于你的策略,也取決于對方的策略,是你們雙方策略共同的結(jié)果決定了最后的收益。所以你如果一直懲罰對方,毫不原諒,從來不給對方改過自新的機會,你得到的也只能是背叛,而你的收益就會降低。
總結(jié)一下,善良性、可激怒性和寬容性,是一報還一報的前三個特點。
4. 清晰性。
一報還一報一點都不復(fù)雜,很容易就琢磨透了。不首先背叛對方,可是如果對方背叛他,他就會報復(fù)。如果對方不再背叛他了,他也就不再報復(fù)對方了。簡單一點就是,對方是壞蛋,他肯定是壞蛋。對方要是好人,他就是好人。這個規(guī)則特別清晰,所以可以被很多人理解。
03 生態(tài)模擬:好人和壞人誰活得更長?
如果一報還一報是最有效的策略,但是大千世界無奇不有,誰都有自己的策略,也都有自己的策略的生存土壤,如果采用一報還一報的策略,這些策略能繁榮下去嗎?能在社會上變得越來越多嗎?
我們這作者也沒閑著,他也想知道這個問題的答案,所以他又做了一次模擬,叫計算機生態(tài)模擬。這個生態(tài)模擬的目的是要看看這些策略的代際傳承是什么結(jié)果,或者我們更直白地說,如果讓不同策略無休止地、無限制地博弈下去,最后得分低的那些策略還有沒有生存空間?
在模擬結(jié)果的呈現(xiàn)上,我們看到了一個令人非常震驚的答案,像一報還一報這樣的規(guī)則,有越來越多的人會采用;那些投機取巧的,坑蒙拐騙、得分低的規(guī)則,也就是所謂壞人規(guī)則、不善良的規(guī)則被淘汰了,善良的規(guī)則,做好人的規(guī)則,慢慢地發(fā)展起來了。
現(xiàn)在你是不是被這本書得到的結(jié)論鼓舞到了?但是作者沒有停止探索,他提出了另外一個問題:在一個相對固定的策略規(guī)則里,一個新的規(guī)則來了,這個新的規(guī)則怎么能夠落地生根呢?用專業(yè)術(shù)語解釋,叫什么策略是集體穩(wěn)定的?這句話什么意思?就是把好人扔進壞人堆里,好人能不能活下去?把壞人扔進好人堆里,是會把好人帶壞,還是壞人可以變好?
結(jié)論是,當(dāng)一個好人被扔到壞人堆里的時候,他活不下去。什么情況下,好人策略可以落地生根?大概占5%或者至少有兩個策略是善良的策略的時候,才會落地生根。因為這種情況下,好人總有機會碰到一個善良的策略,雙方都合作,收益變大,只要合作的頻次有足夠保障,收益就一定會高于跟壞人合作。有5%這樣的策略,善良策略就可以落地生根。大概經(jīng)過代際的傳承,壞人就會越來越少,好人就會越來越多,因為合作的收益永遠比背叛的收益要大。
反過來,壞人扔進好人堆里,就一個壞人,你說他會把好人帶壞,還是被好人淘汰?同樣的結(jié)果,就一個壞蛋的情況下,他會被好人淘汰。如果是倆壞蛋呢?倆壞蛋也會被淘汰。
大家還記得什么叫好人策略嗎?是一報還一報。一報還一報不是永遠做好人,不是任人宰割,所以,一報還一報這樣的優(yōu)勢策略是穩(wěn)定的,它會把那些貪小便宜,占別人便宜,挖空心思損人利己的人排擠在外。
我相信到這個時候,大家心里一定有疑問,為什么有的時候現(xiàn)實不是這樣呢?這個問題我們會在接下來對一報還一報的進一步解析當(dāng)中給出答案。
我們現(xiàn)在記住了什么策略是穩(wěn)定的,什么樣的條件下能夠?qū)е潞献鳎?/font>
未來的收益足夠大,善良的策略就是穩(wěn)定的。
因為未來收益足夠大,大家才會合作。
2. 保持可激怒性。
如果我們要保持一個策略的穩(wěn)定,還有一個前提,必須要被可激怒。
思考一下,溺愛是怎么來的?溺愛就是那個孩子撒潑打滾的時候,你終于屈服了,你滿足了他的要求,你沒有轉(zhuǎn)身就走,所以這個孩子不管做什么,都能夠得到他想要的那個結(jié)果,你都會想盡辦法滿足他。
為什么現(xiàn)在車站、碼頭、旅游景點賣假冒偽劣商品的越來越少了?因為公權(quán)力的存在,讓一報還一報變成了可能。不是那個吃虧的人去報復(fù)他,是有一個公權(quán)力代表你去報復(fù)他。根據(jù)市場的規(guī)則,你賣假冒偽劣產(chǎn)品,我就要處罰你,而且處罰得很重。所以他和你在一起合起來變成了一報還一報。法律、規(guī)則都是一報還一報策略的具體的執(zhí)行者。
注意,可被激怒它的本質(zhì)含義是背叛的策略一定要被報復(fù)。
這里作者提醒了我們一點,就是合作是追求收益最大化的一個策略選擇,其實是基于現(xiàn)實利益的考量,大家不用跟友誼、道德聯(lián)系起來。你跟他不認(rèn)識,一報還一報一樣起作用,你跟他是好朋友,一報還一報也是最優(yōu)策略。
04 戰(zhàn)場上也能產(chǎn)生合作?
作者在書里甚至給我們舉了一個敵對雙方實現(xiàn)合作的例子。
第一次世界大戰(zhàn)期間,英國和德國兩軍對壘,結(jié)果他從57個師的一百七十多份戰(zhàn)地日記里,發(fā)現(xiàn)了一報還一報的這種合作策略。是怎么在敵對雙方之間發(fā)生的呢?這種策略在當(dāng)時戰(zhàn)爭環(huán)境里叫讓自己活,也讓別人活。
一個戰(zhàn)線上雙方對壘,今天你打我,明天我打你。而且在相對穩(wěn)定的時間里,雙方營級單位的士兵都不會輪換,所以時間一長他們就知道,只要你打我,我就會打你,你今天殺害了我來送飯的兩個炊事員,明天我一定會報復(fù)你。
在重復(fù)的博弈當(dāng)中,雙方都摸到了對方的脾氣,就有一個奇怪的現(xiàn)象發(fā)生了。明明我軍在敵軍的射擊范圍之內(nèi),敵軍也不開槍。同樣地,他們在我們的射擊范圍內(nèi)出現(xiàn)的時候,只要沒有上峰的命令,我軍也不開槍。一開始我們炊事員匍匐前進,后來吹著口哨就來了,因為他知道對方不會射殺他,因為只要他一射殺我們的炊事員,我們就會打擊報復(fù)。
那如果陣地要換防了呢?換防的部隊會告訴來接防的部隊,說我們跟對方之間有這樣的默契,所以你也不用先打他。這是在戰(zhàn)爭膠著狀態(tài),雙方都各守陣地,誰也別想攻過去,因為反復(fù)爭奪之下,總有一方還會攻回來。那如果上峰下了命令非要死命進攻呢?那就已經(jīng)打破這種合作存在的前提了,因為有集權(quán)的存在了。
自己活,也讓別人活不是個案,大家記住,這是來自57個師的一百七十多份戰(zhàn)地日記,敵對雙方都能達成這樣短暫的、令人驚奇的合作,這就是一報還一報策略帶來的讓人意想不到的,但是又落地生根、繁榮發(fā)展的結(jié)果。我活,我也讓你活;你活,你得讓我活,這可以理解成一個互相制衡的結(jié)果,但是這種制衡的結(jié)果導(dǎo)致的合作,在敵對雙方之間能夠出現(xiàn),一方面這當(dāng)然令人嘆為觀止,另一方面也說明,博弈合作會出現(xiàn)在我們生活的諸多方面,而且不以友誼為前提。
三、認(rèn)清現(xiàn)實,做一個理智的好人
01 這些行為要不得
既然我們已經(jīng)接受了這個事實,理論推導(dǎo)、計算機模擬、現(xiàn)實的案例都告訴我們,要善良,要一報還一報,要被激怒,這對現(xiàn)實生活的幫助是什么呢?作者給我們列舉了幾條。
別嫉妒。
你在生活當(dāng)中嫉妒別人沒有用,你要獲得更大的收益,前提是你也得讓對方獲得收益。嫉妒對方容易導(dǎo)致背叛,因為你心里不平衡,你嫉妒,你也不管收益有沒有增加,你讓對方的收益變小了,你心里就平衡了,這就是嫉妒的結(jié)果。你采用背叛的策略,你一背叛,對方就會報復(fù)你,結(jié)果你倆誰也沒有好果子吃,你的收益也降低了。
你應(yīng)該真誠期待跟你合作的人,跟你打交道的人獲得成功,因為他成功了,他跟你的合作才會持續(xù)下去。
2. 不要首先背叛。
你一背叛對方肯定會背叛,雙方一背叛收益就會降低。
3. 不管對合作還是對背叛都要給予回報。
這句話是不是讓我們想到了孔子說過的話:“以德報怨,何以報德。”這就是一報還一報的策略,不管對方合作還是背叛,你都要給予回報。如果合作,你就合作;如果背叛,你就一定要背叛。
我們想一想校園霸凌是怎么出現(xiàn)的。就是當(dāng)別人欺負你的時候,你還選擇合作,你忍氣吞聲,霸凌的行為就會愈演愈烈。我記得我做法制節(jié)目主持人的時候,采訪中國人民公安大學(xué)的李玫瑾教授,她告訴我怎么杜絕校園霸凌,就是要告訴孩子,第一次遇到霸凌行為的時候,就要堅決地說不,就要堅決地予以反擊。反擊的策略不是跟對方廝打,而是引用一個集權(quán)的力量,可以是老師,可以是家長,可以是其他的同學(xué),甚至就是你自己,要勇敢地站在對方面前,必須向我道歉,否則這事不算完,對方就會收到你對他的“報復(fù)行為”,這就叫對合作和背叛都要給予回報。這個時候?qū)Ψ降陌粤栊袨?,才有可能收斂?/font>
這本書在分析一報還一報的時候,總是強調(diào)要給回報,不管是合作還是背叛都要給回報。這里的回報其實它指的是要對對方的策略行為給出相應(yīng)的反應(yīng)和反饋,而不是我們通常意義上那種善意的回報、報答。你不管做什么傷害我的事,有益于我的事,我都給你好處,這才叫回報嗎?不是。這里的回報指的就是正向的反饋,不管是你跟我合作還是背叛我,我都要給出正面、直接的反饋,基于你的策略,我來給出我的反饋策略,這是這里的回報的意思。
4. 別耍小聰明。
作者在這個計算機模型比賽中發(fā)現(xiàn),有一些程序的設(shè)計者老想耍小聰明,就是一開始表現(xiàn)挺規(guī)律的,你合作我就合作,你背叛我就背叛,但是他會抽冷子背叛一次。當(dāng)你對我放松警惕的時候,我背叛一次,我占你一個小便宜,我在這個回合里占你便宜,這樣的策略有沒有得高分呢?并沒有。因為囚徒困境不是零和博弈,不是你拿了這個好的,你拿了好處對方就失去了所有,就竹籃打水一場空,不是。囚徒困境是我們有多種選擇,不是你死我活,你耍了小聰明,對方會記住你,下次都會反饋到你身上。所以,你對對方的策略,包括耍小聰明,最后由于重復(fù)博弈,都會反射到你自己的身上。
所以大家記住,對我們現(xiàn)實生活的幾個提示:
不要嫉妒。
不要首先背叛。
對合作和背叛都要給予回報。
別耍小聰明。
02 更好促進合作,讓大家都有賺頭
我們剛才說的都是不要做什么,那我們要做什么呢?我們做點什么才能促進彼此的合作呢?作者也給出了建議。
要增大未來的影響。
我們想一下,非凡精讀或者是樊登讀書用來解讀和指導(dǎo)婚姻、生活的書籍多,還是用來指導(dǎo)我們怎么交朋友的書籍多?肯定是婚姻家庭的書籍多,為什么?因為重復(fù)博弈未來的收益足夠大,它足夠讓我們花時間、花精力去學(xué)習(xí)這方面的知識,這就是增大未來的影響。
2. 讓接觸更加頻繁。
這個現(xiàn)象在我們的實際生活當(dāng)中也比比皆是。很多甲方廠家,就是買方那里,怎么會有那么多的供應(yīng)商名錄呢?這供應(yīng)商名錄干嘛的?自然是對供應(yīng)商資質(zhì)提出一個標(biāo)準(zhǔn)。但這個資質(zhì)又是怎么來的呢?就是長期合作長期打交道的結(jié)果。時間證明這些供應(yīng)商是符合我的采購標(biāo)準(zhǔn)的,所以我讓他們進入名錄。
如果新來了一個供應(yīng)商,水平跟他們差不多,質(zhì)量跟他們一樣,甚至有可能比他們還好,就是沒在你的名錄里,能不能變成你的供應(yīng)商?一般情況下不可能。這一些還都是著名的廠家做出的決策,他干嘛要拒絕一個潛在的供應(yīng)商,一個可能更優(yōu)秀的供應(yīng)商?因為他要增加彼此合作、接觸的頻繁程度,你們這幾個供應(yīng)商我告訴你們,我們以后會經(jīng)常打交道,一直打交道,所以誰也別想騙我,誰也別想坑我。
我們想得更深一步,企業(yè)其實也是這么出現(xiàn)的。兩個人,一個做鞋帶,一個做鞋面,三個人之間再加一個做鞋底的。鞋帶、鞋面加鞋底組成了一只鞋,我們?nèi)齻€人本來誰也不挨著誰,你買我的鞋帶,我買你的鞋面,后來發(fā)現(xiàn)我們仨經(jīng)常打交道,我們省掉那個互相討價還價的過程,我們合伙好不好?我們一合伙,接觸的頻繁程度就更增加了,因為沒別人了,有別人我們都不愿意選了,我們仨是一伙的,這個企業(yè)就形成了。大家就不再用市場交易的方式完成彼此之間的合作,這時候合作就更加頻繁了。
3. 改變收益值,讓合作的收益大于背叛的收益。
你不是撒潑打滾嗎?那就不理你了。但如果你表現(xiàn)得很通情達理,那也許我們明天可以去環(huán)球影城玩一圈。讓未來改變合作的收益,讓合作的收益值顯得足夠有誘惑力,大于背叛的收益。
4. 有點讓我意想不到,關(guān)心他人。
雖然前面說了合作的前提不是友誼,但教育的好處是讓人們具有關(guān)心他人的動機。這動機干嘛用的?那就是在跟別人打交道的時候,你可別光想著自己。博弈的基本規(guī)則就是,收益取決于雙方的策略,不是你一個人說了算的。如果你關(guān)心他人,你就能想到對方的利益在哪里,你就會主動地采取那種合作的策略。
5. 促進合作的方法就是要回報。
這個前面也說過了,反正不管他是背叛還是合作,你都要回報。他背叛,你還合作,你就是唐僧,你就叫溺愛。他合作,你背叛,你就是小人。他合作,你也合作,你就給了他一個積極的信號,他下次還跟你合作,你們雙方的合作就建立起來了,就會持續(xù)下去。
6. 改進辨別的能力。
你得記住這個人上一次跟你打交道的時候,采用的是什么策略,你會在接下來跟他打交道的時候采用相應(yīng)的對策。一報還一報就是你上次怎么對我的,我這次就怎么對你,這叫以其人之道還治其人之身。那如果你忘了呢?你還保持一個善良的策略的規(guī)則,你有可能一直被人占便宜,因為你忘了他上次坑過你了。
品牌意味著什么,在我們的現(xiàn)實生活當(dāng)中,品牌就是要告訴你我是個品牌,我可不是地攤貨,不是三無產(chǎn)品。我是品牌,意味著我要持續(xù)經(jīng)營這個產(chǎn)品,要持續(xù)樹立這個品牌,要持續(xù)經(jīng)營這家企業(yè),所以你可以相信我這次不會坑你,因為我下次還準(zhǔn)備賣你東西,我還準(zhǔn)備賣別人更多的東西,我會珍惜我的品牌形象,這就叫讓你對我有一個清晰的辨識度。我是一個品牌,我跟別的品牌不一樣,我跟沒有品牌的商品更不一樣。品牌的建立,就是出于增加辨識度,給人以未來預(yù)期的信心這樣的初衷建立的。
四、國家之間的博弈行為
到目前為止,我們講的這些合作好像都是好人、壞人,我、別人,那我們再放大到國家和社會層面,是不是也是遵循這樣的道理呢?當(dāng)然也是。
國家之間經(jīng)常會有威懾、威脅,核威懾能力是干嘛用的?就是要告訴對方,我是會被激怒的。我一旦被激怒,后果你可得想清楚。我有核武器,或者是我會報復(fù)什么手段施加在你身上,我警告你,這就叫威懾。
更現(xiàn)實的例子,這貿(mào)易戰(zhàn)是怎么來的?某國先發(fā)出了威脅,你要不做出改變,我就要提高我的關(guān)稅,另一國馬上作出反應(yīng),我國將對等地制裁你們,提高關(guān)稅。后來這邊也沒按對方的意思做,那邊真提高關(guān)稅了。相應(yīng)地,反擊方也提高自己的關(guān)稅作為報復(fù),兩邊的貿(mào)易戰(zhàn)就這么起來了,關(guān)稅越加越高。最后的結(jié)果是什么,有一方承受不住了,關(guān)稅這么高,我國人民生活水平下降了,負擔(dān)太重了,現(xiàn)在我們要采取調(diào)低關(guān)稅。
等他開始合作了,另一方應(yīng)該怎么反應(yīng)呢?當(dāng)然是也進行合作。你要敢報復(fù),你要敢背叛,我就一定背叛,這是貿(mào)易戰(zhàn)背后的機理。
這道理好簡單,一報還一報誰不知道呢?一說就懂了。為什么社會上還有這么多沖突,國家之間,人與人之間,還有那么多狡詐,那么多破壞規(guī)則,違法,甚至犯罪的行為呢?合作為什么就沒有自然而然地出現(xiàn)呢?
在這本書的最后,作者說了一段話,我們一起分享一下這段話:
“如何從合作中得到獎賞的問題,核心在于試錯、學(xué)習(xí),是緩慢和痛苦的,這樣的學(xué)習(xí)過程,可能對長期發(fā)展有好處,但是我們可能沒有時間等待這樣盲目的過程,而緩慢地走向基于回報的,對雙方有利的策略。也許如果我們更好地了解了這個過程,我們就能用我們的預(yù)見,加快合作的進化。”
這段話什么意思?指的是從博弈論的研究結(jié)論上看,一報還一報這樣的合作策略是最優(yōu)的,是讓所有人都受益的,但有的人目光短淺等不了,就是要在短期利益上占你的便宜,讓別人上當(dāng),讓自己獲益,他還洋洋自得。但是從長期的合作博弈上看,這樣的策略會被歷史淘汰,但也許他的壽命都沒有長期到被淘汰的那一天,他覺得這輩子值了。這種時候我們就需要請出公權(quán)力,代表一報還一報的正義的一方,幫我們維護還一報的權(quán)利,這也是社會公平得以實施的一個必要條件。
而對我們大多數(shù)人來說,只要我們相信未來的收益足夠大,我們跟對方打交道的頻率會增加,我們跟對方打交道的時間不知道什么時候才能結(jié)束,我們就應(yīng)該選擇一報還一報式的善良的策略,去誘發(fā)更多的合作,而不是對抗。
讀完這本書,我的感覺那真叫萬法歸宗。不管這個世界的表象是如何紛繁復(fù)雜、變幻多端,它背后起作用的基本道理就那么幾條,其中今天我給大家介紹的一報還一報就是其中的一條。
到目前為止,我們的頭腦當(dāng)中已經(jīng)構(gòu)建起了一個清晰的圖形和脈絡(luò)。在所有的策略中,一報還一報是最優(yōu)的策略,因為我跟所有人打交道的收益不僅取決于我的策略,也取決于對方的策略。在一報還一報的過程當(dāng)中,我首先保持合作的善良性,其次要可被激怒,不管對方做什么,我都要給出直接的帶有因果關(guān)系的回饋。
同時,我很寬容。如果他合作,我會不計前嫌繼續(xù)跟他合作。在這樣的策略之下,我跟所有的其它策略打交道,我最后的收益是最大的。不是因為我每一次都占了對方的便宜,都得了比對方更高的分,而是那些不善良的策略,那些沒有我這么清晰明確簡單的策略,在彼此之間的博弈過程當(dāng)中,他們的得分變得越來越少,他們的競爭性太強了,反而讓合作性更強的一報還一報的策略,獲得了更優(yōu)的結(jié)果。
所以,在日常的生活當(dāng)中,我們首先追求合作,其次,要守住底線,保護我們自己的利益,不會白白吃虧。
今天我要帶給各位的三份外賣就是:
博弈的收益不是取決于單方策略,而是取決于雙方策略。在單次博弈里,好人確實可能沒有好報,你要碰到個壞人你就沒有好報,因為它不僅取決于你是不是好人,還取決于對方是不是好人。
重復(fù)博弈增加未來的收益,合作才能出現(xiàn)。如果你和對方經(jīng)常要打交道,那你應(yīng)該選擇做一個好人。
在所有的博弈策略里,一報還一報是最好的策略,就是以德報德,以直報怨,所以我們應(yīng)該做一個好人,而且要做一個有底線,有原則的好人。法律、社會規(guī)范,就是用來保護好人的,因為它們扮演了一個,你永遠要打交道的善良的規(guī)則。
今天的這本《合作的進化》就跟大家分享到這里,如果各位書友聽完之后有所收獲,歡迎您點擊屏幕上方的分享鍵分享給你的朋友。
謝謝大家。
聯(lián)系客服