囚徒困境有多個(gè)版本,下面大概是最簡(jiǎn)單的一個(gè)。假設(shè)兩個(gè)人玩一個(gè)游戲:每人面前有一個(gè)箱子,里面裝著面值分別為10元和100元的兩張鈔票。每人從中取出一張鈔票:如果取100的,最終要給對(duì)方;如果取10元的則自己留下。只要不是太笨的人就能很容易想明白,不管對(duì)方怎樣選擇,拿10元的留給自己都是最“聰明”的決策。所以很可能的結(jié)局是每人只得10元。這個(gè)結(jié)果不僅是唯一的納什均衡,還是一個(gè)占優(yōu)均衡,從而是唯一的演化穩(wěn)定均衡和唯一的相關(guān)均衡。這是囚徒困境非常有說(shuō)服力的重要原因。明明可以每人都拿100,為什么彼此不能多一些信任呢?
|作者:曹志剛(中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院)
博弈論的通俗著作中有不少庸俗且不靠譜的玩意,比如教人怎么用博弈論炒股啊,撩妹(漢)啊等。但是活學(xué)活用囚徒困境真的可以幫我們重新審視一大類(lèi)現(xiàn)象。在這類(lèi)現(xiàn)象里,每人都處在一個(gè)跳不出的“局”里(局中人,多么傳神的稱(chēng)呼?。?span>每個(gè)人都很“聰明”很“理性”或者有其不得已,但“聰明反被聰明誤”,這一個(gè)個(gè)不得已最終造就一個(gè)大家都不愿看到的悲催結(jié)局。說(shuō)老實(shí)話(huà),博弈論里這么好用的模型并不多。我希望通過(guò)大家都熟悉的奧數(shù)問(wèn)題來(lái)說(shuō)明囚徒困境就在我們身邊。只要用心去琢磨,總能發(fā)現(xiàn)一些別人沒(méi)注意過(guò)的新的囚徒困境。
奧數(shù)本身作為發(fā)現(xiàn)杰出數(shù)學(xué)人才的平臺(tái)并沒(méi)有問(wèn)題,而且對(duì)于有一定天分又對(duì)數(shù)學(xué)特別感興趣的孩子來(lái)說(shuō),奧數(shù)教育對(duì)于發(fā)掘他們的數(shù)學(xué)潛力有非常積極的作用。不過(guò),如今這種與升學(xué)掛鉤的全民奧數(shù)就顯得有些瘋狂了。這種瘋狂得近乎畸形的奧數(shù)教育不僅不能培養(yǎng)真正的數(shù)學(xué)創(chuàng)造力,而且還會(huì)扼殺多數(shù)孩子對(duì)數(shù)學(xué)的興趣。
瘋狂奧數(shù)中有兩個(gè)相互關(guān)聯(lián)的囚徒困境,分別發(fā)生在學(xué)生與學(xué)校之間。意識(shí)到這個(gè)雙重囚徒困境的存在對(duì)于我們理解奧數(shù)問(wèn)題為什么難以解決會(huì)有重要啟發(fā)。這比空洞的呼吁號(hào)召大家改變教育理念或許更有益。
很多人會(huì)好奇:奧數(shù)明明只適合有一定天賦對(duì)數(shù)學(xué)特別感興趣的孩子,對(duì)于不感興趣的孩子,為什么非要折磨他們呢?這真是有所不知。多數(shù)讓孩子參加奧數(shù)培訓(xùn)的家長(zhǎng)并不是期望自己的孩子將來(lái)當(dāng)數(shù)學(xué)家。家長(zhǎng)的目標(biāo)通常很現(xiàn)實(shí),就是上一個(gè)好點(diǎn)的中學(xué),因?yàn)樾∩鯎裥R紛W數(shù)。常考的題目就那些類(lèi)型,參加奧數(shù)輔導(dǎo)對(duì)提成績(jī)非常管用。這些題目普遍比較偏比較怪,不在正常教學(xué)范圍內(nèi),再聰明的孩子僅指望臨場(chǎng)發(fā)揮一般也不行。所以不管別的孩子參加不參加培訓(xùn),對(duì)于多數(shù)孩子和家長(zhǎng)來(lái)說(shuō),參加培訓(xùn)都是最優(yōu)選擇。
有意思的是,大家都參加培訓(xùn)時(shí)升學(xué)考試的結(jié)局跟大家都不參加培訓(xùn)其實(shí)沒(méi)有太大差別。最終都是那一波最優(yōu)秀的孩子被名校選上。這跟各種過(guò)級(jí)考試不一樣,起作用的不是絕對(duì)成績(jī)而是相對(duì)排名。
我們很自然會(huì)問(wèn),為什么家長(zhǎng)之間不能達(dá)成一種默契,都選擇不培訓(xùn)呢?這樣不僅節(jié)省了大量開(kāi)支,孩子們也免受折磨,可以有更充裕的時(shí)間來(lái)從事真正感興趣的活動(dòng)。這樣孩子們的整體素質(zhì)也會(huì)有所提高。
這就是問(wèn)題的關(guān)鍵所在——大家不可能達(dá)成這種默契。因?yàn)檫@本質(zhì)上是一個(gè)囚徒困境的局,局中人自己很難破。何況這還牽涉到成千上萬(wàn)的孩子和家長(zhǎng),學(xué)術(shù)界一般把這種多人的囚徒困境稱(chēng)為社會(huì)困境,其合作難度比兩三個(gè)局中人高出不是一點(diǎn)兩點(diǎn)。有機(jī)會(huì)我們?cè)賮?lái)單獨(dú)聊“集體行動(dòng)的邏輯”。
所以瘋狂奧數(shù)是同齡人過(guò)度競(jìng)爭(zhēng)的結(jié)果。人人都怕輸在起跑線(xiàn)上——過(guò)度反應(yīng)——大家一起輸在起跑線(xiàn)上。即便此競(jìng)爭(zhēng)中的勝出者,毫無(wú)疑問(wèn)也是受害者。因?yàn)槲覀冏罱K要面對(duì)一個(gè)更大的局,那就是全球化競(jìng)爭(zhēng)。
上面這一層學(xué)生或者說(shuō)家長(zhǎng)之間的囚徒困境很多對(duì)博弈論有所了解的朋友早就注意到了,并非本文原創(chuàng)?;蛟S筆者首先注意到的是,其實(shí)還有一個(gè)上層的囚徒困境發(fā)生在學(xué)校之間。
既然奧數(shù)這么可惡,各中學(xué)校長(zhǎng)又都是精英中的精英,對(duì)局勢(shì)的了解比我們普通人透徹一百倍,他們直接取消奧數(shù)考試不就完了嗎?何況還有教育局的三令五申?這就牽涉到了奧數(shù)的特殊作用。
我們知道一所中學(xué)辦成什么水平,主要取決于兩個(gè)因素,師資和生源。而后者比前者更關(guān)鍵。所以如何設(shè)法爭(zhēng)奪優(yōu)秀生源是中學(xué)校長(zhǎng)們面對(duì)的重要問(wèn)題。注意,這里的“優(yōu)秀”主要是指將來(lái)高考能出好成績(jī),所以是一個(gè)相對(duì)而非絕對(duì)指標(biāo)。因?yàn)橹挥袪钤捅槐贝笄迦A錄取才最利于宣傳,最能給學(xué)校長(zhǎng)臉面。這當(dāng)然主要不是學(xué)校的過(guò)錯(cuò),因?yàn)槿鐣?huì)包括家長(zhǎng)對(duì)學(xué)校的評(píng)價(jià)主要看這些。這容易看得到容易度量。即便是僅針對(duì)成績(jī),如果一所中學(xué)使入學(xué)時(shí)成績(jī)很差的孩子高考時(shí)有大幅提升,家長(zhǎng)也不愿意把孩子送去。這多少有點(diǎn)奇怪。我不知道是不是家長(zhǎng)普遍希望自己孩子能跟盡可能優(yōu)秀的同齡人做同學(xué)的緣故。
可是孩子們腦門(mén)上又沒(méi)寫(xiě)著自己的智商,怎樣選拔優(yōu)秀學(xué)生呢?普通考試區(qū)分度不高,效果一般,尤其是為了選拔將來(lái)能出彩的頂尖學(xué)生。而奧數(shù)(或者比較偏的難的怪的數(shù)學(xué)題)就具有這樣的神奇功能:奧數(shù)成績(jī)高與在中學(xué)表現(xiàn)優(yōu)異并最終在高考中出彩高度正相關(guān)。所以率先領(lǐng)悟到這一點(diǎn)的中學(xué)在競(jìng)爭(zhēng)中獲得了優(yōu)勢(shì)。如果你了解某明星中學(xué)崛起的秘密,就會(huì)很容易贊同我的觀點(diǎn)。后來(lái)所有的中學(xué)都發(fā)現(xiàn)了這個(gè)竅門(mén),都用奧數(shù)這個(gè)指標(biāo)篩選學(xué)生。這是奧數(shù)得以星火燎原的重要原因。當(dāng)然,由于馬太效應(yīng),最先掌握這個(gè)竅門(mén)的中學(xué)迅速取得了后來(lái)者很難超越的優(yōu)勢(shì)地位。
但是,假設(shè)其它因素不變,所有中學(xué)都使用奧數(shù)指標(biāo)跟大家都不用效果又差不多。正如前面所分析的,這導(dǎo)致了生源素質(zhì)的整體下降。所以說(shuō)中學(xué)之間也有一層囚徒困境,他們自己也解不了這個(gè)局。
有了上面的分析就不難理解為什么說(shuō)“奧數(shù)不能作為選拔人才的工具”。跟有些人的分析恰恰相反,我認(rèn)為并不是奧數(shù)成績(jī)選拔人才不靠譜。相對(duì)于其它指標(biāo)或手段,它其實(shí)非??孔V。它很管用,但是我們還是不能用。這個(gè)世界有時(shí)候就是這么吊詭。
所以靠行政命令強(qiáng)行取消奧數(shù)也就成為我們唯一的選擇。北京最近搞的小升初劃片入學(xué)應(yīng)該可以從根子上切斷瘋狂奧數(shù)存在的土壤。當(dāng)然,這又會(huì)引入新的問(wèn)題。從這個(gè)例子中我們也很容易理解市場(chǎng)并非萬(wàn)能,“看不見(jiàn)的手”也有失靈的時(shí)候。廣泛意義上囚徒困境的存在是市場(chǎng)失靈的重要原因。
當(dāng)一個(gè)指標(biāo)足夠重要的時(shí)候,局中人通常會(huì)有“刷指標(biāo)”的沖動(dòng)。指標(biāo),而非指標(biāo)背后想度量的內(nèi)容,成為大家的唯一追求。GDP,SCI,各種例子數(shù)不勝數(shù)。如果沒(méi)法控制住大家刷指標(biāo),這個(gè)指標(biāo)會(huì)慢慢失效。這就是經(jīng)濟(jì)學(xué)中的古德哈特定律(Goodhart's law)。當(dāng)然古德哈特定律并不總是起作用。最完美的指標(biāo)是大家越去刷變得越有效。還有一類(lèi)指標(biāo),它的有效程度跟大家刷不刷關(guān)系不大。比如奧數(shù),參加輔導(dǎo)某種意義上就是刷指標(biāo)。但是正如我們前面講的,普遍參加輔導(dǎo)并不會(huì)使這個(gè)指標(biāo)失效(盡管普通孩子參加輔導(dǎo)而聰明孩子不參加會(huì)使它失效),這就是奧數(shù)的神奇之處。
需要注意的是,我們前文的分析存在若干不足。比如我們并未引入輔導(dǎo)機(jī)構(gòu),而它們也是重要的局中人,有時(shí)候跟中學(xué)還有千絲萬(wàn)縷的聯(lián)系。再比如我們假設(shè)孩子的智商和優(yōu)秀程度是先天決定的,教育的功能僅僅是讓優(yōu)秀者擁有一個(gè)可以向市場(chǎng)釋放的信號(hào)。盡管這是2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主斯賓斯在信息經(jīng)濟(jì)學(xué)開(kāi)山之作之一Job Market Signaling中的基本假設(shè),但毫無(wú)疑問(wèn)教育本身會(huì)提升學(xué)生的素質(zhì),而且這種提升并不一定均勻。學(xué)生參加奧數(shù)輔導(dǎo)也并非均勻地提升他們的成績(jī)。有些學(xué)生裸考成績(jī)很爛,但是經(jīng)奧數(shù)輔導(dǎo)開(kāi)了竅成績(jī)大幅提升(甚至愛(ài)上數(shù)學(xué))也并非沒(méi)可能。最后,不同學(xué)校擁有不同的奧數(shù)組織資源,它們走出囚徒困境的迫切程度不一樣。但無(wú)論如何,我認(rèn)為前文的分析抓住了一些核心矛盾,對(duì)于我們理解瘋狂奧數(shù)問(wèn)題會(huì)有重要啟發(fā)。
標(biāo)準(zhǔn)囚徒困境模型預(yù)言的是一個(gè)很悲觀的局面。如何走出囚徒困境,給經(jīng)濟(jì)學(xué)家、社會(huì)學(xué)家、生物學(xué)家提出了巨大挑戰(zhàn)?,F(xiàn)實(shí)有時(shí)候又沒(méi)有理論預(yù)測(cè)那么悲觀,合作在生物界和人類(lèi)社會(huì)相當(dāng)普遍。如何解釋囚徒困境環(huán)境下合作的起源和發(fā)生,是理論生物學(xué)界和經(jīng)濟(jì)學(xué)界過(guò)去幾十年的熱門(mén)話(huà)題。
小編按:我們的應(yīng)試教育何嘗不是一個(gè)更大的囚徒困境。
聯(lián)系客服