中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

約翰納什是個(gè)非常著名也非常傳奇的人物,他的著名也來(lái)源于他的傳奇。約翰納什出生于1928年,在21歲的時(shí)候,約翰納什就以一篇僅僅27頁(yè)的論文獲得了博士學(xué)位。其中有一項(xiàng)重要的發(fā)現(xiàn),就是后來(lái)被稱(chēng)為“納什均衡”的博弈理論。約翰納什在1994年獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。

約翰納什更為最出名的就是他因精神分裂導(dǎo)致瘋癲,1958年,30歲的約翰納什開(kāi)始陷入了臆想的空虛世界,分不清虛幻和現(xiàn)實(shí)了。直到80年代末期,納什才漸漸康復(fù),從瘋癲中蘇醒。這段時(shí)間長(zhǎng)達(dá)30年。

普林斯頓學(xué)院對(duì)約翰納什體現(xiàn)出了極大的容納,對(duì)科學(xué)家的極大尊重是美國(guó)強(qiáng)大的原因之一。更令人感動(dòng)的是,約翰納什的妻子也是他的學(xué)生艾里西亞一直沒(méi)有放棄他,即便是后來(lái)實(shí)在無(wú)法忍受約翰納什的狂躁瘋癲被迫離婚,也沒(méi)有再婚,而是一直在默默照顧他,直到納什蘇醒。

這段感人的故事被好萊塢拍成了電影,這就是《美麗心靈》,該片于2001年12月21日在美國(guó)上映,并獲得了第74屆奧斯卡金像獎(jiǎng)最佳影片獎(jiǎng)。

在影片中,還是大學(xué)生的約翰納什和同學(xué)在下圍棋,他邊下邊說(shuō)“我的每一步時(shí)都最優(yōu),我一定可以贏你”,但結(jié)果卻是納什輸了,納什表現(xiàn)出對(duì)結(jié)果的無(wú)法理解和無(wú)法接受,他推倒了棋盤(pán),在同學(xué)的哄笑中慌亂生氣的走了,一邊走一邊說(shuō)“圍棋是個(gè)有缺陷的游戲”。

細(xì)心的觀眾會(huì)發(fā)現(xiàn)電影中的對(duì)局基本就是在亂下,這個(gè)情節(jié)只是為了突出博弈的特點(diǎn),也就是對(duì)弈中對(duì)手的選擇會(huì)根據(jù)你的選擇發(fā)生變化,并不是靜止的一直能線(xiàn)性演進(jìn)下去。

我們?cè)囍蒲菀幌聡搴筒┺恼摰年P(guān)系。

“博弈論”是一種研究“斗爭(zhēng)”的科學(xué),是探究在“自利”的大前提下,個(gè)體如何獲得最大收益的策略。其實(shí)圍棋就是一種斗爭(zhēng)的游戲,最終也是要以雙方圍空的多少分出勝負(fù)。

博弈論中的核心就是大名鼎鼎的“納什均衡”,納什均衡中最經(jīng)典的案例就是廣為人知的“囚徒困境”

兩個(gè)共謀犯罪的人被關(guān)入監(jiān)獄,不能互相溝通情況。如果兩個(gè)人都不揭發(fā)對(duì)方,則由于證據(jù)不確定,每個(gè)人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋?zhuān)聊咭虿缓献鞫氇z十年;若互相揭發(fā),則因證據(jù)確鑿,二者都判刑八年。由于囚徒無(wú)法信任對(duì)方,因此傾向于互相揭發(fā),而不是同守沉默。

我們簡(jiǎn)單了解一下什么是“納什均衡”?

納什均衡(Nash equilibrium)又稱(chēng)非合作博弈均衡,是指在一個(gè)博弈過(guò)程中,無(wú)論對(duì)方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱(chēng)作支配性策略。如果任意一位參與者在其他所有參與者的策略確定的情況下,其選擇的策略是最優(yōu)的,那么這個(gè)組合就被定義為納什均衡。

納什均衡可以分成兩類(lèi):“純戰(zhàn)略納什均衡”和“混合戰(zhàn)略納什均衡”。

混合戰(zhàn)略博弈均衡中要用概率計(jì)算,因?yàn)槊恳环N策略都是隨機(jī)的,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)支付最優(yōu)。因?yàn)闄C(jī)率是連續(xù)的,所以即使戰(zhàn)略集合是有限的,也會(huì)有無(wú)限多個(gè)混合戰(zhàn)略。

圍棋可以看做是一個(gè)混合戰(zhàn)略博弈均衡。由于AI的引入,大家對(duì)圍棋中的勝率其實(shí)也就是“獲勝的概率”已經(jīng)很熟悉了。

圍棋是兩個(gè)人之間的非合作博弈游戲,兩個(gè)人每一個(gè)回合都是一個(gè)混合戰(zhàn)略,一盤(pán)棋就是一個(gè)上百甚至數(shù)百個(gè)回合的混合戰(zhàn)略集合。每個(gè)回合實(shí)際都有一個(gè)最優(yōu)解,以前由于人們的水平不同,理解也不同,所以很難給出最優(yōu)解。阿法狗出現(xiàn)后,它給出的勝率基本就是每個(gè)回合的最優(yōu)解了,因?yàn)樗鼞?zhàn)勝了所有的人類(lèi)棋手,大家不得不信服。之所以說(shuō)基本,是因?yàn)槿祟?lèi)棋手偶爾也會(huì)下出比AI更好勝率更高的棋來(lái)。這也從另一個(gè)角度證明了圍棋的復(fù)雜程度。

AI能戰(zhàn)勝人類(lèi)棋手,就是因?yàn)樗诿恳粋€(gè)博弈回合都取得了最優(yōu)解,也就是勝率最高的下法,這些勝率持續(xù)累加起來(lái)自然也就是取得了勝利。

人類(lèi)棋手則很難做到這一點(diǎn),除了計(jì)算力和判斷力的原因,還有就是人類(lèi)總想下自己喜歡的棋,喜歡的棋并不代表是勝率最高的棋。舉例來(lái)說(shuō),日本超一流武宮正樹(shù)九段酷愛(ài)“宇宙流”下法,但現(xiàn)在的AI根本不推薦宇宙流,這樣人類(lèi)棋手就會(huì)很痛苦。站在博弈論的角度也很好理解,在水平相當(dāng)也就是認(rèn)知能力相當(dāng)?shù)那闆r下,你想下的棋,一定是對(duì)手千方百計(jì)不讓你走到的棋,所以現(xiàn)在的圍棋基本沒(méi)有定式了。

我們?cè)倩氐轿恼麻_(kāi)頭,約翰納什認(rèn)為自己每一步下法都是最優(yōu)解,他理所應(yīng)當(dāng)會(huì)取得最后的勝利,但實(shí)際上,他認(rèn)為的最優(yōu)解可能并不是真正的最優(yōu)解,用圍棋行話(huà)說(shuō)就是“判斷失誤”,所以輸?shù)袅恕?/p>

不是圍棋游戲有缺陷,而是人們的認(rèn)知水準(zhǔn)有缺陷?!扒敉嚼Ь场钡某闪⑶疤峋褪莾蓚€(gè)罪犯對(duì)彼此的認(rèn)知不同,也就是雙方都不相信對(duì)方能死扛,也就是信息不對(duì)稱(chēng),所以寧肯獲得8年刑期,也不冒險(xiǎn)獲得10年刑期。

“知己知彼,百戰(zhàn)不殆”,實(shí)際早在2000年前,孫子就已經(jīng)告訴世人,信息的獲取能力才是博弈獲勝與否的關(guān)鍵。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
DeepMind VS Meta:實(shí)現(xiàn)納什均衡理性最優(yōu)解,還是多人非零和博弈算法更強(qiáng)大?
“帕累托最優(yōu)”和“納什均衡”
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服