一個(gè)很受觀眾關(guān)注的問(wèn)題是,與柯潔對(duì)弈的AlphaGo是不是從零開(kāi)始訓(xùn)練,沒(méi)有受人類棋譜“污染”的“純凈”版本?賽后發(fā)布會(huì),Deepmind負(fù)責(zé)人哈薩比斯回答說(shuō),并不是!它是在年初快棋60:0戰(zhàn)勝人類高手的Master基礎(chǔ)上的升級(jí)版。而且,這次用的只是單機(jī)版,而非與李世石對(duì)戰(zhàn)的分布式版本。這個(gè)單機(jī)版由于有10塊黑科技TPU(據(jù)說(shuō)一個(gè)TPU相當(dāng)于15-30個(gè)GPU),所以這個(gè)“單機(jī)版”算力并不差。騰訊開(kāi)發(fā)的絕藝,實(shí)力排圍棋AI第二,用的只是GPU,在硬件技術(shù)上和AlphaGo有差距。這次AlphaGo雖然是單機(jī)版,但以每步一分鐘的節(jié)奏下棋,比Master的思考時(shí)間要多十倍,計(jì)算力是足夠的。總的來(lái)說(shuō),這次的AlphaGo從軟件硬架構(gòu)上來(lái)說(shuō),應(yīng)該就類似于Master,并沒(méi)有再次創(chuàng)新,但自我訓(xùn)練實(shí)力有小的提升。但相對(duì)于去年與李世石對(duì)戰(zhàn)的版本,無(wú)論是算法還是硬件都有巨大的創(chuàng)新,實(shí)力要強(qiáng)得多。
對(duì)局中AlphaGo的表現(xiàn)也確實(shí)和Master差不多,在局面領(lǐng)先后,它慢慢將差距送成了最小差距的1/4子(相當(dāng)于1.5目勝)。我在對(duì)局中看到AlphaGo的著法,就提前預(yù)測(cè)最后會(huì)是1-2目的差距,其實(shí)當(dāng)時(shí)領(lǐng)先優(yōu)勢(shì)應(yīng)該是一個(gè)貼目(7目左右)。雖然最后柯潔顯得是以最小差距“憾負(fù)”,但職業(yè)棋手們認(rèn)為,AlphaGo本局展現(xiàn)的實(shí)力,領(lǐng)先柯潔是有一先的(也就是一個(gè)貼目)。但這并不是說(shuō)柯潔發(fā)揮不好,他發(fā)揮得其實(shí)不錯(cuò)。對(duì)比去年李世石,面對(duì)實(shí)力要差得多的AlphaGo版本,本局柯潔的表現(xiàn)要好得多。
下面介紹本局的一些關(guān)鍵點(diǎn)。
一.開(kāi)局
柯潔在與人類對(duì)手的實(shí)戰(zhàn)中,連續(xù)七八局試用了開(kāi)局占三三、點(diǎn)三三的手法,有相當(dāng)?shù)男牡?。本局我就發(fā)微博預(yù)測(cè)他會(huì)開(kāi)局點(diǎn)三三,果然他在第3手占三三,第7手對(duì)白星位點(diǎn)三三。
這幾手說(shuō)明柯潔是有精心的準(zhǔn)備的,而且提前演練了。以下是柯潔的預(yù)想圖:
柯潔的預(yù)想圖
這個(gè)變化實(shí)際是Master下出來(lái)的,黑棋奪掉了白星位一子的根據(jù)地,還能夠利用8位點(diǎn)的弱點(diǎn),對(duì)白一串進(jìn)行攻擊。面對(duì)柯潔的“以其人之道還治其人之身”,AlphaGo會(huì)如何應(yīng)對(duì)呢?AlphaGo給出了答案。
AlphaGo針?shù)h相對(duì)的預(yù)想圖
AlphaGo沒(méi)有下在R5位扳,而是下在三角位,這是AlphaGo的預(yù)想圖,黑1位托3位頂這樣定型。與柯潔的理想圖相比,白棋的外勢(shì)更為完整,P6位很難說(shuō)是弱點(diǎn)了??梢灶A(yù)期,以后碰到開(kāi)局點(diǎn)三三,棋手都會(huì)用這招應(yīng)對(duì)??聺嵲谶@個(gè)局部變了個(gè)次序,但并沒(méi)有得到好結(jié)果。
實(shí)戰(zhàn)結(jié)果
實(shí)戰(zhàn)柯潔11位先頂,再13位扳,遭到了白R(shí)2位(后來(lái)被吃)的反擊。最后19位的黑子被白22征掉了!碰巧的是,左上角黑三三一子,沒(méi)有引到征,而如果這個(gè)子在星位上,白就征不掉黑棋了。黑棋兩個(gè)三三的組合手段,換來(lái)這個(gè)局面,應(yīng)該說(shuō)沒(méi)有實(shí)現(xiàn)戰(zhàn)略意圖。黑占的角并不大,而白吃掉19這個(gè)子后外勢(shì)很厚,特別是24這手很有想法,注重中央的戰(zhàn)斗。AlphaGo相對(duì)于人的優(yōu)勢(shì)就是利用厚勢(shì)的能力,應(yīng)該說(shuō)開(kāi)局黑的三三戰(zhàn)術(shù)落空了。
二.左上角的戰(zhàn)斗AlphaGo可能虧了?
AlphaGo26位打入,28跳起再30位罩,這個(gè)手法人類棋手不太能想到。而白34粘,讓黑35位挺出,這個(gè)感覺(jué)相當(dāng)異常。應(yīng)該會(huì)有相當(dāng)多的職業(yè)棋手不贊同AlphaGo的選擇,白兩塊被完全分?jǐn)?,感覺(jué)黑棋主動(dòng)。
AlphaGo選擇了吃角,中間四子基本被吃。這個(gè)局面白這四子是不敢跑的,因?yàn)楹谟蠪18位左右的借用,白跑會(huì)被黑追殺得特別慘。行棋到此感覺(jué)黑應(yīng)該是不落下風(fēng)的,一些圍棋AI對(duì)此局面的勝率評(píng)估也認(rèn)為此時(shí)黑并不落后,開(kāi)局吃虧后,黑挽回了局勢(shì)。但是柯潔局后說(shuō),他本來(lái)是想“先撈后洗”(先搶占實(shí)地,讓白做模樣,黑沖進(jìn)去搗亂找機(jī)會(huì)),占兩個(gè)三三就說(shuō)明這個(gè)意圖非常明顯。但是這個(gè)局部下來(lái),白棋反而吃掉了黑左上角。考慮到左上角本是黑的三三,三三被吃掉的局面極其罕見(jiàn)。所以這個(gè)局面白棋反而撈了實(shí)地,柯潔需要利用厚勢(shì)作戰(zhàn),不是他的意圖。這就是Master的典型棋風(fēng),看著它是厚勢(shì)作戰(zhàn),但一有機(jī)會(huì)它就變現(xiàn)轉(zhuǎn)實(shí)地,不會(huì)搞看不太清的寵大模樣。
三.柯潔非??赡艿臄≌信cAlphaGo的勝招
AlphaGo沒(méi)有盲目動(dòng)出四子,而是搶了48位大棋,黑49打入是眼見(jiàn)的好手。這時(shí)白下了50位騷擾??聺嵾@時(shí)可能心理上稍有一點(diǎn)松勁,選擇了51位吃死消除不安定因素,而不是54位粘繼續(xù)緊繃局面。AlphaGo在52位尖頂后,下出了令柯潔本人在內(nèi)的不少職業(yè)棋手佩服的好棋,54位斷!
這招棋本身是后手。白從F13扳動(dòng)出跑不了,在B12跑也會(huì)被黑A12扳快一氣吃死。那這招的好處是什么?讓柯潔局后非常佩服的是,這招棋韻味深長(zhǎng),雖然是后手,但是以靜制動(dòng),能發(fā)揮極大作用。有了54這手切斷,白在B9是先手能在左中部做一排厚勢(shì)支援左下部。另一方面,白也可以選擇在G10位跳,在靠近中央的地方做出一排厚勢(shì)。對(duì)白這四個(gè)死子的利用非常靈活。
柯潔意識(shí)到局面不利,怕白棋左下角實(shí)空太大(黑實(shí)空本來(lái)就不領(lǐng)先,中間的厚味又被白54限制住了),就急躁恨空地在55位打入了。白56位立,這一手就決定了白棋的優(yōu)勢(shì),其它AI的判斷也是白優(yōu)勢(shì)了。因?yàn)榘子兄虚g的借用,黑活左下角以后,49、53兩子會(huì)被攻擊,很難有生路了。白棋仿佛所有子力都配合起來(lái),讓黑這兩子異常困難。
四.AlphaGo優(yōu)勢(shì)下的穩(wěn)健運(yùn)轉(zhuǎn)
面對(duì)難局,應(yīng)該說(shuō)柯潔表現(xiàn)不錯(cuò),使出了69靠、71扳的靈活手段。結(jié)果黑棄掉兩子,中間大塊通過(guò)83斷回家,維持住了局面。行棋至此,不少棋手和觀眾感覺(jué)局面還早,勝負(fù)在后面。
但是AlphaGo可能對(duì)局面評(píng)估更為準(zhǔn)確。白下方與左上角的空是比較實(shí)在的,而黑右上角三子虛虛的形勢(shì)價(jià)值多少卻不好說(shuō)。實(shí)際上,白84手的打入正擊中了黑棋的弱點(diǎn),在白下面厚勢(shì)的影響下,黑棋在此圍不到多少空,落后的局面迅速就要明朗化。
左上角的結(jié)果,白棋又撈了十余目實(shí)地?cái)U(kuò)大了實(shí)地優(yōu)勢(shì),黑只收獲了一道有缺陷的外勢(shì)。白84子在P15打后有余味??聺?7位令不少人感到奇怪,但其實(shí)是沒(méi)有辦法。不下在中間,白吊這里,利用84的余味以及白N5切斷黑三子的手段,黑中間會(huì)很慘。這時(shí)白悠然拆在98位,職業(yè)棋手應(yīng)該基本看清了白必勝的局面。
98這手進(jìn)得不深,黑如果L17拆二互圍,白左上能多圍不少,黑右上中間圍不到多少,白盤面都要好一些。實(shí)戰(zhàn)黑只好攻擊白98這一子。
黑99攻擊,白100拆一幾乎是勝利宣言,似乎在說(shuō)吃不掉我就勝了。而且這兩個(gè)子活力很好確實(shí)吃不了,下到110逼黑111吃,這時(shí)白做眼與出逃都不難,應(yīng)該說(shuō)已經(jīng)解決了問(wèn)題。
行棋至此,從子效上來(lái)說(shuō),黑左邊一團(tuán)當(dāng)初以為的厚勢(shì),雖然吃了五子,但全是干目沒(méi)圍到多少目。而白下面的厚勢(shì)吃三子卻圍得效率高不少。黑右上的厚勢(shì)其實(shí)也圍不了多少空。因此白棋盤面領(lǐng)先是可能的,后面收官白明顯手段多,黑到處欠目。
柯潔后面沒(méi)有放棄,收官撐得很厲害。但AlphaGo領(lǐng)先優(yōu)勢(shì)夠多,早早進(jìn)入了安全運(yùn)轉(zhuǎn)模式,時(shí)不時(shí)地送出1目半目,送出去了6、7目,最后1/4子獲勝。如果熟悉Master的棋路就會(huì)知道,白不斷地送目,正是必勝的證明。所以后面柯潔雖然收官有收獲,其實(shí)早已心知肚明必?cái)×?,表情痛苦。本局并非雙方差距微小,在官子爭(zhēng)奪中柯潔最小差距落敗,而是差距大到了一先。
五.全局綜述與展望
本局柯潔黑棋并沒(méi)有領(lǐng)先的時(shí)候,沒(méi)有勝機(jī)。黑棋開(kāi)局兩個(gè)三三先撈后洗的戰(zhàn)術(shù)準(zhǔn)備不算成功。白棋領(lǐng)先的局面出現(xiàn)在50多手,雖然優(yōu)勢(shì)并不是太大。但是柯潔一直沒(méi)有崩潰,不斷地出招試圖化解困境或者翻盤,也逼出了白棋的一些好招,雙方的對(duì)戰(zhàn)招法頗有看點(diǎn)??聺嵉臓顟B(tài)應(yīng)該說(shuō)還不錯(cuò),但是一點(diǎn)點(diǎn)的松勁就導(dǎo)致局面落后無(wú)法挽回??聺嵄救藢?duì)自己的發(fā)揮并不太滿意,應(yīng)該是意識(shí)到了自己的問(wèn)題。
AlphaGo本局的表現(xiàn)非常穩(wěn)定,能夠領(lǐng)先發(fā)揮不差的柯潔一先,展示了強(qiáng)大的實(shí)力。AlphaGo本局的招法相對(duì)Master給人的震驚來(lái)說(shuō),容易理解多了。這個(gè)對(duì)局顯得很有邏輯,不象Master的某些棋局,人類莫明其妙就大大落后,輸了還不知道怎么回事。本局AlphaGo也有一些令人驚艷的招法,但下出來(lái)棋手們能品出妙味,不致于茫然不知所措。這說(shuō)明,人類棋手的水平也在進(jìn)步。
柯潔說(shuō),想要贏AlphaGo,必須逼出它的bug。從本局來(lái)看,確實(shí)如此。如果只是局面選擇、打入、圍空、攻擊這些較為常規(guī)的局面,AlphaGo的局面判斷能力比人類棋手明顯要強(qiáng)。在雙方上百手的進(jìn)程中,人類總是容易出錯(cuò)。一旦進(jìn)入AlphaGo小有優(yōu)勢(shì)的控制流局面,它總是能簡(jiǎn)化局面,找到簡(jiǎn)明獲勝的分枝。
想要逼出AlphaGo的bug,柯潔必須把局面撐得很滿,讓雙方都不能退,不進(jìn)入復(fù)雜變化就吃虧。從本局的局面來(lái)看,柯潔如果發(fā)揮得再好一些,可能會(huì)有這樣的機(jī)會(huì)。如逼使AlphaGo大吃柯潔一塊棋,而不是吃下面兩子就夠了。或者逼得AlphaGo進(jìn)柯潔的模樣里艱難找生路,而不是象98與100兩子一樣一眼看去就能輕松做活。從AlphaGo的棋路選擇來(lái)看,它明顯在避免算不清的開(kāi)放型復(fù)雜死活變化,因?yàn)槟菢铀胁簧俜种κ菚?huì)被吃,或者被柯潔整體活出,不如控制流勝率高。
希望柯潔后兩局能將局勢(shì)引導(dǎo)得更為復(fù)雜、更為緊張,讓棋迷們看到更精彩的棋局。哈薩比斯也說(shuō)要繼續(xù)開(kāi)發(fā)提升,例如以后真的開(kāi)發(fā)出“純凈”版的AlphaGo,與職業(yè)棋手們共同探索圍棋更多的奧秘。
聯(lián)系客服