而圖靈測試,就被認(rèn)為是檢驗(yàn)機(jī)器是否具有人類感情的一個標(biāo)準(zhǔn)。一個典型的例子是,如果測試者反復(fù)提出相同的問題,一臺機(jī)器只會從知識庫里重復(fù)提取簡單的答案,而真正的人工智能需要表現(xiàn)出“不耐煩”等感情活動來騙過測試者。不過,很多人對圖靈測試提出了理論上的批評。其中最著名的是“中文房間”理論。美國哲學(xué)家約翰·希爾勒提出了這樣一個實(shí)驗(yàn):一個只懂英語的人手中拿著一本中文對照手冊,身處圖靈實(shí)驗(yàn)中所提及的房子中。而另一人則在房間外向此房間發(fā)送中文問題。房間內(nèi)的人只需按照對照手冊,返回手冊上的中文答案,房間外的人就會以為房間內(nèi)的人是個會思維的中文專家。然而實(shí)際上房子內(nèi)的人可能對象形文字一竅不通,更談不上什么智能思維。也就是說,只要知識庫足夠大,一臺機(jī)器仍然可以通過簡單提取答案的方式,讓人們誤以為它擁有感情。大數(shù)據(jù)技術(shù)的發(fā)展對這一質(zhì)疑提供了支持。如果能夠把一個人所說過的、聽到的、寫下的、或者是讀到的每一個字,每一句話,以及每一個看到的場景,每一段經(jīng)歷的聲音片段,一并同其他成百上千、甚至成千上萬的人們的相關(guān)數(shù)據(jù),都被錄制下來并可隨時調(diào)用,人們最終可以制造出一個能夠通過圖靈測試的機(jī)器人。然而,這個機(jī)器人真的擁有了人類的感情和好奇心嗎?親歷圖靈測試尤金到底說了什么,可以讓人們把它當(dāng)做一個真正的小男孩?雷丁大學(xué)方面尚未公布本次測試的具體問答,但在2012年的那次測試中,科普作家丹·法爾克(Dan Falk)曾經(jīng)現(xiàn)場參加,并記錄下了當(dāng)時的對話。以下為法爾克撰寫的介紹文章:——“你最喜歡的科幻片有哪些?”——“我喜歡《星球大戰(zhàn)》和《駭客帝國》”屏幕上顯示出這樣的對話。現(xiàn)在的我正在努力分辨這個和我聊天的到底是一個機(jī)器人還是真正的人類。我又說:——“如果我說《星戰(zhàn)大戰(zhàn)前傳》很難看,你贊成嗎?”——“雙手贊成!喬治-盧卡斯應(yīng)該被拉去槍斃!”這下瞬間就了然了——只有一個有血有肉的電影愛好者才能被《星戰(zhàn)前傳:威脅潛伏》給激怒。在上周于英國布萊切利公園舉行的“圖靈測試馬拉松”中,作為18號裁判,上述的對話就是我的一個比較容易判定對方是人還是機(jī)器的方法之一。測試的目標(biāo)就是讓裁判們僅僅通過對話的形式判定對方是機(jī)器還是人。這個測試,就是艾倫-圖靈在60多年前所設(shè)計出來的。60多年前,在同一個地方,圖靈所設(shè)計的 Enigma 密碼破譯機(jī)正在為二戰(zhàn)中的盟軍效力。上周六的圖靈測試馬拉松中和世界各地其它的圖靈測試比賽一樣,是為了紀(jì)念艾倫-圖靈誕辰一百周年。而在布萊切利公園舉辦的這場,規(guī)模最大的一次圖靈測試馬拉松,正是在重現(xiàn)圖靈上世紀(jì)50年代在論文中所提出的那些可能性和方法論。那么,在圖靈測試中當(dāng)裁判到底是什么感覺呢?早在這個活動開始幾個月前,我就報了名。實(shí)際上這個和“審間諜”的感覺差不多:你需要問足夠多的問題,直到最后打消疑慮,或者是判定對方是機(jī)器。眾所周知,裁判是不可能在當(dāng)時知道和自己進(jìn)行文字交談的到底是真人還是機(jī)器,所以說,如果這個機(jī)器夠“聰明”,能夠給出類似于人思考后得出的答案,且在5分鐘的交談時間內(nèi),裁判都沒有識破對方,那么這臺機(jī)器就算是通過了圖靈測試。圖靈測試并不是要機(jī)器人最大限度山去愚弄人類裁判,不過按照圖靈的設(shè)想,在2000年以前,裁判們在圖靈測試中的準(zhǔn)確率就會下降到70%及更低。12年之后的今天,我們就拿出今天這場馬拉松測試的結(jié)果來和圖靈本人的預(yù)測來比較比較吧。總之,現(xiàn)在坐在我對面,而我卻看不見的“人”——這個《星球大戰(zhàn)》粉絲——或者是披頭士的鐵粉——“有史以來最好的樂隊”,當(dāng)被問到在 the Rolling Stones 和 The Who 之間選一個的時候,回答是“必須是滾石”,而當(dāng)我(在腦海中)不贊同他的觀點(diǎn)時,對方又說“在80年代早期,The Who 確實(shí)在解散之前寫過一些好歌”。好吧,這些回答真是太“人性化”了,應(yīng)該不可能是個機(jī)器。但是另一次談話就有些說不清了。當(dāng)我告訴對方我來自加拿大時,對方回答說他們“聽說加拿大是個很好的地方”,除了“魁北克地區(qū)都說法語”之外。這看起來好像是一個能夠識別語音的機(jī)器在 Google 和維基百科上迅速查找了關(guān)于我家鄉(xiāng)的資料,然后告訴我的內(nèi)容。要么這個人就是對中學(xué)時的地理老師說的話到現(xiàn)在都還記憶猶新,或者,這個人骨子里就比較反感法語區(qū),或者法國人?在圖靈設(shè)計這個測試的時候,就承認(rèn),一般人們認(rèn)為智力和對語言的掌握程度是相關(guān)的。確實(shí),語言能力并不僅僅是把詞語以正確的順序組成句子這么簡單,它還包含了邏輯等各種認(rèn)知能力——表達(dá)自己思想,認(rèn)識所處環(huán)境,和別的人類交流的能力——或許還包括猜測對方在想什么的能力。孩童在成長過程中會慢慢收獲這些能力和經(jīng)驗(yàn)。如果將這些能力都灌輸給一臺機(jī)器的話,可以說是個不小的挑戰(zhàn)。當(dāng)然在上次的馬拉松中,那些聊天機(jī)器人所使用的軟件也確實(shí)值得我們贊賞,它們的表現(xiàn)令人驚訝。其中,Eugeen Goostman (著名的人工智能),這個有著13歲小男孩人格的聊天軟件,險些就通過了測試。這屆的圖靈測試結(jié)果說明,我們現(xiàn)在的人工智能還沒有達(dá)到圖靈預(yù)計的那個階段,機(jī)器目前想和人類真正地談話還是比較困難的。(來源:網(wǎng)易科技等 )