本文是主題為“人工智能與設(shè)計”系列文章的第一篇,主要講述現(xiàn)在人工智能的基礎(chǔ)知識,enjoy~
今年年初出于個人興趣,我開始了對人工智能的研究。為了更好理解人工智能和設(shè)計的關(guān)系,我開始學(xué)習(xí)機器學(xué)習(xí)、深度學(xué)習(xí)、Alexa開發(fā)等知識,從當(dāng)初覺得人工智能只會讓大部分設(shè)計師失業(yè),到現(xiàn)在覺得人工智能只是一個設(shè)計的輔助工具,也算是成長了不少。
這次希望能將積累的知識寫成一本電子書,沒別的,因為字太多,更重要的是這樣很酷。由寫作時間可能太長,互聯(lián)網(wǎng)每天都在變化,一些比較前沿的思考可能轉(zhuǎn)眼成為現(xiàn)實,所以先把前四章陸續(xù)發(fā)出來。
前四章主要講了現(xiàn)在人工智能的基礎(chǔ)知識、底層設(shè)計、互聯(lián)網(wǎng)產(chǎn)品設(shè)計以及人工智能與設(shè)計的關(guān)系,后面會通過3~4章詳細分析人工智能對不同行業(yè)設(shè)計的影響,目前考慮的領(lǐng)域是室內(nèi)設(shè)計、公共設(shè)計和服務(wù)設(shè)計。
說起人工智能這詞,不得不提及人工智能的歷史。人工智能的概念主要由Alan Turing提出:機器會思考嗎?如果一臺機器能夠與人類對話而不被辨別出其機器的身份,那么這臺機器具有智能的特征。同年,Alan Turing還預(yù)言了存有一定的可能性可以創(chuàng)造出具有真正智能的機器。
說明:Alan Turing(1912.6.23-1954.6.7)曾協(xié)助英國軍隊破解了德國的著名密碼系統(tǒng)Enigma,幫助盟軍取得了二戰(zhàn)的勝利。因提出一種用于判定機器是否具有智能的試驗方法,即圖靈試驗,被后人稱為計算機之父和人工智能之父。
1956年,在達特茅斯學(xué)院舉行的一次會議上,不同領(lǐng)域(數(shù)學(xué),心理學(xué),工程學(xué),經(jīng)濟學(xué)和政治學(xué))的科學(xué)家正式確立了人工智能為研究學(xué)科。
2006年達特茅斯會議當(dāng)事人重聚,左起:Trenchard More、John McCarthy、Marvin Minsky、Oliver Selfridge、Ray Solomonoff
第一次發(fā)展高潮(1955年—1974年)
達特茅斯會議之后是大發(fā)現(xiàn)的時代。對很多人來講,這一階段開發(fā)出來的程序堪稱神奇:計算機可以解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語。在眾多研究當(dāng)中,搜索式推理、自然語言、微世界在當(dāng)時最具影響力。
大量成功的AI程序和新的研究方向不斷涌現(xiàn),研究學(xué)者認(rèn)為具有完全智能的機器將在二十年內(nèi)出現(xiàn)并給出了如下預(yù)言:
1958年,H. A. Simon,Allen Newell:“十年之內(nèi),數(shù)字計算機將成為國際象棋世界冠軍?!?nbsp;“十年之內(nèi),數(shù)字計算機將發(fā)現(xiàn)并證明一個重要的數(shù)學(xué)定理。”
1965年,H. A. Simon:“二十年內(nèi),機器將能完成人能做到的一切工作?!?/p>
1967年,Marvin Minsky:“一代之內(nèi)……創(chuàng)造“人工智能”的問題將獲得實質(zhì)上的解決?!?/p>
1970年,Marvin Minsky:“在三到八年的時間里我們將得到一臺具有人類平均智能的機器?!?/p>
美國政府向這一新興領(lǐng)域投入了大筆資金,每年將數(shù)百萬美元投入到麻省理工學(xué)院、卡耐基梅隆大學(xué)、愛丁堡大學(xué)和斯坦福大學(xué)四個研究機構(gòu),并允許研究學(xué)者去做任何感興趣的方向。
當(dāng)時主要成就:
第一次寒冬(1974年—1980年)
70年代初,AI遭遇到瓶頸。研究學(xué)者逐漸發(fā)現(xiàn),雖然機器擁有了簡單的邏輯推理能力,但遭遇到當(dāng)時無法克服的基礎(chǔ)性障礙,AI停留在“玩具”階段止步不前,遠遠達不到曾經(jīng)預(yù)言的完全智能。由于此前的過于樂觀使人們期待過高,當(dāng)AI研究人員的承諾無法兌現(xiàn)時,公眾開始激烈批評AI研究人員,許多機構(gòu)不斷減少對人工智能研究的資助,直至停止撥款。
當(dāng)時主要問題:
說明:莫拉維克悖論:如果機器像數(shù)學(xué)天才一樣下象棋,那么它能模仿嬰兒學(xué)習(xí)又有多難呢?然而,事實證明這是相當(dāng)難的。
第二次發(fā)展高潮(1980年—1987年)
80年代初,一類名為“專家系統(tǒng)”的AI程序開始為全世界的公司所采納,人工智能研究迎來了新一輪高潮。在這期間,卡耐基梅隆大學(xué)為DEC公司設(shè)計的XCON專家系統(tǒng)能夠每年為DEC公司節(jié)省數(shù)千萬美金。日本經(jīng)濟產(chǎn)業(yè)省撥款八億五千萬美元支持第五代計算機項目。其目標(biāo)是造出能夠與人對話、翻譯語言、解釋圖像、能夠像人一樣推理的機器。其他國家也紛紛作出了響應(yīng),并對AI和信息技術(shù)的大規(guī)模項目提供了巨額資助。
說明:專家系統(tǒng)是一種程序,能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。由于專家系統(tǒng)僅限于一個很小的領(lǐng)域,從而避免了常識問題。“知識處理”隨之也成為了主流 AI 研究的焦點。
當(dāng)時主要成就:
第二次寒冬(1987年—1993年)
1987年,AI硬件的市場需求突然下跌??茖W(xué)家發(fā)現(xiàn),專家系統(tǒng)雖然很有用,但它的應(yīng)用領(lǐng)域過于狹窄,而且更新迭代和維護成本非常高。同期美國Apple和IBM生產(chǎn)的臺式機性能不斷提升,個人電腦的理念不斷蔓延;日本人設(shè)定的“第五代工程”最終也沒能實現(xiàn)。人工智能研究再次遭遇了財政困難,一夜之間這個價值五億美元的產(chǎn)業(yè)土崩瓦解。
當(dāng)時主要問題:
第三次發(fā)展高潮(1993年至今)
在摩爾定律下,計算機性能不斷突破。云計算、大數(shù)據(jù)、機器學(xué)習(xí)、自然語言和機器視覺等領(lǐng)域發(fā)展迅速,人工智能迎來第三次高潮。
摩爾定律起始于Gordon Moore在1965年的一個預(yù)言,當(dāng)時他看到因特爾公司做的幾款芯片,覺得18到24個月可以把晶體管體積縮小一半,個數(shù)可以翻一番,運算處理能力能翻一倍。沒想到這么一個簡單的預(yù)言成真了,下面幾十年一直按這個節(jié)奏往前走,成為了摩爾定律。
主要事件:
很多專家學(xué)者對此次人工智能浪潮給予了肯定,認(rèn)為這次人工智能浪潮能引起第四次工業(yè)革命。人工智能逐漸開始在保險,金融等領(lǐng)域開始滲透,在未來健康醫(yī)療、交通出行、銷售消費、金融服務(wù)、媒介娛樂、生產(chǎn)制造,到能源、石油、農(nóng)業(yè)、政府……所有垂直產(chǎn)業(yè)都將因人工智能技術(shù)的發(fā)展而受益,那么我們現(xiàn)在講的人工智能究竟是什么?
在60年代,AI研究人員認(rèn)為人工智能是一臺通用機器人,它擁有模仿智能的特征,懂得使用語言,懂得形成抽象概念,能夠?qū)ψ约旱男袨檫M行推理,它可以解決人類現(xiàn)存問題。由于理念、技術(shù)和數(shù)據(jù)的限制,人工智能在模式識別、信息表示、問題解決和自然語言處理等不同領(lǐng)域發(fā)展緩慢。
80年代,AI研究人員轉(zhuǎn)移方向,認(rèn)為人工智能對事物的推理能力比抽象能力更重要,機器為了獲得真正的智能,機器必須具有軀體,它需要感知、移動、生存,與這個世界交互。為了積累更多推理能力,AI研究人員開發(fā)出專家系統(tǒng),它能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。
1997年,IBM的超級計算機深藍在國際象棋領(lǐng)域完勝整個人類代表卡斯帕羅夫;相隔20年,Google的AlphaGo在圍棋領(lǐng)域完勝整個人類代表柯潔。劃時代的事件使大部分AI研究人員確信人工智能的時代已經(jīng)降臨。
可能大家覺得國際象棋和圍棋好像沒什么區(qū)別,其實兩者的難度不在同一個級別。國際象棋走法的可能性雖多,但棋盤的大小和每顆棋子的規(guī)則大大限制了贏的可能性。深藍可以通過蠻力看到所有的可能性,而且只需要一臺計算機基本上就可以搞定。相比國際象棋,圍棋很不一樣。圍棋布局走法的可能性可能要比宇宙中的原子數(shù)量還多,幾十臺計算機的計算能力都搞不定,所以機器下圍棋想贏非常困難,包括圍棋專家和人工智能領(lǐng)域的專家們也紛紛斷言:計算機要在圍棋領(lǐng)域戰(zhàn)勝人類棋手,還要再等100年。結(jié)果機器真的做到了,并據(jù)說AlphaGo擁有圍棋十幾段的實力(目前圍棋棋手最高是9段)。
那么深藍和AlphaGo在本質(zhì)上有什么區(qū)別?簡單點說,深藍的代碼是研究人員編程的,知識和經(jīng)驗也是研究人員傳授的,所以可以認(rèn)為與卡斯帕羅夫?qū)?zhàn)的深藍的背后還是人類,只不過它的運算能力比人類更強,更少失誤。而AlphaGo的代碼是自我更新的,知識和經(jīng)驗是自我訓(xùn)練出來的。與深藍不一樣的是,AlphaGo擁有兩顆大腦,一顆負責(zé)預(yù)測落子的最佳概率,一顆做整體的局面判斷,通過兩顆大腦的協(xié)同工作,它能夠判斷出未來幾十步的勝率大小。所以與柯潔對戰(zhàn)的AlphaGo的背后是通過十幾萬盤的海量訓(xùn)練后,擁有自主學(xué)習(xí)能力的人工智能系統(tǒng)。
這時候社會上出現(xiàn)了不同的聲音:“人工智能會思考并解決所有問題”、“人工智能會搶走人類的大部分工作!”“人工智能會取代人類嗎?”那么已來臨的人工智能究竟是什么?
人工智能目前有兩個定義,分別為強人工智能和弱人工智能。
普通群眾所遐想的人工智能屬于強人工智能,它屬于通用型機器人,也就是60年代AI研究人員提出的理念。它能夠和人類一樣對世界進行感知和交互,通過自我學(xué)習(xí)的方式對所有領(lǐng)域進行記憶、推理和解決問題。這樣的強人工智能需要具備以下能力:
說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。
這些能力在常人看來都很簡單,因為自己都具備著;但由于技術(shù)的限制,計算機很難具備以上能力,這也是為什么現(xiàn)階段人工智能很難達到常人思考的水平。
由于技術(shù)未成熟,現(xiàn)階段的人工智能屬于弱人工智能,還達不到大眾所遐想的強人工智能。弱人工智能也稱限制領(lǐng)域人工智能或應(yīng)用型人工智能,指的是專注于且只能解決特定領(lǐng)域問題的人工智能,例如AlphaGo,它自身的數(shù)學(xué)模型只能解決圍棋領(lǐng)域的問題,可以說它是一個非常狹小領(lǐng)域問題的專家系統(tǒng),以及它很難擴展到稍微寬廣一些的知識領(lǐng)域,例如如何通過一盤棋表達出自己的性格和靈魂。
弱人工智能和強人工智能在能力上存在著巨大鴻溝,弱人工智能想要進一步發(fā)展,必須具備以下能力:
說明:以上結(jié)論借鑒李開復(fù)所著的《人工智能》一書。
在計算機理念來說,人工智能是用來處理不確定性以及管理決策中的不確定性。意思是通過一些不確定的數(shù)據(jù)輸入來進行一些具有不確定性的決策。從目前的技術(shù)實現(xiàn)來說,人工智能就是深度學(xué)習(xí),它是06年由Geoffrey Hinton所提出的機器學(xué)習(xí)算法,該算法可以使程序擁有自我學(xué)習(xí)和演變的能力。
機器學(xué)習(xí)簡單點說就是通過一個數(shù)學(xué)模型將大量數(shù)據(jù)中有用的數(shù)據(jù)和關(guān)系挖掘出來。機器學(xué)習(xí)建模采用了以下四種方法:
目前機器學(xué)習(xí)以監(jiān)督學(xué)習(xí)為主。
深度學(xué)習(xí)屬于機器學(xué)習(xí)下面的一條分支。它能夠通過多層神經(jīng)網(wǎng)絡(luò)以及使用以上四種方法,不斷對自身模型進行自我優(yōu)化,從而發(fā)現(xiàn)出更多優(yōu)質(zhì)的數(shù)據(jù)以及聯(lián)系。
目前的AlphaGo正是采用了深度學(xué)習(xí)算法擊敗了人類世界冠軍,更重要的是,深度學(xué)習(xí)促進了人工智能其他領(lǐng)域如自然語言和機器視覺的發(fā)展。目前的人工智能的發(fā)展依賴深度學(xué)習(xí),這句話沒有任何問題。
在了解人工智能基礎(chǔ)能力前,我們先聊聊更底層的東西——數(shù)據(jù)。計算機數(shù)據(jù)分為兩種,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指具有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù),它的本質(zhì)是將所有數(shù)據(jù)標(biāo)簽化、結(jié)構(gòu)化,后續(xù)只要確定標(biāo)簽,數(shù)據(jù)就能讀取出來,這種方式容易被計算機理解。非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或者不完整,沒有預(yù)定義的數(shù)據(jù)模型的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)格式多樣化,包括了圖片、音頻、視頻、文本、網(wǎng)頁等等,它比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。
音頻、圖片、文本、視頻這四種載體可以承載著來自世界萬物的信息,人類在理解這些內(nèi)容時毫不費勁;對于只懂結(jié)構(gòu)化數(shù)據(jù)的計算機來說,理解這些非結(jié)構(gòu)化內(nèi)容比登天還難,這也就是為什么人與計算機交流時非常費勁。
全世界有80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),人工智能想要達到看懂、聽懂的狀態(tài),必須要把非結(jié)構(gòu)化數(shù)據(jù)這塊硬骨頭啃下來。學(xué)者在深度學(xué)習(xí)的幫助下在這領(lǐng)域取得了突破性成就,這成就為人工智能其他各種能力奠定了基礎(chǔ)。
如果將人工智能比作一個人,那么人工智能應(yīng)該具有記憶思考能力,輸入能力如視覺、聽覺、嗅覺、味覺以及觸覺,以及輸出能力如語言交流、軀體活動。以上能力對相應(yīng)的術(shù)語為:深度學(xué)習(xí)、知識圖譜、遷移學(xué)習(xí)、自然語言處理、機器視覺、語音識別、語音合成(觸覺、嗅覺、味覺在技術(shù)研究上暫無商業(yè)成果,軀體活動更多屬于機器人領(lǐng)域,不在文章中過多介紹)
簡單點說,知識圖譜就是一張地圖。它從不同來源收集信息并加以整理,每個信息都是一個節(jié)點,當(dāng)信息之間有關(guān)系時,相關(guān)節(jié)點會建立起聯(lián)系,眾多信息節(jié)點逐漸形成了圖。知識圖譜有助于信息存儲,更重要的是提高了搜索信息的速度和質(zhì)量。
遷移學(xué)習(xí)把已學(xué)訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練數(shù)據(jù)集。由于大部分領(lǐng)域都沒有足夠的數(shù)據(jù)量進行模型訓(xùn)練,遷移學(xué)習(xí)可以將大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,實現(xiàn)個性化遷移,如同人類思考時使用的類比推理。遷移學(xué)習(xí)有助于人工智能掌握更多知識。
自然語言處理是一門融語言學(xué)、計算機科學(xué)、數(shù)學(xué)于一體的學(xué)科,它是人工智能的耳朵-語音識別和嘴巴-語音合成的基礎(chǔ)。計算機能否理解人類的思想,首先要理解自然語言,其次擁有廣泛的知識,以及運用這些知識的能力。自然語言處理的主要范疇非常廣,包括了語音合成、語音識別、語句分詞、詞性標(biāo)注、語法分析、語句分析、機器翻譯、自動摘要等等、問答系統(tǒng)等等。
機器視覺通過攝影機和計算機代替人的眼睛對目標(biāo)進行識別、跟蹤和測量,并進一步對圖像進行處理。這是一門研究如何使機器“看懂”的技術(shù),是人工智能最重要的輸入方式之一。如何通過攝像頭就能做到實時、準(zhǔn)確識別外界狀況,這是人工智能的瓶頸之一,深度學(xué)習(xí)在這方面幫了大忙?,F(xiàn)在熱門的人臉識別、無人駕駛等技術(shù)都依賴于機器視覺技術(shù)。
語音識別的目的是將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字。機器能否與人類自然交流的前提是機器能聽懂人類講什么,語音識別也是人工智能的最重要輸入方式之一。由于不同地區(qū)有著不同方言和口音,這對于語音識別來說都是巨大的挑戰(zhàn)。目前百度、科大訊飛等公司的語音識別技術(shù)在普通話上的準(zhǔn)確率已達到97%,但方言準(zhǔn)確率還有待提高。
目前大部分的語音合成技術(shù)是利用在數(shù)據(jù)庫內(nèi)的許多已錄好的語音連接起來,但由于缺乏對上下文的理解以及情感的表達,朗讀效果很差?,F(xiàn)在百度和科大訊飛等公司在語音合成上有新的成果:16年3月百度語音合成了張國榮聲音與粉絲互動;17年3月本邦科技利用科大訊飛的語音合成技術(shù),成功幫助小米手機實現(xiàn)了一款內(nèi)含“黑科技”的營銷活動H5。它們的主要技術(shù)是通過對張國榮、馬東的語音資料進行語音識別,提取該人的聲紋和說話特征,再通過自然語言處理對講述的內(nèi)容進行情緒識別,合成出來的語音就像本人在和你對話。新的語音合成技術(shù)不再被數(shù)據(jù)庫內(nèi)的錄音所限制語言和情感的表達。
經(jīng)過多年的人工智能研究,人工智能的主要發(fā)展方向分為:計算智能、感知智能、認(rèn)知智能,這一觀點也得到業(yè)界的廣泛認(rèn)可。
計算智能是以生物進化的觀點認(rèn)識和模擬智能。有學(xué)者認(rèn)為,智能是在生物的遺傳、變異、生長以及外部環(huán)境的自然選擇中產(chǎn)生的。在用進廢退、優(yōu)勝劣汰的過程中,適應(yīng)度高的(頭腦)結(jié)構(gòu)被保存下來,智能水平也隨之提高。機器借助大自然規(guī)律的啟示設(shè)計出具有結(jié)構(gòu)演化能力和自適應(yīng)學(xué)習(xí)能力的智能。計算智能算法主要包括神經(jīng)計算、模糊計算和進化計算三大部分,神經(jīng)網(wǎng)絡(luò)和遺傳算法的出現(xiàn),使得機器的運算能力大幅度提升,能夠更高效、快速處理海量的數(shù)據(jù)。計算智能是人工智能的基礎(chǔ),AlphaGo是計算智能的代表。
感知智能是以視覺、聽覺、觸覺等感知能力輔助機器,讓機器能聽懂我們的語言、看懂世界萬物。相比起人類的感知能力,機器可以通過傳感器獲取更多信息,例如溫度傳感器、濕度傳感器、紅外雷達、激光雷達等等。感知智能也是人工智能的基礎(chǔ),機器人、自動駕駛汽車是感知智能的代表。
認(rèn)知智能是指機器具有主動思考和理解的能力,不用人類事先編程就可以實現(xiàn)自我學(xué)習(xí),有目的推理并與人類自然交互。人類有語言,才有概念、推理,所以概念、意識、觀念等都是人類認(rèn)知智能的表現(xiàn),機器實現(xiàn)以上能力還有漫長的路需要探索。
在認(rèn)知智能的幫助下,人工智能通過發(fā)現(xiàn)世界和歷史上海量的有用信息,并洞察信息間的關(guān)系,不斷優(yōu)化自己的決策能力,從而擁有專家級別的實力,輔助人類做出決策。認(rèn)知智能將加強人和人工智能之間的互動,這種互動是以每個人的偏好為基礎(chǔ)的。認(rèn)知智能通過搜集到的數(shù)據(jù),例如地理位置、瀏覽歷史、可穿戴設(shè)備數(shù)據(jù)和醫(yī)療記錄等等,為不同個體創(chuàng)造不同的場景。認(rèn)知系統(tǒng)也會根據(jù)當(dāng)前場景以及人和機器的關(guān)系,采取不同的語氣和情感進行交流。
假如能像設(shè)想的一樣實現(xiàn)認(rèn)知智能,那么底層平臺必須足夠?qū)拸V和靈活,以便在各領(lǐng)域甚至跨領(lǐng)域得到應(yīng)用。因此研發(fā)人員需要從全局性出發(fā),打造這個健壯的底層平臺,它應(yīng)該包括機器學(xué)習(xí)、自然語言處理、語音和圖像識別、人機交互等技術(shù),便于上層應(yīng)用開發(fā)者的開發(fā)和使用。
下一篇文章會從設(shè)計底層平臺的角度來闡述個人的思考。
1、人工智能史
2、人工神經(jīng)網(wǎng)絡(luò)
https://baike.baidu.com/item/人工神經(jīng)網(wǎng)絡(luò)
3、深度學(xué)習(xí)
https://baike.baidu.com/item/深度學(xué)習(xí)
4、自然語言
https://baike.baidu.com/item/自然語言
5、TensorFlow
https://baike.baidu.com/link?url=dO_lFqvg6FQLYVaQKcwnlol1noc-EgdfIGbG6pQUo481iBQQkXSC8ZtFdAZ7II2SXyvG-mrTu34UuRFGdb0xvu2gmiZL02Sm6X4zOKiJrJ_
6、知識圖譜
https://www.jiqizhixin.com/articles/2017-03-20
7、《人工智能》-李開復(fù)、王詠剛著
https://item.jd.com/12169266.html
8、小米《奇葩說》花式廣告大賽
http://w.benbun.com/xiaomi/koubo/?state=d81c977eeb74e8d8783dc94e39fe1972&code=1abbb176039771a76583804409fb3354
聯(lián)系客服