人工智能的這一波熱潮毫無疑問是由深度學習引發(fā)的,自吳恩達等人 2011 年發(fā)表「識別貓」研究后,深度學習及其引發(fā)的技術已經(jīng)在圖像識別、游戲等任務中超越人類,并讓機器學習技術的應用帶入人們的生活。這種 AlphaGo 背后的技術是否是未來人工智能的方向?Fabio Ciucci 給出了他的看法。
現(xiàn)在每一個人都在學習,或者正打算學習深度學習(DL),它是目前人工智能諸多流派中唯一興起的一個。各個年齡階段的數(shù)十萬人學習著免費和收費的深度學習課程。太多的創(chuàng)業(yè)公司和產(chǎn)品的命名以「深度」開頭,深度學習已然成了一個流行語,但其真正使用實際上很少。絕大多數(shù)人忽略了深度學習只占機器學習領域的 1%,而機器學習又只占到了人工智能領域的 1%。余下的 99% 則被用來處理實踐中的絕大多數(shù)任務。一個深度學習專家無法與人工智能專家劃上等號。
深度學習并不是人工智能的同義詞。谷歌、Facebook 等巨頭公司宣傳最多的人工智能工具主要是或者僅僅是深度學習,因此大眾誤以為所有的人工智能突破都(將)由深度學習實現(xiàn)。真實情況并非如此。決策樹比如 XGBoost 不會成為頭條,但卻在很多 Kaggle 表格數(shù)據(jù)競賽中低調(diào)地擊敗了深度學習。媒體暗示 AlphaGo 的成功全部歸于深度學習,但實際上它是蒙特卡洛樹搜索+深度學習,這表明深度學習單槍匹馬很難取勝。很多強化學習的任務通過神經(jīng)進化的 NEAT 而不是反向傳播得到解決。人工智能領域存在著「深度誤傳」(deep misinformation)。
我并不是說深度學習沒有解決問題:它令人印象深刻。樹和其他算法并沒有完勝深度學習,某些任務上深度學習無法被取代,但是我希望未來一些非深度學習系統(tǒng)可被(重新)發(fā)現(xiàn)以擊敗深度學習,并解決了目前無法解釋的黑箱問題。同樣我也希望讀到有關「災難性遺忘」的深度學習文章,它是指在學習新知識時快速遺忘先前已學習知識的傾向,并且需要每天對抗「過擬合」。關于「智能」:深度學習只是簡單地相信給到的訓練數(shù)據(jù),而不管什么是真與假,現(xiàn)實與想象,公平與不公。人類也會誤信假新聞,但只是在某種程度上,甚至孩童都知道電影是虛構(gòu)的、不真實的。
關于更多細節(jié),如果你有時間了解,請見我的詳述文章:https://www.linkedin.com/pulse/ai-deep-learning-explained-simply-fabio-ciucci。
20 年前,每個人都在學習 HTML,這個手動寫網(wǎng)頁的標記語言當時被認為足以成就一個億萬富翁。我學習每一項看起來有用的技術,如 HTML、手機 app 和深度學習,并且邀請其他人一些學習。事實上,你一生中不是只學習一次技術。1995 年 HTML 開始過時,無法滿足需求,取而代之的是 CSS、JavaScript 和服務器語言。同樣地,深度學習有一天也會過時。大多數(shù)流行的手機 APP 根本用不到 HTML,那么,誰又會知道未來的人工智能 APP 用不用得到深度學習呢?
實際上,深度學習是 1980 年代的技術,比 HTML 還老:由于有了更多的訓練數(shù)據(jù),1970 年代的「帶有隱藏層的神經(jīng)網(wǎng)絡」獲得新生,重新命名為深度學習之后被大肆炒作。1992 年我扼要地查看了神經(jīng)網(wǎng)絡以及分形分析(fractal)和細胞自動機的源代碼。正如絕大多數(shù)人一樣,當時我并沒有選擇深度學習,只是把它當作毫無實際價值的學術數(shù)學難題。相反,我聚焦于視頻游戲的 3D 技術,因為它可以即刻獲得結(jié)果;后來我又開始關注互聯(lián)網(wǎng)等。但是我們都錯了,深度學習借助大數(shù)據(jù)可以大有作為。2015 年 Deep Dream 簡直令我著迷,接著是 GANs 等。但是,深度學習并不是人類可以創(chuàng)造的人工智能科技的終點。
數(shù)十年來,「古老」的深度學習技術已被廣泛研究和更新以更準確地解決更多任務,但是沒有一個深度學習網(wǎng)絡(卷積、RNN、RNN + LSTM、GANs 等)可以解釋其自身的決策。無疑深度學習還會解決更多的問題,取代更多的工作,但不太可能解決所有的問題,或者保持驚人的進步以自我解決黑箱問題或者為之正名。
哲學家柏拉圖與亞里士多德:深度學習無法理解他們
未來人工智能應探索其他的新方法,或者已存在卻被忽視的方法,而不僅僅是深度學習。深度學習的一個局限是把數(shù)據(jù)中最常遇見的內(nèi)容作為真理,把統(tǒng)計學上較稀少的東西看作假的。深度學習的公正性并非來自其自身,而是人類篩選和準備的數(shù)據(jù)。深度學習可以閱讀并翻譯文本,但不是以人類的方式。如果使用超過 100 本書訓練深度學習模型:40 本書告訴仇恨、戰(zhàn)爭、死亡和摧毀如何是壞的,60 本書告訴希特勒的納粹思想是好的,那么該模型最終會成為 100% 的納粹!
深度學習靠自己永遠無法明白為什么殺害猶太人、同性戀以及殘疾人是錯誤的,如果在訓練數(shù)據(jù)集中納粹主義是最流行的觀點。難怪深度學習無法解釋其自身決策,除了「我(深度學習)讀到最多的是「納粹主義是正確的」,因此它應該是正確的」。深度學習將會學習并模仿最具缺陷的邏輯,包括恐怖主義。甚至孩童可以自己明白電影中那個家伙是壞人,但是深度學習做不到,除非人類首先明確教導它。深度學習中有些東西很酷,比如帶有反向傳播的梯度下降、自定義深度學習硬件;但這多是統(tǒng)計學和幾何學的,很可能不會出現(xiàn)在 2037 年的人工智能時代。
對很多任務來說,深度學習 AI 正在或者將會變的違法。收集 28 個歐洲國家公民數(shù)據(jù)的人或公司應在 2018 年 5 月 25 日起遵循《一般數(shù)據(jù)保護條例》(GDPR),屆時歐洲的一些 APP 將被禁止使用深度學習,這導致初創(chuàng)公司拼命尋找深度學習的替代方案,否則將面臨罰款的危險。罰款金額為全球營收的 4%,包括美國部分。關于自動化決策的 GDPR 要求深度學習具有解釋其決策的能力,防止基于種族、觀點等的歧視的發(fā)生。類似于 GDPR 的法律已在全球廣泛制定,這只是時間問題?!睹绹叫庞脠蟾娣ā芬笈端袑οM者信用評分產(chǎn)生不利影響的因素,數(shù)量上限是 4 個。深度學習的因素可謂海量,而不僅僅是 4 個,如何將其簡化為 4 個呢?人工智能,正如比特幣 ICO,開始忽視法規(guī),但是法律與懲罰一直會在。
采取更多相關決策而不是區(qū)分一張圖像是否是貓,或者在自拍的哪部分添加兔耳的深度學習系統(tǒng)將會被非深度學習系統(tǒng)取代。人工智能必須是負責任的,可以使用簡單、合法有效的語言向法官和用戶解釋其輸出結(jié)果,這與深度學習大不相同。深度學習的復雜性,對法官和用戶來說就像是魔術,是一種法律風險,而不是一個很酷的未來。深度學習將會建議或警示人類,比如從醫(yī)療圖像中檢測疾病,并獲得醫(yī)生的驗證,但這是部分的自動化,缺乏細節(jié)。我們將向因為人工智能而被拒絕并尋求解釋的人們(工作、貸款被拒絕等)訴說什么呢?
法律包含「解釋權」,比如,為什么工作或貸款被拒絕。深度學習給出了非自然(合法)語言解釋的結(jié)果。深度學習的代碼容易獲得,卻不為法官或用戶所接受,因為即使最好的數(shù)學家或其他算法也無法搞明白它,將模型簡化成可以理解的語言。即使由人類做出最后的決策,人工智能也應給出詳細的理由。沒有人知道如何修改深度學習以給出簡單的人類可理解的解釋,因此深度學習不可能做到順從。這一問題同樣影響到了若干個其他人工智能和機器學習算法,但不像深度學習那么嚴重。比如,如果決策樹被提升或集成,它也會不可解釋。但是未來,新的或者重新發(fā)現(xiàn)的已解決了黑箱問題的人工智能,將會在常規(guī)決策方面取代深度學習和人類。
在 GDPR 的情況中,只有人類可以拒絕一個應用:人工智能可自動化積極的結(jié)果;如果它拒絕了一項貸款、工作等,就應該將這項任務交給人類來處理這些消極的結(jié)果。但是在拒絕的情況中,人類將不會從基于深度學習的人工智能中獲得幫助或解釋,他們不知道深度學習的邏輯是否正確。他們不得不自己從頭檢查數(shù)據(jù),以決定是否最終拒絕。風險在于為了節(jié)約時間和成本,人類會做出假的解釋,并盲目接受人工智能的認可。安全起見,對于接受和拒絕,你都要有充足的理由,無論 GDPR 中說了什么。非深度學習的 AI 系統(tǒng)把所有決策的解釋提供給用戶、法官和支持人員,將最終被人類采用,用于做出完全和部分的自動化決策。
在法律和深度學習之前,解釋性已經(jīng)是一個大問題。在反壟斷案例中,谷歌等公司被質(zhì)問為什么是這個產(chǎn)品而不是其他產(chǎn)品出現(xiàn)在搜索結(jié)果中,這也是深度學習出現(xiàn)之前的事:很多其他的算法同樣以瘋狂的方式混合算法以得到結(jié)果,因此沒有人類可以輕易地推論出決策原因。法官被告知工程師并不了解詳情,線性代數(shù)的頁面被當作證據(jù)。這無法善終:在特定的法律存在之前,多個案例承擔著數(shù)十億美元的罰款,甚至收到變更系統(tǒng)的警告。用戶的集體訴訟根據(jù)商店、銀行的自動決策單元自動拒絕工作、貸款、退款等,正越來越普遍。無法解釋意味著沒有防衛(wèi)、被罰款以及一場品牌公關災難。
對大部分人來說,「人工智能」是科幻電影《人工智能》(AI)中能夠給出聰明解讀的 AI,電影中人類可以快速決定自己是否同意,這樣易于進行法律驗證(legal validation)。大多數(shù)聽說過「AI-first」或「使用 AI」公司的人,包括法官和撰寫《一般數(shù)據(jù)保護條例》(GDPR)等法律的人,期待 AI 像電影中一樣,即使被法院傳召,也能夠捍衛(wèi)自己的決定,這令用戶和法官都印象深刻。但是,與期待不同,我們得到的是無法解釋的「深度學習人工智能」,這些人工智能即使在能夠解決的問題上也不經(jīng)常得到使用,因為其缺乏可解釋性。深度學習不會節(jié)省成本,也不會取代那些需要敏銳的自動決策的工作。即使在人類必須作出最終決策的情況下,工具 AI 解釋自己的建議也比 AI 不給出緣由就做出回應要更加可取。可解釋的 AI 一旦被(重新)發(fā)現(xiàn),將會更加安全、合法、廉價、快速,取代深度學習和人類。深度學習在 20 世紀 60 到 80 年代發(fā)明,2010 年以來重新被發(fā)現(xiàn);或許未來可解釋的 AI 的基礎也已經(jīng)被某些研究者描述出來,但是由于不是深度學習,所以可能在幾十年內(nèi)都沒人關心和開發(fā),直到它們被重新發(fā)現(xiàn)和炒熱。
關于自動決策的 GDPR 也需要防范根據(jù)種族、意見、健康狀況等產(chǎn)生的歧視。但是使用用戶生成的數(shù)據(jù)(如社交媒體和新聞,不指真實的數(shù)據(jù),如醫(yī)療或財政記錄)訓練的深度學習模型通常暗含邪惡的偏見。如前所述,深度學習可以讀取大量文本和數(shù)據(jù),并模仿其內(nèi)容,但無法理解內(nèi)容。深度學習只相信它在數(shù)據(jù)中頻繁看到的事物、底層模式和趨勢,因此它會放大人類社會的偏見和問題。數(shù)據(jù)顯示被逮捕的黑人比白人多,那么一旦有人犯罪,深度學習將首先懷疑黑人;數(shù)據(jù)顯示公司董事會董事中男性比例高于女性,則深度學習將在招聘中更傾向于男性應聘者。
深度學習決策會比訓練數(shù)據(jù)的平均樣本包含更深刻的偏見,如種族歧視、性別歧視。這個問題在所有的機器學習算法中都有發(fā)生,但是深度學習模型是其中最難測試、檢測、控制和調(diào)整的。這個問題很難解決,這引起很多深度學習實驗突然取消,從聊天機器人變得納粹化、充滿仇恨,到美圖軟件中給黑人照片美白。
深度學習是一個神經(jīng)網(wǎng)絡,你無法單獨編輯每個答案的輸出結(jié)果。
你無法通過在訓練之后添加補丁,來修復一個帶有偏見、種族和性別歧視的深度學習模型。深度學習是一個神經(jīng)網(wǎng)絡,與其他 AI 方法不同,你無法編輯某個答案,而是必須使用全新的、完全公正的、稀有的數(shù)據(jù)對該網(wǎng)絡進行重新訓練。深度學習可以在不理解的情況下模仿數(shù)據(jù)中的內(nèi)容:它不會否定任何數(shù)據(jù),不會發(fā)現(xiàn)社會上的偏見,而只是「學習所有數(shù)據(jù)」。你應該雇傭一個人類員工,專門創(chuàng)建假的完美、公正的數(shù)據(jù)。但是,由人類專家編輯創(chuàng)建海量無偏見數(shù)據(jù)的成本僅為了訓練深度學習模型,又怎么可以說用 AI 取代人類呢!此外,即使你已經(jīng)訓練出真正公正的深度學習模型,你也無法向法官或用戶證明其決策的公正性,因為它無法提供解釋。
深度學習的重要性應該降低,用于沒有法律風險的非商業(yè) app 或游戲。當可解釋的 AI 變得流行,深度學習將會像磁帶一樣被拋棄。在游戲中輸給機器人的人類不太可能說服法官對 AI 公司罰款,因為你無法解釋 AI 是怎么贏的。不滿 FaceApp 把自己的自拍照修的更老、更年輕,或者換了性別的人也不太可能說服法官對 FaceApp 罰款,因為你無法解釋 AI 是如何決定新面孔的。在醫(yī)療圖像中進行疾病檢測是一項安全的深度學習應用,前提是用戶在服藥之前先向人類醫(yī)生尋求確認。
合法的深度學習市場非常有限:在決策結(jié)果造成財政、健康上的區(qū)別,或者存在歧視性,而深度學習無法理解決策是否公正以及為什么公正的時候,法官可以處罰。那么自動駕駛呢?似乎在藝術、游戲或高級幽默以外的領域使用深度學習都有法律風險?,F(xiàn)有的非深度學習方法可以取代深度學習,新方法也會被(重新)發(fā)現(xiàn),因此 AI 的發(fā)展將會順利進行。尤其是每個人研究(并投資)AI 和機器學習科學領域中的所有新舊算法,而不只是深度學習:這也是成為「人工智能專家」的唯一路徑。
深度學習除了正在「非法」用于很多可解任務以外,它也不能被用于解決以下一系列問題:那些需要抽象推理來找出數(shù)據(jù)中哪些是公平,哪些是不公平的任務,那些需要解釋其中的邏輯,并自行作出決定的任務。即使對于那些不需要解釋的任務來說,深度學習看起來是最好的系統(tǒng)(如圖像識別),但是也不如人類自己那樣具有穩(wěn)定性。你可以輕而易舉地使用對抗樣本來讓深度學習系統(tǒng)出錯:為一張貓的圖片加入一些特殊的噪點,機器就會把它誤認為其他不相關的東西,而人類絕不會犯錯。如果街邊的路牌被對抗樣本黑掉了,現(xiàn)在的自動駕駛汽車將不再安全。新一代的人工智能系統(tǒng)必須克服這個問題——它也將取代深度學習。
著名深度學習庫 Keras 作者 Fran?ois Chollet 曾在一篇名為《深度學習的限制》的文章中說到:「深度學習唯一真正能成功做到的是使用幾何變換,在給定大量人類標注數(shù)據(jù)的情況下將空間 X 映射到空間 Y 的能力?!惯@些空間擁有多維,不僅僅是三維的,這就是深度學習可以模仿畢加索風格作畫、在德州撲克中 Bluff,以及在其他一些方面里展示創(chuàng)造力的原因。但是對于外行人來說,這也許意味著:深度學習模型可以被訓練成擁有識別貓的能力,但本身不知道什么是貓;可以是一個種族主義者,但不知道什么是種族主義。深度學習可以識別貓、具有種族主義,并贏得很多游戲,這看起來是令人矚目的進步,但深度學習無法解釋為什么圖中的動物是貓,也無法定義種族主義。
在《深度學習的未來》中,Keras 的作者描述了一種只有「幾何模塊」的全新深度學習系統(tǒng),它應該與尚未出現(xiàn)的「算法模塊」和「元學習器」相關。這種方式可以顯著增加可以解決問題的類型與數(shù)量,但因為深度學習模塊的存在,這種方式仍然無法解釋決策的機制。這就像我們不能用言語解釋大腦中計算出的某些感覺或圖像。人類可以解釋自己的想法,但這種解釋過于簡單化,不甚準確。機器的算法卻總被要求完全準確。有一些專家正在開發(fā)完全不包含深度學習的全新人工智能系統(tǒng),但他們?nèi)狈χС郑含F(xiàn)在所有人都只投資深度學習,而這個風潮還將持續(xù)一段時間。沒有人知道下一個人工智能浪潮將會是關于什么的,但看起來不會是深度學習 2.0。
深度學習正處于過熱狀態(tài),因為只有與深度學習軟/硬件相關的人正在不斷討論它。你可曾見過任何「自然智能」專家,如心理學家和哲學家支持過深度學習?
如果你不太了解人工智能,或者還沒有時間來學習,我認為你可以等待下一代人工智能系統(tǒng)的興起,直接跳過深度學習 1.0 時代。如果你有這方面的需求,我建議你深入了解整個人工智能及機器學習領域的知識——而不僅僅是深度學習。在人工智能成為火熱概念的今天,我們更需要冷靜的思考。
聯(lián)系客服