30秒快讀
1 | 或許你習(xí)慣于刷臉支付、對(duì)著智能音箱下達(dá)命令,也聽說過機(jī)器人了打敗專業(yè)圍棋選手的故事,AI正走進(jìn)我們的生活。 |
2 | 尤其是疫情期間智能熱成像儀、消毒機(jī)器人等AI產(chǎn)物,在防疫、抗疫、復(fù)工、復(fù)產(chǎn)方面發(fā)揮著重要的作用。 |
3 | 只是,盡管AI正在加速落地,出現(xiàn)在越來越多的應(yīng)用場景,《IT時(shí)報(bào)》記者發(fā)現(xiàn),目前的AI發(fā)展距離大眾的期待仍有落差。 |
如果說大眾對(duì)AI的期望是一名大學(xué)生,那么如今的AI還只是一名“小學(xué)生”,會(huì)學(xué)習(xí),會(huì)有歸納,有結(jié)果輸出,但還不會(huì)舉一反三、隨機(jī)應(yīng)變。
這意味著,如果無人駕駛場景中遇到突發(fā)情況時(shí),AI能足夠快給出判斷嗎?我們能信任AI給出的判斷嗎?而應(yīng)對(duì)這些缺陷,目前AI在框架上又有哪些性能提升空間?
帶著這些問題,記者在2020年世界人工智能大會(huì)上一路追尋。
01
AI仍是“小學(xué)生”:
走不出黑箱
中科院院士何積豐表示,思考是對(duì)現(xiàn)有知識(shí)的加工和消化,并產(chǎn)生新知識(shí)的過程,相比于單純學(xué)習(xí),對(duì)人工智能而言需要更進(jìn)一步。
事實(shí)上,目前人工智能已經(jīng)發(fā)展到第二代,通過神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模擬人類的感知。數(shù)據(jù)、算力和算法是AI深度學(xué)習(xí)的三大要素。
那么,只會(huì)學(xué)習(xí)的AI如何打敗了會(huì)思考的專業(yè)圍棋大師?答案是數(shù)據(jù)!
據(jù)中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸介紹,Alpha go在參加比賽前有6000萬盤棋局的學(xué)習(xí),但一名圍棋大師學(xué)習(xí)的棋局只有百萬級(jí)。
AI以量取勝。這也是目前AI的運(yùn)用主要集中在聲音識(shí)別、圖像識(shí)別等方面的原因。由于聲音、圖像數(shù)據(jù)可以隨時(shí)生成,能自我復(fù)制,幾乎是無窮盡的。從本質(zhì)上講,AI是統(tǒng)計(jì)學(xué),有了海量數(shù)據(jù)支撐,能夠提升AI算法準(zhǔn)確度。
但如今AI產(chǎn)出的結(jié)果并非完全令人滿意。
由于深度學(xué)習(xí)通過數(shù)據(jù)層層分割,AI只能從局部識(shí)別,而非整體。AI識(shí)別一張阿爾卑斯山圖片的準(zhǔn)確率達(dá)94.39%。但如果給這張圖片加上一層色彩躁點(diǎn),盡管生成的新圖片人類肉眼幾乎看不出太大異樣,但AI識(shí)別的結(jié)果卻是一條大黃狗,識(shí)別率達(dá)99.99%??梢?,AI只能識(shí)別物體,而不會(huì)真正理解含義。
遺憾的是,深度學(xué)習(xí)是黑箱算法,技術(shù)人員無法獲知AI為何會(huì)產(chǎn)出上述結(jié)果。不可解釋,帶來的是對(duì)AI不安全、不可靠等方面的擔(dān)憂。
在中科院院士、清華大學(xué)人工智能研究院院長張鈸看來,目前的AI主要依靠數(shù)據(jù)、算力(蠻力)來解決完全信息和結(jié)構(gòu)化環(huán)境下確定的問題,解決的問題很有限。面對(duì)復(fù)雜環(huán)境中的突發(fā)狀況,比如無人駕駛突發(fā)路況,AI仍力不從心。
AI這位小學(xué)生距離畢業(yè)典禮仍有很長的路要走。
02
AI畢業(yè)路上加速度:
可變Batch Size策略下的提升
前路漫漫,畢業(yè)無期。但同時(shí),《IT時(shí)報(bào)》記者也發(fā)現(xiàn),AI小朋友的“學(xué)習(xí)狀態(tài)”正在調(diào)整。AI框架的優(yōu)化,讓我們看到在算力和算法上的提升。
根據(jù)中科院計(jì)算所高性能計(jì)算機(jī)研究中心主任譚光明的分享,從2013年起,利用計(jì)算機(jī)GPU加速深度學(xué)習(xí)已成為業(yè)內(nèi)趨勢,而多節(jié)點(diǎn)并行計(jì)算逐漸成為主流。
深度學(xué)習(xí)發(fā)展早期,AI往往采用單節(jié)點(diǎn)的訓(xùn)練模式,只是隨著更大的數(shù)據(jù)和更深層次的模型(從AlexNet、ResNet、NasNet直至AmoebaNet)被提出,意味著計(jì)算機(jī)需要更大的內(nèi)存和計(jì)算能力。
當(dāng)單GPU訓(xùn)練也無法承受應(yīng)用的負(fù)載時(shí),AI企業(yè)不得不采用邊緣計(jì)算的形式為其解壓?!胺植际交虿⑿杏?jì)算將在AI框架中變得尤為重要?!弊T光明表示。
據(jù)悉,目前無論是國外的TensorFlow、PyTorch還是國內(nèi)的曠視天元MegEngine、百度飛槳都設(shè)計(jì)了分布式深度學(xué)習(xí)框架。
但是這一框架依然有著遺憾,比如算法的性能和精度。
Batch Size(批量取樣規(guī)模)指的是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中一次訓(xùn)練所選取的樣本數(shù),其大小會(huì)影響計(jì)算模型的優(yōu)化程度和速度,也會(huì)直接影響GPU內(nèi)存。
如果把計(jì)算模型看作是一頭奶牛,那么批量取樣規(guī)模是牧草。大量的牧草能提供奶牛豐富的營養(yǎng),產(chǎn)出的牛奶質(zhì)量越高。只是奶牛消化牧草需要時(shí)間,產(chǎn)奶也需要過程。因此,目前妥協(xié)于GPU內(nèi)存情況和計(jì)算速度,AI企業(yè)不得不將批量取樣規(guī)模調(diào)整到較小的數(shù)值,犧牲了準(zhǔn)確度。
Facebook曾在1小時(shí)內(nèi)完成了ImageNet的訓(xùn)練。當(dāng)時(shí)Facebook采用的手段是將GPU的線性擴(kuò)展到256個(gè)規(guī)模,并將8K作為批量取樣規(guī)模的選擇,能達(dá)到76%的準(zhǔn)確率。與此類比,Google將批量取樣規(guī)模從128上調(diào)至1024,但達(dá)到的準(zhǔn)確率只有57%左右。
根據(jù)中科院研究院在2019年IEEE舉辦的一場峰會(huì)上發(fā)表的成果,計(jì)算模型在訓(xùn)練前后期,AI的學(xué)習(xí)效果顯著不同,并提出了訓(xùn)練前期用8K批量取樣規(guī)模,后期用64K批量取樣規(guī)模的可變Batch Size計(jì)算策略。如同先給奶牛少部分牧草,促進(jìn)消化,再提升牧草量,保證產(chǎn)出的牛奶質(zhì)量。
效果顯而易見,相比Facebook,這套新計(jì)算策略能在ImageNet上將訓(xùn)練時(shí)長從1小時(shí)縮短至25分鐘。
值得一提的是,在分布式計(jì)算框架下,中科院還采用了“決策樹”模型,將決策樹作為選擇器,為不同網(wǎng)絡(luò)層確定合適的數(shù)據(jù)布局。
事實(shí)上,如果AI根據(jù)經(jīng)驗(yàn)判斷提取的數(shù)據(jù),往往不一定是最優(yōu)解。因此,有了“決策樹”,目前能達(dá)到95%以上的預(yù)測精度,要知道運(yùn)用傳統(tǒng)方法,達(dá)到90%的預(yù)測精度并不容易。
或許從理論和技術(shù)上,AI正加快速度走向小學(xué)畢業(yè)的終點(diǎn)。
03
AI小學(xué)畢業(yè):
模仿人腦,舉一反三
AI的小學(xué)畢業(yè)典禮,是多位演講嘉賓愿意暢想的未來,屆時(shí)AI將真正擁有“智慧”,即隨機(jī)應(yīng)變、舉一反三。
借鑒人腦模型,可能是AI的未來。如果AI能夠理解識(shí)別的語義,可以像人類一樣一眼就明,當(dāng)遇到特殊情況時(shí),能更快識(shí)別,做出合理判斷。
知識(shí)、數(shù)據(jù)、算法和算力是張鈸認(rèn)為的第三代人工智能四個(gè)要素。
有了知識(shí)的AI有何不同?
事實(shí)上,目前AI能做的只有在確定環(huán)境和完全信息條件下的推理和決策。從AI玩圍棋、國際象棋上看,本質(zhì)上是一場決策的概率學(xué)。
當(dāng)現(xiàn)實(shí)生活中,人們面對(duì)的更多是“博弈”。以玩德州撲克為例,AI還需要了解的是對(duì)手的心理,在對(duì)抗環(huán)境下做出決策。
不確定的環(huán)境、不完全的信息、動(dòng)態(tài)變化的場景,對(duì)AI而言計(jì)算并不容易。
或許從理論上, 我們可以看到第三代AI運(yùn)用于更大范圍的場景的可能。人工智能正在飛速發(fā)展,這一天似乎并不遙遠(yuǎn)。
“序幕已經(jīng)拉開,大戲即將上演!” 張鈸說。
作者/IT時(shí)報(bào)記者 孫鵬飛
編輯/挨踢妹
排版/黃建
圖片/采訪對(duì)象、DeepMind
來源/《IT時(shí)報(bào)》公眾號(hào)vittimes
相關(guān)推薦
你在生活中感受到AI的存在了嗎?
聯(lián)系客服