演講丨杜百川 來源丨眾視DVBCN
6月14日,第23屆上海電視節(jié)2017白玉蘭國際廣播影視技術(shù)論壇(IBTC2017)在上海卓美亞喜瑪拉雅酒店盛大開幕,會上,國家新聞出版廣電總局科技委副主任杜百川發(fā)表了題為《面向廣電智能化的廣電之路》的主題演講。
一、人工智能的定義與現(xiàn)狀
目前,針對人工智能的定義,一部分人將AI寬泛地定義為一個計算機系統(tǒng)表現(xiàn)出通常被認為是需要智能的行為。另一部分人AI定義為一個不管是遭遇怎樣的實際環(huán)境,都能夠理性解決復雜問題或采取相應行動以達到其目的系統(tǒng)。
而流行的Stuart Russell / Peter Norvig所著“ AI ” 提出了 AI 問題和解的分類:
1.像人一樣思考的系統(tǒng)(如認知架構(gòu)和神經(jīng)網(wǎng)絡);
2.像人一樣行動的系統(tǒng)(如用自然語言處理通過圖靈測試; 知識表達, 自動推理, 和學習);
3.像人一樣理性思考的系統(tǒng)(如邏輯解算, 推理, 和最佳化);
4.理智行事的系統(tǒng)(如智能軟件代理和體現(xiàn)的機器人通過感知, 規(guī)劃, 推理, 學習, 通信, 決策, 和行動來達到目的)。
盡管 AI 的邊界不確定并隨時間而改變,但多年來AI研究和應用的核心目標還是自動化和復制智能行為。
杜百川提出,在窄義上,AI已經(jīng)取得明顯進步,主要的應用領(lǐng)域包括,對弈策略游戲,語言翻譯,自駕駛汽車和圖像識別。它支撐了許多商務,如旅行策劃,顧客推薦系統(tǒng)和廣告定位等,并且在醫(yī)療診斷,教育和科學研究方面有重要應用,擁有明顯的社會和經(jīng)濟效益。
通用AI(General AI,有時也稱為人工通用智能AGI Artificial General Intelligence) 指一種想象的人工智能系統(tǒng),面對所有認知任務時表現(xiàn)得至少優(yōu)于與人。目前在NAI到更難實現(xiàn)的GAI 之間還有很大距離,想把NAI擴展到GAI,每前進一小步就要幾十年的研究。NSTC技術(shù)委員會非常同意民間機構(gòu)專家團體的意見,GAI至少在幾十年內(nèi)還做不到。
人們長期以來猜測計算機會比人更智能,有人預測一種足夠智能的AI可以完成更好更智能的系統(tǒng),反過來產(chǎn)生更強的智能,不斷循環(huán)將產(chǎn)生“智能爆炸”或“奇點(singularity)”,快速超越人類智能。這種人工超級智能(ASI:Artificial Super-Intelligent)機器將超出人類的理解和控制,如果計算機實現(xiàn)控制人類許多關(guān)鍵系統(tǒng)將是浩劫。但NSTC技術(shù)委員會評估,對超級智能的擔心對目前AI政策影響有限。
二、人工智能系統(tǒng)的主要功能
杜百川表示,人工智能系統(tǒng)有六大主要功能。一是從經(jīng)驗學習;二是使用學習去推理;三是圖像識別;四是解決復雜問題;五是理解語言細微差別;六是產(chǎn)生觀點。
杜百川將AI分為3種。一是輔助智能。人和機器互相學習并重新定義相互間的寬容度和深度。在此框架下,人和機器共享決定權(quán)。二是增強智能。增強人的能力把某些事做得更好更快。仍然是人做一些關(guān)鍵決定,AI代表他們執(zhí)行任務,決定權(quán)完全在人。三是自主智能。自適應/連續(xù)系統(tǒng),在某些情況下接管決定權(quán),但如此做只是在決策人開始信任機器后或成為快速處理的責任。這種智能類型決定權(quán)在機器因此和輔助智能有根本的不同。
杜百川提出,AI泛指機器表現(xiàn)出的智能,操作層面講指計算機科學R&D實踐中包括的一種或多種分支學科領(lǐng)域: 計算機視覺,自然語言處理 (NLP),機器人技術(shù) (包括人-機器人交互),搜索和規(guī)劃,多智能體系統(tǒng),社交媒體分析(包括眾籌)和知識表達和推理(KRR),機器學習(ML)是所有AI的基礎(chǔ)。通用AI是一個機器所具有的智能能夠成功完成人所能完成的智能任務。
也有分為弱智能、智能和意識智能,但對機器是否有自主意識爭議很大。他表示,AI的工作將從低價值向高價值轉(zhuǎn)移。
深藍(Deep Blue)是由IBM專門用以分析國際象棋的超級電腦。1997年5月曾擊敗國際象棋世界冠軍卡斯巴羅夫。2016年3月AlphaGo 4:1戰(zhàn)勝了李世石。2015年10月測試中,AlphaGo多次使用不同數(shù)目的CPU和GPU,以單機或分布式模式運行。每一步兩秒思考時間。最終Elo等級分如下表。5月23至27日烏鎮(zhèn)圍棋峰會以3:0戰(zhàn)勝柯潔,被中國圍棋協(xié)會授予職業(yè)圍棋九段稱號。因此,杜百川表示,人工智能機器已經(jīng)攻陷了棋類。
2015年Yahoo!與美聯(lián)社都開始引入機器人來撰寫部分財經(jīng)報道和體育新聞,采用Automated Insights研發(fā)的軟件WordSmith,由機器人撰寫的文章可以套用即時數(shù)據(jù),一分鐘可以寫出2000篇的報道。2015年5月23日NPR網(wǎng)站派出資深駐白宮記者Scott Horsley挑戰(zhàn)WordSmith,雙方都一起等待Denny‘s餐飲公司最新財報,財報送達時開始計時。比賽的結(jié)果,速度:WordSmith兩分鐘,Scott Horsley七分鐘;質(zhì)量:網(wǎng)友投票Scott Horsley 9000多票,WordSmith 900票。因此,AI對于廣播電視具有重大作用。
三、AI的實際應用
1.AI在內(nèi)容生產(chǎn)的應用-新聞機器人
新聞機器人分為三大類:
一是語言新聞機器人。已有對話式語音啟動平臺如亞馬遜Alexa和谷歌助理,發(fā)布商及第三方已經(jīng)為Alexa開了發(fā)近5000個 ‘動作’, Google的語音平臺也奮起直追。
二是事實核查機器人。英國為基地的的Full Fact已經(jīng)尋求開發(fā)一種業(yè)務能夠?qū)崟r發(fā)布會進行核查, 法文報紙Le Monde也已經(jīng)有一個搜索引擎,讀者可以核查政治家的言論。這個月微信小程序上線!
三是對話式商務: 許多商務越來越發(fā)生在其他業(yè)務中或通過鎖屏通知。今年大多數(shù)消息平臺都會加上一鍵購買選項,將講故事,產(chǎn)品發(fā)現(xiàn),直接購買和用戶服務混合是聊天機器人進一步發(fā)展方向。
去年上線百度機器人Writing-bots可涵蓋社會、財經(jīng)、娛樂等15大類全機器寫作。
2.機器主持人和機器人選手
今年芒果娛樂與微軟決定在湖南衛(wèi)視的新綜藝欄目《超次元偶像》引入微軟機器人“小冰”作為何炅搭檔主持。她在現(xiàn)場演示的主持人技巧包括測試明星顏值、演唱歌曲《好想你》、運營大數(shù)據(jù)生成最帥人像、調(diào)侃何炅的“高大身材”等。
百度機器人“小度”在最強大腦展示的功能包括人臉和聲紋識,包括跨年齡、跨代和遮擋人臉識別等。
搜狗機器人汪仔的主要功能是問答,通過語音技術(shù)識別和理解提問,再通過智能的分析判斷,從搜狗搜索檢索到的信息中提煉出答案。
3.廣播業(yè)者內(nèi)容的“文藝復興”——生產(chǎn)和分發(fā)智能化
廣播業(yè)者中有一些原來就是制作內(nèi)容的,但有一些是目前剛剛開發(fā)內(nèi)容策略的。許多有線網(wǎng)絡已經(jīng)將其業(yè)務轉(zhuǎn)換到內(nèi)容生產(chǎn)和許可為重點。如OTT平臺,不能保證能吸引足夠的觀眾來付清技術(shù)上的預付投入,但轉(zhuǎn)向內(nèi)容生產(chǎn),投入到跨不同標準內(nèi)容和面對不同平臺。
杜百川提出,內(nèi)容創(chuàng)作決策更加智能化。內(nèi)容復興成功的關(guān)鍵在生產(chǎn)對路的內(nèi)容產(chǎn)品,智能決策起到了關(guān)鍵作用。根據(jù)大數(shù)據(jù)統(tǒng)計選擇內(nèi)容和演員已經(jīng)是內(nèi)容創(chuàng)作必備武器。
4.用戶畫像精準投放
利用大數(shù)據(jù)制作用戶畫像,即用戶標簽,通常是特征標識,如年齡段標簽。根據(jù)用戶喜好和內(nèi)容分類庫做匹配,做到精準推薦和投放。如上海IPTV“千人千面”大數(shù)據(jù)智慧運營平臺是包括大數(shù)據(jù)標簽庫、精準投放平臺、EPG推薦、IPTV智慧運營平臺四為一體的大數(shù)據(jù)智慧運營系統(tǒng)。
四、AI的市場分析
杜百川提出了AI的關(guān)鍵市場趨勢。一是超越移動性觸摸是起步;二是云原生態(tài)內(nèi)容和數(shù)據(jù)是核心;三是遍布智能用智能武裝;四是開放生態(tài)系統(tǒng)從解決方案到平臺。
未來智能無線融合網(wǎng)絡可以從三個層面理解:
第一,底層是可重組的物理資源層,可根據(jù)上層的需要任意分割組合成所需碼率、保護率、延時等參數(shù)的資源分配。
第二,中層是可重構(gòu)的虛擬網(wǎng)絡層,根據(jù)上層業(yè)務需要構(gòu)建所需網(wǎng)絡,包括低功率、小碼率、延時不敏感的物聯(lián)網(wǎng)(IoT),大碼率、低延時,不對稱的視頻網(wǎng)(NGB-W),相對低碼率、低延時對稱通信網(wǎng)(5G/車聯(lián)網(wǎng)),相對低碼率、級低延時車聯(lián)網(wǎng)和純數(shù)據(jù)網(wǎng)(Wi-Fi)。
第三,頂層為具有AI的認知控制層,對下面各層感知,收集數(shù)據(jù),計算和自組織;通過人工智能與環(huán)境和用戶交互并主動學習,形成最適合各行各業(yè)環(huán)境和用戶的使用方式。
未來網(wǎng)絡不應當是下一代通信網(wǎng)或下一代廣播網(wǎng),而應當是泛在、感知、自治、多業(yè)務、云加邊緣計算的智能無線融合網(wǎng)。
五、AI是新的UI
杜百川認為,AI是新的UI。他從3個方面進行了闡釋:
一是AI的語音助理迅速崛起。目前訊飛開放了平臺AIUI,AIUI在語音聽寫、實時互譯、智能家居的人機交互、車載語音交互系統(tǒng)、服務機器人、個性化教育、語音模仿等方面得到廣泛應用。
二是語音模仿。蒙特利爾初創(chuàng)公司 Lyrebird(琴鳥,一種擅長模仿周圍聲音的鳥)開發(fā)了一種語音合成技術(shù),用很少的數(shù)據(jù),訓練一分鐘,就能復制任何人的聲音。
三是自動人臉打碼。微軟2月發(fā)布人臉自動打碼技術(shù),用戶只需在后臺用鼠標選擇想要打碼的人物,相應人物在視頻中的所有露臉區(qū)域都將被打上馬賽克。
六、如何應對AI武裝的黑客?
杜百川介紹了AI和機器自動黑客攻擊上升的趨勢。
設(shè)計可快速尋找漏洞和潛在網(wǎng)絡缺口的自動化和自發(fā)的黑客攻擊機已經(jīng)出現(xiàn),AI網(wǎng)絡保護機能夠?qū)艉途W(wǎng)絡缺口進行尋找、發(fā)現(xiàn)、破譯和補救,將大幅度超越人工安全操作(SecOps)團隊的能力。
AI專用芯片引發(fā)新一輪競爭,包括谷歌的TPU,IBM的TrueNorth,中國的寒武紀采用自主的深度學習處理器指令集,F(xiàn)PGA 有好的性價比,而GPU 用戶覆蓋率最廣。
杜百川最后表示,如果不具備AI能力,那么廣播電視無論在技術(shù)上、內(nèi)容上、還是在商務上、安全上將不堪一擊!
聯(lián)系客服