中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
AlphaGo會下圍棋,中國兵棋AI“先知”能指揮戰(zhàn)斗!幕后團隊詳解 | 科學(xué)加

日前,中國兵棋AI“先知”大勝人類。AlphaGo會下圍棋,但“先知”真正能在戰(zhàn)斗謀劃及災(zāi)害應(yīng)等領(lǐng)域發(fā)揮作用。幕后團隊詳解。


文/記者 趙天宇 通訊員/劉勇進

編輯/吉菁菁 新媒體編輯/房永珍


“既然國際象棋領(lǐng)域能夠誕生深藍,圍棋領(lǐng)域能夠誕生AlphaGo,那么更復(fù)雜更靈活更加不透明的不完全信息博弈對抗,也一定會產(chǎn)生出超越人類最高水平的人工智能體!我們的先知系統(tǒng),就是在挑戰(zhàn)AlphaGO尚不能完成的工作!”在中科院自動化研究所自動化大廈辦公樓里,中科院自動化所研究員、“CASIA-先知V1.0”(以下簡稱“先知系統(tǒng)”)研發(fā)團隊成員劉禹博士告訴記者,在不完全信息博弈對抗領(lǐng)域,運用人工智能最新成果開發(fā)的數(shù)據(jù)與知識混合驅(qū)動的先知系統(tǒng),已經(jīng)邁出了堅實的第一步。


今年9月,在石家莊舉行的2017全國首屆兵棋推演大賽上,由中科院自動化所研制的人工智能程序“CASIA-先知V1.0”在“賽諸葛”兵棋推演人機大戰(zhàn)中與全國決賽階段軍隊個人賽4強和地方個人賽4強的8名選手激烈交鋒,并最終以7:1的戰(zhàn)績大勝人類選手,展了人工智能技術(shù)在博弈對抗領(lǐng)域的強大實力。


▲先知研發(fā)團隊成員,中國科學(xué)院自動化研究所研究員劉禹博士


什么是兵棋?博弈對抗領(lǐng)域包括哪些內(nèi)容?運用人工智能的博弈對抗領(lǐng)域,可以為我們的生產(chǎn)生活帶來哪些質(zhì)的改變?近日,北京科技報記者來到了中科院自動化研究所,采訪了先知研發(fā)團隊劉禹研究員,深入了解了兵棋博弈和先知系統(tǒng)研發(fā)背后的故事。


1兵棋是真實戰(zhàn)爭的推演和預(yù)算



子墨子解帶為城,以牒為械,公輸盤九設(shè)攻城之機變,子墨子九距之。公輸盤之攻械盡,子墨子之守圉有余。


這是《墨子·公輸》中的選段,講的正是墨子和魯班之間進行了一次“模擬攻防戰(zhàn)”——墨子解下腰帶,圍作一座城的樣子,用小木片作為守備的器械。魯班多次陳設(shè)攻城用的機巧多變的器械,墨子多次抵拒了他的進攻。魯班攻戰(zhàn)用的器械用盡了,但墨子的守御戰(zhàn)術(shù)還綽綽有余,最終墨子贏得了這場“戰(zhàn)爭”的勝利,也迫使楚懷王放棄了攻打宋國的計劃。


所謂兵棋,指的是模擬戰(zhàn)爭攻防的一種競技博弈。墨子和魯班的模擬攻防戰(zhàn),就是一場十分完備的兵棋比賽?,F(xiàn)代的兵棋最早起源于歐洲普魯士,發(fā)明最初是為宮廷貴族打發(fā)無聊時間而設(shè)計的“宮廷游戲”,但經(jīng)過百年的發(fā)展,特別是兩次世界大戰(zhàn)的推動,兵棋逐漸從模擬真實戰(zhàn)爭、戰(zhàn)略部署逐漸轉(zhuǎn)向論證設(shè)計武器系統(tǒng)和分析軍事戰(zhàn)略。


▲兵棋推演


由于能夠最真實的模擬戰(zhàn)場環(huán)境,為部隊戰(zhàn)爭進行科學(xué)決策,兵棋推演在現(xiàn)代戰(zhàn)爭中正發(fā)揮著越來越大的作用。據(jù)了解,美國發(fā)動的阿富汗和伊拉克戰(zhàn)爭,此前都通過兵棋進行了多次推演,推演的目的是設(shè)想足夠的情況和預(yù)案,以期最大限度減少傷亡。而推演的結(jié)果與實戰(zhàn)結(jié)果無限接近。


▲由于能夠最真實的模擬戰(zhàn)場環(huán)境,為部隊戰(zhàn)爭進行科學(xué)決策,兵棋推演在現(xiàn)代戰(zhàn)爭中正發(fā)揮著越來越大的作用


“愛玩游戲的人對兵棋一定不會陌生,它和《星際爭霸》《文明》《鋼鐵雄心》甚至早年的《三國志》都屬于博弈對抗類型的游戲?!眲⒂砀嬖V記者,與回合制的圍棋、象棋不同,兵棋最大的特點在于它存在著一套開放的、可以學(xué)習(xí)和研討的規(guī)則——看不清對方的位置,不可知對方的戰(zhàn)術(shù),甚至用六邊形棋盤可以鋪滿整個地球?!扒?0分鐘連敵人的影子都沒見到,最后5分鐘被‘神兵天降’淘汰”的例子在兵棋中并不少見。


劉禹表示,自動化所研制的先知系統(tǒng),正是基于兵棋這種挑戰(zhàn)性更高的博弈對抗而設(shè)計開發(fā)的,“和人類相比,這套運用人工智能的系統(tǒng),能夠更加快速準確的進行態(tài)勢判斷和戰(zhàn)略決策,并最大程度的減少錯誤的發(fā)生?!?/p>


2用人工智能方案輔助決策



劉禹告訴記者,一套完整的兵棋推演比賽,一般分為四個步驟,即態(tài)勢分析、(作戰(zhàn))方案生成、仿真推演和賽后復(fù)盤四個部分。正所謂“內(nèi)行看門道,外行看熱鬧”,雖然普通觀眾更關(guān)注“硝煙彌漫”的戰(zhàn)爭階段,但資深玩家更看重的卻是戰(zhàn)前的態(tài)勢分析以及生成作戰(zhàn)方案的過程,甚至在大型的兵棋推演中,前兩個步驟就會占到整個比賽時間的50%以上。


▲現(xiàn)代兵棋推演19世紀中期就出現(xiàn)了,德國的Kriegsspiele(就是戰(zhàn)爭游戲的意思)是在地圖上進行推演的,這種簡單的方式現(xiàn)在還很流行。一本手冊,一張地圖,若干算子,就可以開始了。不過規(guī)則往往很復(fù)雜,比如移動時就要考慮各種地形、部隊本身屬性(步行單位、車輛單位)、天氣等。很多現(xiàn)代兵棋推演的計算更為復(fù)雜,因此往往通過計算機完成。(圖片來自網(wǎng)絡(luò))


因此,人工智能在兵棋推演中,主要可以發(fā)揮三個方面作用:一是戰(zhàn)前分析態(tài)勢,科學(xué)的分析敵我雙方的真實實力;二是方案籌劃,綜合考慮多維度信息科學(xué)化制定作戰(zhàn)方案,減少我軍傷亡,加大對敵軍打擊效果;三是提高作戰(zhàn)過程中的實時決策能力,面對突發(fā)情況迅速給出合理的方案。


▲臺灣當局每年都利用兵棋推演平臺進行所謂的“漢光兵棋推演”,模擬解放軍入臺作戰(zhàn)的過程,用以“提升防衛(wèi)作戰(zhàn)效能”,圖為漢光兵棋推演沙盤圖(兵棋臺)。(圖片來自網(wǎng)絡(luò))


在人機博弈這個領(lǐng)域,近20年來已經(jīng)產(chǎn)生了3個里程碑式的事件:1997年IBM公司的“深藍”擊敗國際象棋大師卡斯帕羅夫,這是基于知識規(guī)則引擎和強大計算機硬件的人工智能系統(tǒng)的勝利;2011年同樣是IBM公司的問答機器人“沃森”在美國智力問答競賽節(jié)目中大勝人類冠軍,這是基于自然語言理解和知識圖譜的人工智能系統(tǒng)的勝利;第三次就是2016年的AlphaGo與李世石的圍棋大戰(zhàn),AlphaGo最終以4:1的戰(zhàn)績戰(zhàn)勝李世石,這是基于蒙特卡洛樹搜索和深度學(xué)習(xí)的人工智能系統(tǒng)的勝利。


劉禹認為,人工智能成功攻克了國際象棋和圍棋,下一個人機大戰(zhàn)的挑戰(zhàn),就是不完全信息下的動態(tài)博弈和實時對抗。記者了解到,所謂不完全信息,就是指參與人并不完全清楚有關(guān)博弈對手的信息情報。如果在一場博弈中,參與者同時行動且至少有一個參與者不完全知道其他參與者收益,這種博弈就稱之為不完全信息動態(tài)博弈。象棋、圍棋屬于完全信息博弈,而兵棋、橋牌等就屬于不完全信息博弈。


3從興趣小組到多實驗室合作研發(fā)


今年的政府工作報告和十九大報告中都提到了人工智能,國務(wù)院《新一代人工智能發(fā)展規(guī)劃》明確了我國人工智能的戰(zhàn)略發(fā)展部署。當前,人工智能愈發(fā)火熱?!癆I”對于許多人來說或許還相對陌生,但自動化所在這個領(lǐng)域已經(jīng)與“人工智能”同步歷經(jīng)了60多年的發(fā)展。在AlphaGo之后,自動化所的一批年輕人開始自發(fā)組織興趣群討論,尋找人工智能在博弈領(lǐng)域的新的突破口,挑戰(zhàn)不完全信息動態(tài)博弈難題。


萬事開頭難,先知系統(tǒng)研發(fā)團隊的發(fā)展,也經(jīng)歷了一個從小到大,從無到有的過程。剛開始的時候,大家只是對最新技術(shù)進展進行交流和點評,也存在著一些不同的觀點。去年12月,“人機協(xié)同環(huán)境下不完全信息對抗博弈”命題吸引了大家共同的目光,也引發(fā)出大家共同研發(fā)AI系統(tǒng)的夢想。


▲今年9月舉行的賽諸葛全國兵棋推演大賽上,人工智能在兵棋領(lǐng)域首次戰(zhàn)勝人類,圖為先知研發(fā)團隊部分人員合影 


劉禹說,現(xiàn)在自動化所“智能人機對抗團隊”由模式識別國家重點實驗室、復(fù)雜系統(tǒng)管理與控制國家重點實驗室、綜合信息系統(tǒng)研究中心相關(guān)成員組成,整個團隊年輕而富有活力,平均年齡約35歲。在他們中,范國梁研究員來自綜合信息系統(tǒng)研究中心,帶領(lǐng)小分隊主攻兵棋AI系統(tǒng);來自模式識別國家重點實驗室的興軍亮副研究員則帶領(lǐng)另一路小分隊,重點突擊星際爭霸AI系統(tǒng)。


團隊成立以后,僅用半年時間,就在態(tài)勢感知和作戰(zhàn)決策模塊上采用知識規(guī)則+不確定推理的方式實現(xiàn)了先知1.0程序開發(fā)。劉禹告訴記者,除了賽諸葛全國兵棋推演大賽上取得佳績,在今年9月舉行的2017星際爭霸AI大賽上,來自自動化所的人工智能團隊也獲得了第四名的成績,而來自美國的“重磅”參賽選手Facebook在此次比賽中名列第六。牛刀小試就取得了不錯的成績,讓團隊成員們倍感鼓舞。


自動化所楊一平副所長在兵棋大賽結(jié)束時對團隊成員叮囑,“今天的成績并不是結(jié)束,而是一個新的起點。人工智能系統(tǒng)所展現(xiàn)出的巨大應(yīng)用潛力,以及兵棋推演背后的方法學(xué)和思維方式,才是我們不斷追求的目標!”劉禹表示,先知系統(tǒng)的最終發(fā)展目標是決策與學(xué)習(xí)能力更強、更快的通用人工智能技術(shù),而這或許將是一個持續(xù)數(shù)年的中長期任務(wù)。


4博弈問題在現(xiàn)實中廣泛存在


實際上,棋類競技中的博弈對抗問題,現(xiàn)實生活中其實廣泛的存在于我們生活中,尤其是博弈問題,廣泛存在于軍事、商業(yè)、安防、災(zāi)害應(yīng)急等領(lǐng)域,大到影響國家戰(zhàn)略,小到?jīng)Q定有限資源下的個人競爭。博弈對抗技術(shù)已經(jīng)成為許多領(lǐng)域的標準分析工具之一,在證券學(xué)、生物學(xué)、國際關(guān)系、政治學(xué)和其他很多學(xué)科都有廣泛的應(yīng)用。


“比如說在防災(zāi)減災(zāi)領(lǐng)域,某個地區(qū)發(fā)生了大面積的洪澇災(zāi)害,救災(zāi)的時候,我們應(yīng)該把食品帳篷先運送到哪個地方去,把部隊和醫(yī)生先往哪里派,這里面都涉及有限資源和不完全信息下的博弈問題。而如果再考慮氣象因素、交通因素、實際效果等諸多參數(shù)的話,就會變成一個非常復(fù)雜的決策問題。隨著人工智能的應(yīng)用與成熟,這些問題將得到極大的改善。”


▲在計算機上顯示的兵棋推演比賽示意圖


劉禹解釋說,人機協(xié)同環(huán)境下不完全信息博弈對抗這個命題可以拆分出三個關(guān)鍵詞,第一是人機協(xié)同,第二是不完全信息,第三是博弈對抗。這三個詞的背后都有大量的關(guān)鍵技術(shù)問題需要突破,也有著非常大的應(yīng)用前景。比如人機協(xié)同,強調(diào)的是不同角色的參與者如何得到AI的輔助;不完全信息,需要在動態(tài)過程中估計和決策,數(shù)據(jù)中大量存在的噪音使得很難訓(xùn)練深度網(wǎng)絡(luò)。因此,先知系統(tǒng)只是邁出了第一步,還不能稱之為“研發(fā)成功”。這一步也只是證明了我們的技術(shù)路線是正確的,還有大量的理論研究和技術(shù)開發(fā)挑戰(zhàn)?!斑@次兵棋推演大賽,唯一戰(zhàn)勝先知系統(tǒng)的是一位地方建筑院校的學(xué)生,他用以守代攻、小火慢熬的戰(zhàn)術(shù)從始至終一直占據(jù)上風(fēng),這說明我們的系統(tǒng)還有進一步提升的空間。”


本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
【好文推薦】基于深度強化學(xué)習(xí)的人機智能對抗綜述
DARPA開發(fā)人工智能(AI)技術(shù)應(yīng)用于兵棋推演!
首發(fā) | 美蘭德公司探索如何利用“AI+模擬仿真+兵棋推演”應(yīng)對大國博弈新挑戰(zhàn)
兵棋推演流程之兵棋設(shè)計
矩陣兵棋與戰(zhàn)略推演支持工具
從AlphaGo的60連勝談AI到底有多能搞事情?
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服