美女视频下载免费观看,美女视频免费永久观看的网站下载

日前，中國兵棋AI“先知”大勝人類。AlphaGo會下圍棋，但“先知”真正能在戰(zhàn)斗謀劃及災(zāi)害應(yīng)等領(lǐng)域發(fā)揮作用。幕后團隊詳解。

文/記者趙天宇通訊員/劉勇進

編輯/吉菁菁新媒體編輯/房永珍

“既然國際象棋領(lǐng)域能夠誕生深藍，圍棋領(lǐng)域能夠誕生AlphaGo，那么更復(fù)雜更靈活更加不透明的不完全信息博弈對抗，也一定會產(chǎn)生出超越人類最高水平的人工智能體！我們的先知系統(tǒng)，就是在挑戰(zhàn)AlphaGO尚不能完成的工作！”在中科院自動化研究所自動化大廈辦公樓里，中科院自動化所研究員、“CASIA-先知V1.0”（以下簡稱“先知系統(tǒng)”）研發(fā)團隊成員劉禹博士告訴記者，在不完全信息博弈對抗領(lǐng)域，運用人工智能最新成果開發(fā)的數(shù)據(jù)與知識混合驅(qū)動的先知系統(tǒng)，已經(jīng)邁出了堅實的第一步。

今年9月，在石家莊舉行的2017全國首屆兵棋推演大賽上，由中科院自動化所研制的人工智能程序“CASIA-先知V1.0”在“賽諸葛”兵棋推演人機大戰(zhàn)中與全國決賽階段軍隊個人賽4強和地方個人賽4強的8名選手激烈交鋒，并最終以7:1的戰(zhàn)績大勝人類選手，展了人工智能技術(shù)在博弈對抗領(lǐng)域的強大實力。

▲先知研發(fā)團隊成員，中國科學(xué)院自動化研究所研究員劉禹博士

什么是兵棋？博弈對抗領(lǐng)域包括哪些內(nèi)容？運用人工智能的博弈對抗領(lǐng)域，可以為我們的生產(chǎn)生活帶來哪些質(zhì)的改變？近日，北京科技報記者來到了中科院自動化研究所，采訪了先知研發(fā)團隊劉禹研究員，深入了解了兵棋博弈和先知系統(tǒng)研發(fā)背后的故事。

1兵棋是真實戰(zhàn)爭的推演和預(yù)算

子墨子解帶為城，以牒為械，公輸盤九設(shè)攻城之機變，子墨子九距之。公輸盤之攻械盡，子墨子之守圉有余。

這是《墨子·公輸》中的選段，講的正是墨子和魯班之間進行了一次“模擬攻防戰(zhàn)”——墨子解下腰帶，圍作一座城的樣子，用小木片作為守備的器械。魯班多次陳設(shè)攻城用的機巧多變的器械，墨子多次抵拒了他的進攻。魯班攻戰(zhàn)用的器械用盡了，但墨子的守御戰(zhàn)術(shù)還綽綽有余，最終墨子贏得了這場“戰(zhàn)爭”的勝利，也迫使楚懷王放棄了攻打宋國的計劃。

所謂兵棋，指的是模擬戰(zhàn)爭攻防的一種競技博弈。墨子和魯班的模擬攻防戰(zhàn)，就是一場十分完備的兵棋比賽?，F(xiàn)代的兵棋最早起源于歐洲普魯士，發(fā)明最初是為宮廷貴族打發(fā)無聊時間而設(shè)計的“宮廷游戲”，但經(jīng)過百年的發(fā)展，特別是兩次世界大戰(zhàn)的推動，兵棋逐漸從模擬真實戰(zhàn)爭、戰(zhàn)略部署逐漸轉(zhuǎn)向論證設(shè)計武器系統(tǒng)和分析軍事戰(zhàn)略。

▲兵棋推演

由于能夠最真實的模擬戰(zhàn)場環(huán)境，為部隊戰(zhàn)爭進行科學(xué)決策，兵棋推演在現(xiàn)代戰(zhàn)爭中正發(fā)揮著越來越大的作用。據(jù)了解，美國發(fā)動的阿富汗和伊拉克戰(zhàn)爭，此前都通過兵棋進行了多次推演，推演的目的是設(shè)想足夠的情況和預(yù)案，以期最大限度減少傷亡。而推演的結(jié)果與實戰(zhàn)結(jié)果無限接近。

▲由于能夠最真實的模擬戰(zhàn)場環(huán)境，為部隊戰(zhàn)爭進行科學(xué)決策，兵棋推演在現(xiàn)代戰(zhàn)爭中正發(fā)揮著越來越大的作用

“愛玩游戲的人對兵棋一定不會陌生，它和《星際爭霸》《文明》《鋼鐵雄心》甚至早年的《三國志》都屬于博弈對抗類型的游戲?！眲⒂砀嬖V記者，與回合制的圍棋、象棋不同，兵棋最大的特點在于它存在著一套開放的、可以學(xué)習(xí)和研討的規(guī)則——看不清對方的位置，不可知對方的戰(zhàn)術(shù)，甚至用六邊形棋盤可以鋪滿整個地球?！扒?0分鐘連敵人的影子都沒見到，最后5分鐘被‘神兵天降’淘汰”的例子在兵棋中并不少見。

劉禹表示，自動化所研制的先知系統(tǒng)，正是基于兵棋這種挑戰(zhàn)性更高的博弈對抗而設(shè)計開發(fā)的，“和人類相比，這套運用人工智能的系統(tǒng)，能夠更加快速準確的進行態(tài)勢判斷和戰(zhàn)略決策，并最大程度的減少錯誤的發(fā)生?！?/p>

2用人工智能方案輔助決策

劉禹告訴記者，一套完整的兵棋推演比賽，一般分為四個步驟，即態(tài)勢分析、(作戰(zhàn))方案生成、仿真推演和賽后復(fù)盤四個部分。正所謂“內(nèi)行看門道，外行看熱鬧”，雖然普通觀眾更關(guān)注“硝煙彌漫”的戰(zhàn)爭階段，但資深玩家更看重的卻是戰(zhàn)前的態(tài)勢分析以及生成作戰(zhàn)方案的過程，甚至在大型的兵棋推演中，前兩個步驟就會占到整個比賽時間的50%以上。

▲現(xiàn)代兵棋推演19世紀中期就出現(xiàn)了，德國的Kriegsspiele（就是戰(zhàn)爭游戲的意思）是在地圖上進行推演的，這種簡單的方式現(xiàn)在還很流行。一本手冊，一張地圖，若干算子，就可以開始了。不過規(guī)則往往很復(fù)雜，比如移動時就要考慮各種地形、部隊本身屬性（步行單位、車輛單位）、天氣等。很多現(xiàn)代兵棋推演的計算更為復(fù)雜，因此往往通過計算機完成。（圖片來自網(wǎng)絡(luò)）

因此，人工智能在兵棋推演中，主要可以發(fā)揮三個方面作用：一是戰(zhàn)前分析態(tài)勢，科學(xué)的分析敵我雙方的真實實力；二是方案籌劃，綜合考慮多維度信息科學(xué)化制定作戰(zhàn)方案，減少我軍傷亡，加大對敵軍打擊效果；三是提高作戰(zhàn)過程中的實時決策能力，面對突發(fā)情況迅速給出合理的方案。

▲臺灣當局每年都利用兵棋推演平臺進行所謂的“漢光兵棋推演”，模擬解放軍入臺作戰(zhàn)的過程，用以“提升防衛(wèi)作戰(zhàn)效能”，圖為漢光兵棋推演沙盤圖（兵棋臺）。（圖片來自網(wǎng)絡(luò)）

在人機博弈這個領(lǐng)域，近20年來已經(jīng)產(chǎn)生了3個里程碑式的事件：1997年IBM公司的“深藍”擊敗國際象棋大師卡斯帕羅夫，這是基于知識規(guī)則引擎和強大計算機硬件的人工智能系統(tǒng)的勝利；2011年同樣是IBM公司的問答機器人“沃森”在美國智力問答競賽節(jié)目中大勝人類冠軍，這是基于自然語言理解和知識圖譜的人工智能系統(tǒng)的勝利；第三次就是2016年的AlphaGo與李世石的圍棋大戰(zhàn)，AlphaGo最終以4：1的戰(zhàn)績戰(zhàn)勝李世石，這是基于蒙特卡洛樹搜索和深度學(xué)習(xí)的人工智能系統(tǒng)的勝利。

劉禹認為，人工智能成功攻克了國際象棋和圍棋，下一個人機大戰(zhàn)的挑戰(zhàn)，就是不完全信息下的動態(tài)博弈和實時對抗。記者了解到，所謂不完全信息，就是指參與人并不完全清楚有關(guān)博弈對手的信息情報。如果在一場博弈中，參與者同時行動且至少有一個參與者不完全知道其他參與者收益，這種博弈就稱之為不完全信息動態(tài)博弈。象棋、圍棋屬于完全信息博弈，而兵棋、橋牌等就屬于不完全信息博弈。

3從興趣小組到多實驗室合作研發(fā)

今年的政府工作報告和十九大報告中都提到了人工智能，國務(wù)院《新一代人工智能發(fā)展規(guī)劃》明確了我國人工智能的戰(zhàn)略發(fā)展部署。當前，人工智能愈發(fā)火熱?！癆I”對于許多人來說或許還相對陌生，但自動化所在這個領(lǐng)域已經(jīng)與“人工智能”同步歷經(jīng)了60多年的發(fā)展。在AlphaGo之后，自動化所的一批年輕人開始自發(fā)組織興趣群討論，尋找人工智能在博弈領(lǐng)域的新的突破口，挑戰(zhàn)不完全信息動態(tài)博弈難題。

萬事開頭難，先知系統(tǒng)研發(fā)團隊的發(fā)展，也經(jīng)歷了一個從小到大，從無到有的過程。剛開始的時候，大家只是對最新技術(shù)進展進行交流和點評，也存在著一些不同的觀點。去年12月，“人機協(xié)同環(huán)境下不完全信息對抗博弈”命題吸引了大家共同的目光,也引發(fā)出大家共同研發(fā)AI系統(tǒng)的夢想。

▲今年9月舉行的賽諸葛全國兵棋推演大賽上，人工智能在兵棋領(lǐng)域首次戰(zhàn)勝人類，圖為先知研發(fā)團隊部分人員合影

劉禹說，現(xiàn)在自動化所“智能人機對抗團隊”由模式識別國家重點實驗室、復(fù)雜系統(tǒng)管理與控制國家重點實驗室、綜合信息系統(tǒng)研究中心相關(guān)成員組成，整個團隊年輕而富有活力,平均年齡約35歲。在他們中，范國梁研究員來自綜合信息系統(tǒng)研究中心，帶領(lǐng)小分隊主攻兵棋AI系統(tǒng)；來自模式識別國家重點實驗室的興軍亮副研究員則帶領(lǐng)另一路小分隊，重點突擊星際爭霸AI系統(tǒng)。

團隊成立以后，僅用半年時間，就在態(tài)勢感知和作戰(zhàn)決策模塊上采用知識規(guī)則+不確定推理的方式實現(xiàn)了先知1.0程序開發(fā)。劉禹告訴記者，除了賽諸葛全國兵棋推演大賽上取得佳績，在今年9月舉行的2017星際爭霸AI大賽上，來自自動化所的人工智能團隊也獲得了第四名的成績，而來自美國的“重磅”參賽選手Facebook在此次比賽中名列第六。牛刀小試就取得了不錯的成績，讓團隊成員們倍感鼓舞。

自動化所楊一平副所長在兵棋大賽結(jié)束時對團隊成員叮囑，“今天的成績并不是結(jié)束，而是一個新的起點。人工智能系統(tǒng)所展現(xiàn)出的巨大應(yīng)用潛力，以及兵棋推演背后的方法學(xué)和思維方式，才是我們不斷追求的目標!”劉禹表示，先知系統(tǒng)的最終發(fā)展目標是決策與學(xué)習(xí)能力更強、更快的通用人工智能技術(shù)，而這或許將是一個持續(xù)數(shù)年的中長期任務(wù)。

4博弈問題在現(xiàn)實中廣泛存在

實際上，棋類競技中的博弈對抗問題，現(xiàn)實生活中其實廣泛的存在于我們生活中，尤其是博弈問題，廣泛存在于軍事、商業(yè)、安防、災(zāi)害應(yīng)急等領(lǐng)域，大到影響國家戰(zhàn)略，小到?jīng)Q定有限資源下的個人競爭。博弈對抗技術(shù)已經(jīng)成為許多領(lǐng)域的標準分析工具之一，在證券學(xué)、生物學(xué)、國際關(guān)系、政治學(xué)和其他很多學(xué)科都有廣泛的應(yīng)用。

“比如說在防災(zāi)減災(zāi)領(lǐng)域，某個地區(qū)發(fā)生了大面積的洪澇災(zāi)害，救災(zāi)的時候，我們應(yīng)該把食品帳篷先運送到哪個地方去，把部隊和醫(yī)生先往哪里派，這里面都涉及有限資源和不完全信息下的博弈問題。而如果再考慮氣象因素、交通因素、實際效果等諸多參數(shù)的話，就會變成一個非常復(fù)雜的決策問題。隨著人工智能的應(yīng)用與成熟，這些問題將得到極大的改善。”

▲在計算機上顯示的兵棋推演比賽示意圖

劉禹解釋說，人機協(xié)同環(huán)境下不完全信息博弈對抗這個命題可以拆分出三個關(guān)鍵詞，第一是人機協(xié)同，第二是不完全信息，第三是博弈對抗。這三個詞的背后都有大量的關(guān)鍵技術(shù)問題需要突破，也有著非常大的應(yīng)用前景。比如人機協(xié)同，強調(diào)的是不同角色的參與者如何得到AI的輔助；不完全信息，需要在動態(tài)過程中估計和決策，數(shù)據(jù)中大量存在的噪音使得很難訓(xùn)練深度網(wǎng)絡(luò)。因此，先知系統(tǒng)只是邁出了第一步，還不能稱之為“研發(fā)成功”。這一步也只是證明了我們的技術(shù)路線是正確的，還有大量的理論研究和技術(shù)開發(fā)挑戰(zhàn)?！斑@次兵棋推演大賽，唯一戰(zhàn)勝先知系統(tǒng)的是一位地方建筑院校的學(xué)生，他用以守代攻、小火慢熬的戰(zhàn)術(shù)從始至終一直占據(jù)上風(fēng)，這說明我們的系統(tǒng)還有進一步提升的空間。”

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

1兵棋是真實戰(zhàn)爭的推演和預(yù)算

2用人工智能方案輔助決策

3從興趣小組到多實驗室合作研發(fā)

4博弈問題在現(xiàn)實中廣泛存在