「Alexa, add peanut butter and milk to theshopping list and play music」亞馬遜的Alexa 助手是如何執(zhí)行這種復(fù)雜命令。通過一系列復(fù)雜的算法技術(shù)可以實現(xiàn)。在最新一期出版的報紙《實用口語理解的語義解析》和隨之而來的博客文章中,亞馬遜Alexa AI研究部門的科學(xué)家詳細介紹了一個能夠分析句子結(jié)構(gòu)和內(nèi)容的AI語義分析系統(tǒng)。即使該句子的含義和結(jié)構(gòu)有點復(fù)雜或者模棱兩可,該系統(tǒng)依然可以完整的分析句子結(jié)構(gòu)和內(nèi)容。
論文合著者Rahul Goel解釋說,該系統(tǒng)的設(shè)計是得益于兩種機器學(xué)習(xí)技術(shù):transfer learning和copying mechanism。Transferlearning,是指從現(xiàn)有的人工智能系統(tǒng)遷移知識,以減少訓(xùn)練一個新模型需要的大量數(shù)據(jù);Copyingmechanism,是讓模型處理從未見過的字詞。
傳統(tǒng)上,Alexa根據(jù)說話者的意圖(例如播放音樂、歌曲名稱和演唱者姓名)和實體插槽(如Marvin Gaye的《What 's Going On?》)解析請求。但是這種方法需要大量手工注釋,很容易出錯。例如,“addapples and oranges to shopping list” and “play music”這個請求包含兩個主要條款(“add…to shopping list”和“play music”),由“and”這個編碼連接,然后解碼器將該命令解碼成一個數(shù)據(jù)集”(and(addToListIntent(add(ItemName(Apples))(ItemName(Oranges))))(PlayMusicIntent(Mediatype(Music))))”來實現(xiàn)命令。
(圖源:Amazon)但簡單的意圖和插槽標記不適用于像“Alexa, add peanut butter and milk to theshopping list and play music”這樣的請求。處理這樣的具有復(fù)合意圖和插槽值的請求需要一個語義解析器,分析句子的結(jié)構(gòu)和組成部分的含義。
因此Alexa的研究人員不這么做,他們根據(jù)說話者的意圖和實體插槽將所有標記的數(shù)據(jù)轉(zhuǎn)換成多個解析樹,或轉(zhuǎn)換成描述請求語法結(jié)構(gòu)的決策樹。該團隊的語義分析器通過對輸入流一系列移位和減少操作進一步構(gòu)建這些樹,其中“移位”是指移動到輸入流中的下一個單詞,“減少”是指確定該詞在樹中的最終位置。一直以來,注意力機制跟蹤解析器的任務(wù)就是檢查得到的數(shù)據(jù),并確定是使用內(nèi)部詞典中的單詞,還是復(fù)制輸入流中的單詞。
The semantic parse tree of the instruction "add apples andoranges to shopping list and play music"
研究人員報告說,在使用Alexa交互提供的自然語言理解(NLU)數(shù)據(jù)進行的測試中,僅使用復(fù)制機制就能將整體模型的平均正確率提升61%,而加上遷移學(xué)習(xí)能夠再提升6.4%。在另一組獨立的問答測試中,說話者使用了兩個公共數(shù)據(jù)集(比如“你可以在外面的哪家餐館吃飯?”或者“科比在2004年搶斷了多少次?”),測試結(jié)果顯示遷移學(xué)習(xí)將模型的表現(xiàn)提升了10.8%。。
“我們的語義分析器在自然語言理解和問答任務(wù)上都提高了性能,這一事實表明,它有望成為一種表示意義的通用技術(shù),也可以用于其他應(yīng)用,”Rahul Goel寫道。
這項研究計劃于6月在路易斯安那州新奧爾良舉行的計算語言學(xué)協(xié)會北美分會第16屆年會上發(fā)表。
(圖源:Amazon)博文鏈接:
https://developer.amazon.com/zh/blogs/alexa/post/ce2e3e1c-5f21-4c53-b274-59de34cd4015/alexa-turn-down-the-lights-and-play-music-the-science-of-handling-compound-requests
論文: “Practical Semantic Parsing for Spoken Language Understanding”
論文鏈接:https://arxiv.org/pdf/1903.04521.pdf
學(xué)術(shù)頭條已建立微信交流群,群內(nèi)會有講座直播和學(xué)習(xí)資源分享,歡迎各位加學(xué)術(shù)君微信AMiner308,獲取更多資源。記得備注:名字+單位/學(xué)校噢~
分享干貨
聯(lián)系客服