百度技術(shù)學(xué)院(bit.baidu.com)人工智能技術(shù)課程,首期中文自然語言處理課程之后,這次讓我們把目光投向更廣闊的時(shí)空,自然語言處理第二課——機(jī)器翻譯,人工智能的終極目標(biāo)之一。
如何在3個(gè)月內(nèi)學(xué)會一門外語?這里給大家分享一些經(jīng)驗(yàn):
1、購買一套個(gè)人經(jīng)濟(jì)能力范圍內(nèi),可以買到最貴的語言課程。
2、制定具體可行的長、短期計(jì)劃,目標(biāo)必須是可以考量的。
3、兩周之后,大膽走上街去,尋找與外國人對話的機(jī)會。
4、在失敗的淚水中接受現(xiàn)實(shí)。
好啦開個(gè)玩笑,學(xué)習(xí)外語就是為了交流溝通嘛,其實(shí)借助“機(jī)器翻譯”這個(gè)“人肉外掛”,學(xué)外語的壓力就會小很多啦。本期咱們就來重點(diǎn)說說百度機(jī)器翻譯的應(yīng)用、平臺和技術(shù)。
機(jī)器翻譯
破解羅塞塔石碑
“機(jī)器翻譯”都能干啥,故事要從一塊古埃及石碑說起……
請看:
如果你是一位考古學(xué)家,今天你從土里挖出了一塊古埃及石碑,上面刻滿了文字待你破解,你知道上面有三種文字,也知道其中的兩種文字(古埃及象形文字和古埃及通俗體)都早已失傳。這時(shí)候你是選擇去尋找文字傳人還是……再次在失敗的淚水中接受現(xiàn)實(shí)?
機(jī)智的考古學(xué)家們利用唯一勉強(qiáng)認(rèn)識的古希臘文字,了解了石碑上記述的故事,還順便比對著打開了破譯古埃及文字的大門。在這里,考古學(xué)家就應(yīng)用到了機(jī)器翻譯,即利用計(jì)算機(jī),將一種自然語言(比如古埃及象形文字)翻譯為另外一種自然語言(比如這里的希臘語)。
當(dāng)然你成為考古學(xué)家的幾率也不高,對于普通人來說,有了機(jī)器翻譯,咱就可以跟外國賣家討價(jià)還價(jià)了,出國旅游也不用再啞口無言自創(chuàng)“手語”。以及……說不定可以順便跨國解決一下單身問題……
有了“機(jī)器翻譯”這個(gè)現(xiàn)代“巴別塔”,就能第一時(shí)間獲取前沿英文資料啦:
看著費(fèi)勁?機(jī)器翻譯能幫你讀懂
找對象時(shí)可以跟歪果仁發(fā)展發(fā)展、買買買的狂歡節(jié)也不僅僅局限在“雙十一”,可以說是居家旅行必備良品了!
機(jī)器翻譯+語音識別
=語音翻譯
入住酒店的時(shí)候,拿出搭載機(jī)器翻譯等技術(shù)的翻譯機(jī),就可以和前臺細(xì)致地聊聊自己的入住需求。
百度 WiFi 共享翻譯器
機(jī)器翻譯+圖像識別
=拍照翻譯
在國外商超買買買的時(shí)候,瓶瓶罐罐上遇到不認(rèn)識的字,用手機(jī)百度或者百度翻譯拍張照片,涂抹一下,就能獲取中文翻譯。
機(jī)器翻譯+神經(jīng)網(wǎng)絡(luò)
=為你寫詩
你以為機(jī)器翻譯就只會“翻譯”嗎?它還會“寫詩”?;谏疃壬窠?jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù),得到命題詩的首句之后可以模仿著順勢寫出第二、第三、第四句??纯聪旅孢@兩首詩,你能分辨出哪首是機(jī)器翻譯的作品嗎?歡迎留言區(qū)里搶答一下~
機(jī)器翻譯是怎么做到的?
作為人工智能的終極目標(biāo)之一,機(jī)器翻譯綜合了計(jì)算機(jī)、認(rèn)知科學(xué)、信息論、語言學(xué)等多門學(xué)科。
機(jī)器翻譯的發(fā)展歷史最早可以追溯到上世紀(jì)四十年代,第一臺計(jì)算機(jī) ENIAC 誕生以來,科學(xué)家們就在嘗試用計(jì)算機(jī)來實(shí)現(xiàn)語言文字之間的“換算”。與神經(jīng)網(wǎng)絡(luò)的結(jié)合,讓機(jī)器翻譯變得不那么“機(jī)械”。
2015年,百度推出世界上第一個(gè)神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)。
機(jī)器翻譯也要
“深挖洞,廣積糧”
互聯(lián)網(wǎng)出現(xiàn)以后,數(shù)據(jù)信息以前所未有的速度增長。機(jī)器翻譯的研發(fā)困難不再是數(shù)據(jù)缺乏,而是信息量太大。
面對千萬億級別的網(wǎng)頁預(yù)料、權(quán)威詞條、網(wǎng)絡(luò)熱詞,機(jī)器翻譯需要利用大數(shù)據(jù)挖掘和新詞偵測等手段,建立起了高質(zhì)量的翻譯知識庫。
多策略融合的翻譯系統(tǒng)
單獨(dú)的一門語言都已經(jīng)可以稱得上博大精深,全球各種語言之間的互譯可以說是極其困難。正所謂“眾人拾柴火焰高”,多策略融合的翻譯系統(tǒng)成為必然選擇。
┇統(tǒng)計(jì)機(jī)器翻譯
統(tǒng)計(jì)機(jī)器翻譯大概類似我們初學(xué)英語時(shí)候的狀態(tài),在不能理解整句話的意思的時(shí)候,只要知道句子里每個(gè)字詞的意思,就能“推導(dǎo)”出來。就像“拼圖”一樣,用已知的一字一詞拼湊出一句完整的話來。
┇基于樞軸語言的翻譯方法
這個(gè)翻譯方法類似一種“橋梁”,比如漢語和泰語之間的互譯缺乏資料,我們就可以利用英語來做“橋梁”,繞一個(gè)遠(yuǎn)路,結(jié)合中英互譯和英泰互譯,最終達(dá)成“中泰”之間的連接。
┇神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)
前面提到的翻譯方法,就像是用刀把句子進(jìn)行了切分、重組,而神經(jīng)網(wǎng)絡(luò)更加“走心”,利用計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)技術(shù),模仿神經(jīng)元進(jìn)行語言翻譯,做到真正像人一樣“讀懂”自然語言。它擁有更高層次的“全局觀”,可以對句子進(jìn)行完整編譯,很好地避免了“盲人摸象”的尷尬。
聯(lián)系客服