對于很多依然在學校里埋頭苦學的學生來說,谷歌翻譯可能是日常學習中最常見的翻譯工具,但是可能很少有人知道這項服務在昨天已經(jīng)迎來了十歲的生日,而谷歌也Google Research的官方博客中隆重介紹了未來的神經(jīng)網(wǎng)絡機器翻譯系統(tǒng)。
在十年前谷歌試用的是“基于短語的機器學習系統(tǒng)(PBMT,Phrase-Based Machine Translation)”,這個很多人都有體驗,在試用中英互譯的時候,翻譯往往跳出了對話的邏輯和上下文的聯(lián)系,很明顯翻譯的重點在于字詞與字詞之間的對應。
谷歌在博文中表示他們在幾年前開始嘗試利用“循環(huán)神經(jīng)網(wǎng)絡(RNNs,Recurrent Neural Networks)”建立輸入語言和輸出語言之間的映射。早期的PBMT往往將輸入語言分裂為若干單詞和短語再單獨翻譯,因此我們早期如果將作業(yè)和論文利用谷歌翻譯會看到極為碎片而分裂的結(jié)果,而神經(jīng)機器翻譯系統(tǒng)則更智能地將翻單位進化為句子,也就是一句一句完整的翻譯。自此谷歌的研究人員便在神經(jīng)網(wǎng)絡翻譯系統(tǒng)上加大投入,通過下圖的示意圖我們可以看到谷歌神經(jīng)機器翻譯系統(tǒng)如何將一句中文翻譯為英文。
谷歌表示在多個樣本的翻譯測試中神經(jīng)落網(wǎng)機器翻譯系統(tǒng)減少了55%-85%甚至更多,通過下面的翻譯樣本對比我們可以看到最早期,也就是基于短語的翻譯系統(tǒng)一如既往的分裂和碎片化,而谷歌神經(jīng)網(wǎng)絡機器翻譯系統(tǒng)雖然和人工翻譯效果雖然尚有差距,但是基本的邏輯已經(jīng)正確采集。
其實谷歌現(xiàn)有的網(wǎng)頁版和移動版的中英翻譯系統(tǒng)已經(jīng)完全使用神經(jīng)網(wǎng)絡機器翻譯系統(tǒng),每天的翻譯量為1800萬條,這看上去確實是一個不小的量。我們特意對比了谷歌翻譯和必應翻譯的翻譯結(jié)果,小編隨便打了兩段話,可以看到谷歌和必應對于整段話的邏輯、語義都捕捉的八九不離十,具體的用詞、過度和用法的評價還是交給讀者吧,小編個人更喜歡必應的翻譯(以下對比圖支持點擊放大)。
谷歌中譯英
必應中譯英
谷歌英譯中
必應英譯中
關注微信號expkf01,第一時間獲知精彩活動和原創(chuàng)科技資訊。
聯(lián)系客服