網(wǎng)絡(luò)讓世界變得更小,連接你我他。所面臨的問題是,人們講不同的語言!當(dāng)然,有些人講多門語言,擔(dān)據(jù)我們所知,多數(shù)人,包括讀者的族群,實(shí)際只講一種語言。
值得慶幸的是,谷歌翻譯,消除了這一語言障礙,讓人們更容易溝通。今天,谷歌翻譯宣布神經(jīng)機(jī)器翻譯已成功面市自此谷歌翻譯將有質(zhì)的飛躍。
什么是神經(jīng)機(jī)器翻譯,呢?巴拉克Turovsky,翻譯產(chǎn)品,谷歌解釋如下。
在高級功能上,神經(jīng)系統(tǒng)翻譯是整個(gè)句子,而不是逐詞翻譯的。它使用這個(gè)大背景下,以幫助其找出最相關(guān)的翻譯,然后重新調(diào)整單詞順序更像人類用正確的語法。這樣更容易理解每個(gè)句子,段落和文章翻譯會(huì)更順利、更容易閱讀。端到端學(xué)習(xí)系統(tǒng)建立在神經(jīng)機(jī)器翻譯,這基本上意味著隨著時(shí)間的推移系統(tǒng)學(xué)習(xí)創(chuàng)造更好的,更自然的翻譯。
Turovsky進(jìn)一步說:“今天谷歌神經(jīng)機(jī)器翻譯可以翻譯八種語言,英語和法語,德語,西班牙語,葡萄牙語,中文,日語,韓語和土耳其。這些代表了母語約三分之一的世界人口,覆蓋35%以上的所有谷歌翻譯查詢”。 通過這一次更新,谷歌翻譯一次性提升的性能超過了過去十年進(jìn)步的總和。但這只是一個(gè)開始。盡管我們目前在谷歌搜索、谷歌翻譯應(yīng)用和網(wǎng)站上只有 8 種語言,但我們的目標(biāo)是將神經(jīng)機(jī)器翻譯擴(kuò)展到所有 103 種語言,并讓你能隨時(shí)隨地都能接入到谷歌翻譯。
除此之外,谷歌今天還宣布了提供機(jī)器學(xué)習(xí) API 的公共云服務(wù) Google Cloud Platform,「能讓任何人都輕松地使用我們的機(jī)器學(xué)習(xí)技術(shù)」。今天,Google Cloud Platform 也使神經(jīng)機(jī)器翻譯背后的系統(tǒng)向谷歌的企業(yè)用戶開放了——谷歌提供了 Cloud Translation API:https://cloud.google.com/translate/
我們提出了一種使用單個(gè)神經(jīng)機(jī)器翻譯(NMT)模型在多種語言之間進(jìn)行翻譯的簡潔優(yōu)雅的解決方案。我們的解決方案不需要對我們的基礎(chǔ)系統(tǒng)的模型架構(gòu)進(jìn)行修改,而是在輸入句子的一開始引入了一個(gè)人工 token 來確定所需的目標(biāo)語言(required target language)。模型的其它部分(包含了編碼器、解碼器和注意(attention))保持不變,而且可以在所有語言上共享使用。使用一個(gè)共享的詞塊詞匯集(wordpiece vocabulary),我們方法能夠使用單個(gè)模型實(shí)現(xiàn)多語言神經(jīng)機(jī)器翻譯(Multilingual NMT),而不需要增加參數(shù),這比之前提出的 Multilingual NMT 方法簡單多了。我們的方法往往能提升所有相關(guān)語言對的翻譯質(zhì)量,同時(shí)還能保持總的模型參數(shù)恒定。
在 WMT' 14 基準(zhǔn)上,單個(gè)多語言模型在英語→法語翻譯上實(shí)現(xiàn)了與當(dāng)前最佳表現(xiàn)媲美的結(jié)果,并在英語→德語翻譯上實(shí)現(xiàn)了超越當(dāng)前最佳表現(xiàn)的結(jié)果。類似地,單個(gè)多語言模型分別在 WMT'14 和 WMT'15 基準(zhǔn)上實(shí)現(xiàn)了超越當(dāng)前最佳表現(xiàn)的法語→英語和德語→英語翻譯結(jié)果。在用于生產(chǎn)的語料庫上,多達(dá) 12 個(gè)語言對的多語言模型能夠?qū)崿F(xiàn)比許多單獨(dú)的語言對更好的表現(xiàn)。
雖然許多谷歌翻譯是的最受歡迎語言翻譯軟件,但是仍有很長的路要走。正如有些人說的,“不要讓完美的更好”。換句話說,Google神經(jīng)機(jī)器翻譯是值得稱贊的,即使只有一小部分用戶體驗(yàn)到它的好處。
聯(lián)系客服