如果你是英語四級或六級的水平,同樣翻幾句話,現(xiàn)在的機(jī)器翻譯有可能比人要翻的好。
被訪者 | 周明(微軟亞洲研究院副院長)
撰文 | 邸利會
想一下未來50年或者100年,您的孫子或者孫子的孫子,是否還會花費(fèi)人生中十幾年甚至幾十年的時(shí)間學(xué)習(xí)一門外語,甚至還學(xué)不好?
當(dāng)然,雇翻譯也可以,可往往花費(fèi)不菲。有這樣一批計(jì)算科學(xué)家、工程師,他們相信可以有別樣法門,那就是用機(jī)器來做翻譯。公平的說,他們已經(jīng)部分取得了成功。
今天訪談的專家,微軟亞洲研究院副院長周明,做機(jī)器翻譯已經(jīng)有30多年,見證了這一領(lǐng)域的面貌變遷。大概去年的這個(gè)時(shí)候,微軟亞洲研究院和微軟雷德蒙研究院合作在通用新聞報(bào)道測試集WMT2017的中英翻譯測試集上,達(dá)到了可與人工翻譯媲美的水平。
在機(jī)器翻譯中,測試集就像是給跳高運(yùn)動員設(shè)置的橫桿,各家機(jī)器翻譯的結(jié)果和這個(gè)標(biāo)準(zhǔn)比較,越接近就意味著越好。
事實(shí)上,機(jī)器翻譯一直是人工智能領(lǐng)域的一大課題。1954年美國喬治亞大學(xué)和IBM公司合作的俄英機(jī)器翻譯,被認(rèn)為是世界上第一個(gè)機(jī)器翻譯實(shí)驗(yàn)。不過,中國早在1956年就把機(jī)器翻譯列入了全國科學(xué)工作發(fā)展規(guī)劃。1957年,中科院語言研究所和計(jì)算技術(shù)研究所開展了俄漢機(jī)器翻譯實(shí)驗(yàn)。
1989年,周明在哈爾濱工業(yè)大學(xué)計(jì)算機(jī)系李生老師指導(dǎo)下讀研時(shí),研發(fā)的CEMT中英翻譯系統(tǒng)通過了當(dāng)時(shí)的航天部的技術(shù)鑒定。當(dāng)時(shí),國內(nèi)有幾家在做英中機(jī)器翻譯的研究,但是做中英機(jī)器翻譯的非常少。CEMT應(yīng)該是中國最早的中英機(jī)器翻譯系統(tǒng),而國外中英機(jī)器翻譯研究也寥若晨星。
那時(shí)的中國正逐步告別封閉,走在改革開放的道路上,人們迫切希望用英中翻譯把浩如煙海的英文文獻(xiàn)翻譯成中文。那個(gè)時(shí)候,周明已經(jīng)意識到,有一天將中文翻譯成英文也同樣重要,于是他選擇了從當(dāng)時(shí)冷門的中英機(jī)器翻譯開始研究。
彼時(shí),沒有互聯(lián)網(wǎng),也沒有什么參考書,周明自己設(shè)計(jì)了這套中英翻譯系統(tǒng)。這也是那個(gè)閉塞年代的無奈——幾乎沒有任何可供參考的文獻(xiàn),能看到的就是通過北京圖書館和有關(guān)部委情報(bào)所得到的一些膠片,大概相當(dāng)于國外六七十年代水平的文獻(xiàn)。
這套可說是世界上第一個(gè)公開發(fā)表的完整的中英翻譯系統(tǒng),背后依據(jù)的是一套完整的規(guī)則體系(比如中文句法分析規(guī)則、中文句法轉(zhuǎn)換成英文句法的轉(zhuǎn)換規(guī)則、英文形態(tài)生成規(guī)則等等)。
這樣的一套系統(tǒng),可以把當(dāng)時(shí)很流行的一本英語學(xué)習(xí)讀物《英語900句》很好的翻譯了出來。之后,這套系統(tǒng)于1990年還獲得了原航天部科技進(jìn)步二等獎。
1991年博士畢業(yè)后,周明進(jìn)入了清華大學(xué)做博士后。在張鈸、黃昌寧兩位教授指導(dǎo)下,從事中文句法分析研究。試圖通過中文句法分析的提高,逐步改進(jìn)中英翻譯。
90年代的中國,與世界的交互逐漸增多。黃昌寧老師把他從國外參加會議帶回的會議文獻(xiàn)整整齊齊地放在一個(gè)書柜里,可見有多愛惜。很多外校的老師和同學(xué)到清華來都要借閱這些文獻(xiàn)。
也正是從黃昌寧老師那里,周明得知國際學(xué)術(shù)界已經(jīng)開始基于統(tǒng)計(jì)模型來構(gòu)建機(jī)器翻譯系統(tǒng)。之后,周明就做了一個(gè)基于統(tǒng)計(jì)的中文句法分析器。
除了中英翻譯系統(tǒng),周明也做過中日翻譯系統(tǒng)。那是他1996至1999年在日本高電社訪問的時(shí)候,當(dāng)時(shí)擔(dān)任中文翻譯室室主任的他領(lǐng)導(dǎo)開發(fā)了名為“J北京”的中日翻譯系統(tǒng),其中J的意思是日語。
這也是一個(gè)基于規(guī)則的翻譯系統(tǒng),利用中日兩種語言的對比分析,對句式進(jìn)行變化,并生成日語的形態(tài)?;谕瑯釉恚髞硪矊?shí)現(xiàn)了日中翻譯。J-北京是日本最為有名的中日翻譯軟件,在市場上獲得了成功,甚至在今天還有出售。
1999年從日本回國后不久,周明加入到剛成立不久的微軟亞洲研究院,在黃昌寧教授領(lǐng)導(dǎo)的自然語言計(jì)算組擔(dān)任研究員。周明一開始做了中日文輸入法、微軟對聯(lián)、基于實(shí)例的機(jī)器翻譯、英語寫作輔助系統(tǒng)等等。到2005年,在時(shí)任副院長洪小文的支持下,他們組開始做統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)。
2012年,在天津舉辦的“21世紀(jì)的計(jì)算”研討會中,周明團(tuán)隊(duì)與語音組的同事合作,將微軟全球首席研究官里克·雷斯特博士的演講由英文實(shí)時(shí)翻譯成中文。這個(gè)工作包括了三個(gè)部分,首先將里克的演講通過語音識別得到文本,然后再通過統(tǒng)計(jì)機(jī)器翻譯將英文文本翻譯成中文,最后通過語音合成模擬里克的發(fā)音特點(diǎn)讀出中文的翻譯。
2015年,人工智能進(jìn)入到神經(jīng)網(wǎng)絡(luò)興起的時(shí)代。先是在圖像領(lǐng)域,繼之是語音識別,研究人員應(yīng)用深度神經(jīng)網(wǎng)絡(luò)都取得了不俗的效果。也就是在那個(gè)時(shí)候,周明他們也開始用深度學(xué)習(xí)來做機(jī)器翻譯。
一開始神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的效果很差,但隨著各個(gè)公司、學(xué)校不斷完善技術(shù),如今,機(jī)器翻譯的水平已經(jīng)在單句級別,如果有充足語料訓(xùn)練的情況下,可達(dá)到和人類平均水平幾乎相仿的水平。
也就是說,如果你是英語四級或六級的水平,同樣翻幾句話,現(xiàn)在的機(jī)器翻譯有可能比人要翻的好。
不過,如今的機(jī)器翻譯需要提高的地方也不少。機(jī)器翻譯進(jìn)化到怎樣的程度了,要面臨的挑戰(zhàn)還有哪些,我們請周明博士一一道來。
《賽先生》:機(jī)器翻譯好像和人工智能的發(fā)展步調(diào)挺一致的?
周明:其實(shí)人工智能剛開始興起的時(shí)候,還沒去做機(jī)器人、自動駕駛,先做的是機(jī)器翻譯實(shí)驗(yàn),全世界都是這樣。
先是1957年的時(shí)候,美國做了一個(gè)簡單的俄英英俄機(jī)器翻譯,因?yàn)槟菚r(shí)候美國最擔(dān)心蘇聯(lián)先登月,擔(dān)心被超越。這個(gè)俄英翻譯是基于六條句法轉(zhuǎn)換規(guī)則,大概有200個(gè)單詞,做完了在小范圍內(nèi)用算成功。當(dāng)時(shí)就引發(fā)了一個(gè)熱潮,大家說人工智能將來肯定超越人類、翻譯也會超越人類,機(jī)器翻譯的投資大幅度增加。
結(jié)果到了1965年前后,大家發(fā)現(xiàn)機(jī)器翻譯水平不行,然后美國語言咨詢委員會又出了一個(gè)報(bào)告說,機(jī)器翻譯還早著呢,尤其是全自動的,還是先去做半自動、人機(jī)交互式的翻譯吧;要先去研究語言學(xué)理論,再回過頭去研究自動翻譯。這個(gè)咨詢報(bào)告一出來,很多對機(jī)器翻譯的投資又下馬了。
所以那時(shí)候就有了機(jī)器翻譯時(shí)代的冬天,其實(shí)相應(yīng)的來講,就是人工智能的冬天。機(jī)器翻譯是一個(gè)開先河的、代表人工智能的研究,當(dāng)時(shí)人工智能很多是跟機(jī)器翻譯有關(guān)的事情。
所以,機(jī)器翻譯一開始是在前頭唱主角,開先河,后面像圖像處理、語音都逐漸做起來了。機(jī)器翻譯界的人后來從他們那里也借鑒了一些方法,其中最有名的借鑒就是統(tǒng)計(jì)機(jī)器翻譯,是從語音識別那里借鑒來的。
現(xiàn)在的深度學(xué)習(xí)的應(yīng)用是先從計(jì)算機(jī)視覺開始,然后語音識別領(lǐng)域開始用,然后再到自然語言處理。
《賽先生》:大家一直詬病深度學(xué)習(xí)的可解釋性,它像一個(gè)黑盒子一樣,無法對評測結(jié)果做出解釋?
周明:神經(jīng)機(jī)器翻譯這塊可解釋性還沒有做的那么好。目前有一些模型試圖來解決這件事,希望一定的程度上看出哪個(gè)詞的表示、全句的表示的問題導(dǎo)致譯文不對?;蛘呓獯a時(shí)哪些參數(shù)不是那么優(yōu)化。
那么,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯中的可解釋,是不是非要去做?這個(gè)問題事實(shí)上是有爭議的。有的人就說,根本沒必要去做,有的人說需要去做。
實(shí)際上,從結(jié)果看,通過大規(guī)模的評測集合可以對系統(tǒng)做優(yōu)化,整體提升編碼和解碼的能力。
《賽先生》:怎樣去判斷翻譯的質(zhì)量,感覺是蠻主觀的一件事?
周明:我們有兩個(gè)方案。一是做自動評測。我們有一個(gè)提前做好的標(biāo)準(zhǔn)的測試集,比如1萬個(gè)句子是人翻譯的結(jié)果。然后把機(jī)器翻譯的結(jié)果跟人翻譯的結(jié)果進(jìn)行比對,相似度越高的,翻譯的就越好。這是一種自動評測的方法。
它的好處是什么呢?每次做完翻譯實(shí)驗(yàn)的時(shí)候,改了一些參數(shù),馬上就可以知道翻譯的水平是高了還是低了。它的不好的地方就是有很多翻譯可能跟標(biāo)準(zhǔn)答案不一樣,但也可能是好的翻譯,可能就反映不出來。但是,多數(shù)情況下,還是可以反映系統(tǒng)性能變化的趨勢的。
第二個(gè)方案是對我們抽樣出的句子,人工看一下翻的好壞。這是盲測,不告訴評測的人,這句話是人翻譯的還是機(jī)器翻譯的。人給一個(gè)句子打分,最后根據(jù)人的打分,對一個(gè)系統(tǒng)的結(jié)果做一個(gè)綜合評分。人的打分有幾個(gè)依據(jù),比如翻譯的準(zhǔn)確度、譯文的流暢度等。
《賽先生》:你們還用到一些其他的方法,如新的聯(lián)合訓(xùn)練和對偶學(xué)習(xí)以便充分利用單語語料,一致性規(guī)范和推敲網(wǎng)絡(luò)改進(jìn)解碼能力。是如何想到這些方法的,是靈感么?
周明:首先是跨組合作的結(jié)晶。機(jī)器學(xué)習(xí)組的同事基于多年的研究提出的對偶學(xué)習(xí)和推敲網(wǎng)絡(luò),加上自然語言組的同事提出的聯(lián)合訓(xùn)練和一致性規(guī)范解碼,恰好優(yōu)勢互補(bǔ)。
我們有時(shí)候很長時(shí)間,翻譯水準(zhǔn)上不去,有些想法是不斷琢磨硬憋出來的。比如把那個(gè)源語言的句子編碼好好改改,一看有點(diǎn)改進(jìn),然后再多想一點(diǎn),或者把目標(biāo)語言的解碼的地方再改一改。或者訓(xùn)練數(shù)據(jù)不夠,能不能想辦法用單語數(shù)據(jù)來補(bǔ)充。
你能夠基本上列一個(gè)你要做實(shí)驗(yàn)的列表,一開始時(shí)也不知道哪一種方法最好,就一個(gè)個(gè)去試,試完了覺得最好的,說不定有些道理,那就拔高,看能不能形成一套整體思路,甚至形成一套理論出來。如果真有道理的話,就繼續(xù)推進(jìn)。通過多年時(shí)間,也積累了很多技巧和經(jīng)驗(yàn)。
《賽先生》:所以結(jié)果復(fù)現(xiàn)不了,這個(gè)是正常的吧?
周明:這也是正常的,但是差距太多說明是有問題的。如果就是差一兩個(gè)點(diǎn),就說明有些小小的技巧或許作者論文里沒寫。
《賽先生》:機(jī)器翻譯發(fā)展到現(xiàn)在,還有哪些挑戰(zhàn)性的問題?
周明:目前的機(jī)器翻譯,首先我要強(qiáng)調(diào)是,第一它是單句對照級的翻譯,就是一句原文,一句譯文。我們翻這一句的時(shí)候不考慮上下文,前面說多少都不考慮,就把當(dāng)前這句話忠實(shí)的翻譯出來。但是人翻譯的時(shí)候是要考慮整個(gè)上下文的。
機(jī)器在對這種篇章建模,然后進(jìn)行編碼解碼翻譯的時(shí)候,目前并沒有很好的手段,就連怎么評測,訓(xùn)練集在哪里都不清楚。所以目前,篇章級的翻譯不行。
同樣,人們在口語翻譯的時(shí)候也要考慮前文的,所以機(jī)器口語翻譯的時(shí)候也不行。比如一個(gè)句子出現(xiàn)了指代、省略,在翻譯的時(shí)候要適當(dāng)?shù)匮a(bǔ)充,人比較容易理解,但機(jī)器就做得不好。這是第二件事情。
此外,機(jī)器對于方言處理的效果也不好。比如中文里有四川話、上海話等。因?yàn)檎Z音識別在處理方言的時(shí)候,處理的不好,所以也影響到后面的機(jī)器翻譯。
就算不是方言,不同的人要用不同的詞來表達(dá)同一個(gè)意思,或者句型也有可能發(fā)生變化,那機(jī)器翻譯,如果訓(xùn)練不足的話,沒有捕捉到這種現(xiàn)象,翻譯的時(shí)候也會出現(xiàn)偏差。
最后,對新詞的捕捉,目前還是比較困難。提前構(gòu)建一個(gè)完善的新詞詞典加進(jìn)系統(tǒng)中,也會帶來分詞和翻譯的誤差?,F(xiàn)場捕捉新詞并且猜測其譯文總是非常難的。相比人類可以很容易理解新詞,機(jī)器還差的很遠(yuǎn)。
《賽先生》:所以,機(jī)器翻譯未來要達(dá)到目標(biāo)是什么?
周明:首先是不同語言之間的自如的口語翻譯。還有實(shí)現(xiàn)對文體的全文級的翻譯。然后實(shí)現(xiàn)個(gè)性化翻譯。
《賽先生》:你們需要跟語音識別的研究者進(jìn)行哪方面的合作?
周明:我們有兩種合作,緊密合作和松散合作。松散合作就是語音識別后的結(jié)果給機(jī)器翻譯,需要對語音識別的結(jié)果做正則化,比如把啰嗦的地方去掉、把沒有標(biāo)點(diǎn)的地方補(bǔ)上標(biāo)點(diǎn),處理重疊詞、缺省詞、顛三倒四等。然后我們再把它翻成目標(biāo)語。語音合成的人拿到我們的譯文,通過語音合成系統(tǒng)輸出語音。語音識別、翻譯、合成三件事串接進(jìn)行。沒有進(jìn)行整體優(yōu)化。
緊密合作就是三家一起緊密合作,互相借鑒,甚至進(jìn)行端對端的訓(xùn)練,提升整體的結(jié)果。
《賽先生》:在什么情況下需要緊密合作?
周明:首先研究資源上很多是可以共享的,比如做語音用的詞表、方言詞典,做語言的也可以用。方法上有很多也是可以借鑒的,比如現(xiàn)在傳統(tǒng)做法是語音識別了形成文字,文字再翻譯,那能不能不形成文字,直接從語音翻譯?這樣可以免掉中間一些環(huán)節(jié)的錯誤蔓延。
比如同聲翻譯的人聽英文,他識別的結(jié)果是中文。那么,機(jī)器能不能模擬這個(gè)過程?這就是我們所說的一種緊密結(jié)合——也許有一天就是語音直接到語音,中文的語音進(jìn)去,英文的語音出來,中間也不一定非要經(jīng)過一個(gè)文字的階段。
《賽先生》:是否可能借鑒人腦的一些機(jī)理?
周明:其實(shí)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯有點(diǎn)像模擬人,它包括了編碼、解碼。人聽了一句話在腦海里形成了一個(gè)印象,存在人腦的某一部位,無非就是時(shí)間、地點(diǎn)、人物、主題等,當(dāng)然怎么存的咱不知道了。但是人要表達(dá)成另外一種語言,是調(diào)動了另一個(gè)機(jī)制,把存的事實(shí)表述出來,這個(gè)在機(jī)器翻譯里就是解碼。
所以,我們通過編碼和解碼的過程試圖模擬人腦翻譯的思維過程。當(dāng)然,我的理解是,機(jī)器是不是真的是這樣運(yùn)作的,我們并不太清楚,我們現(xiàn)在只是體現(xiàn)了一定程度上的模擬。
《賽先生》:現(xiàn)在基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯順延下去就會達(dá)到一個(gè)很高的水準(zhǔn)呢,還是說必須要經(jīng)歷方法上大的變化才有可能?
周明:我覺得神經(jīng)機(jī)器翻譯的紅利兩三年內(nèi)還可以用,包括對一些模型的調(diào)整,編碼、解碼有些地方還可以考慮新的技術(shù)方案。但是未來是不是說永遠(yuǎn)就是神經(jīng)網(wǎng)絡(luò)來徹底解決翻譯的過程?也許中間會出現(xiàn)另外一種新思潮,這個(gè)目前也不知道,所以我們是保持開放的。這正如我們當(dāng)時(shí)做統(tǒng)計(jì)的時(shí)候覺得也很舒服,只要有雙語料就做統(tǒng)計(jì)翻譯了,后來神經(jīng)機(jī)器翻譯一下子就把統(tǒng)計(jì)機(jī)器翻譯贏了。
賽先生
聯(lián)系客服