近日,在百度機器翻譯技術(shù)開放日上,百度技術(shù)委員會聯(lián)席主席、自然語言處理部技術(shù)負責(zé)人吳華博士表示,基于領(lǐng)先的人工智能、神經(jīng)網(wǎng)絡(luò)以及自然語言處理技術(shù),百度早在1年多以前就率先發(fā)布了世界上首個互聯(lián)網(wǎng)NMT系統(tǒng),引領(lǐng)機器翻譯進入神經(jīng)網(wǎng)絡(luò)翻譯時代。
近兩年,神經(jīng)網(wǎng)絡(luò)機器翻譯(Neural Machine Translation, NMT)技術(shù)異軍突起,取得了翻譯質(zhì)量的大幅躍升。隨著其翻譯準(zhǔn)確度的提升,在文化全球化的時代背景推動下,高度成熟的翻譯技術(shù)或?qū)㈤_啟第二次全球化的浪潮。
而究竟是否達成推動,那么我們就需要來觀察一下,到底NMT技術(shù)發(fā)展到了何種階段,應(yīng)用到了何種階段,以及當(dāng)前的全球化時代背景又是怎樣?
一,NMT神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)到底是什么
1)機器翻譯的前4個階段
1947年計算機誕生以來,學(xué)界就開始嘗試?yán)糜嬎銠C進行機器翻譯,而從1947年到1991年這期間,機器翻譯并沒有太大的進展,原因在于整個學(xué)界是讓機器在模擬人類翻譯的過程,這也和計算機發(fā)展歷史的必然性有關(guān),這一階段沒有數(shù)據(jù),更沒有互聯(lián)網(wǎng),因此只能停留于算法迭代階段止步不前。
此后隨著互聯(lián)網(wǎng)的發(fā)展,各種在線大數(shù)據(jù)的增加,1991年基于數(shù)據(jù)的統(tǒng)計機器翻譯,讓機器翻譯的準(zhǔn)確度大幅度提升。
2)NMT成當(dāng)前主流
隨著深度學(xué)習(xí)的崛起,其被廣泛應(yīng)用到了各個數(shù)據(jù)挖掘領(lǐng)域,其運行原理是讓機器自動從更大規(guī)模的語言資料中學(xué)習(xí)規(guī)則,而非直接利用給定規(guī)則。2014年學(xué)界也開始提出將深度學(xué)習(xí)應(yīng)用于機器翻譯,創(chuàng)造出神經(jīng)網(wǎng)絡(luò)機器翻譯(NMT)系統(tǒng)。
神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)從2014年9月提出,到百度2015年5月上線首個互聯(lián)網(wǎng)NMT系統(tǒng),只用了短短8個月時間。2015年百度翻譯正式上線NMT系統(tǒng),成為世界范圍內(nèi)第一個真正實用的NMT系統(tǒng)。而谷歌在2016年9月才發(fā)布第一款NMT翻譯系統(tǒng),比百度晚了整整兩年。
二,NMT翻譯已有大量應(yīng)用
各大巨頭開始緊盯NMT翻譯技術(shù),則正是說明了隨著機器翻譯準(zhǔn)確率的大幅度上升,機器翻譯將有廣闊的商業(yè)前景,擺脫此前只存在于大學(xué)實驗室的研究狀態(tài)。
而百度,谷歌等公司早就開啟了實際的應(yīng)用,以百度為例,目前的百度翻譯支持全球28種語言互譯,756個翻譯方向,每日響應(yīng)過億次的翻譯請求,而這一切的原因在于實際應(yīng)用。
1)應(yīng)用于學(xué)習(xí)
很多中學(xué)生以及大學(xué)生都會通過百度網(wǎng)頁翻譯、APP對不懂的詞匯進行翻譯學(xué)習(xí),對于生詞,不僅能查到讀音、用法,還能看到具體的使用場景和權(quán)威例句。對于不認識的物體,結(jié)合圖像識別進行實物翻譯,給出多種語言的描述,幫助記憶。
2)應(yīng)用于境外游
百度翻譯最具備商業(yè)化的使用場景,依然在境外游市場,結(jié)合百度其他人工智能技術(shù),百度翻譯目前應(yīng)用在如下場景。
首先是圖片技術(shù)+翻譯,當(dāng)用戶無法識別建筑物上的標(biāo)志時,通過拍照就可以讓百度翻譯為其進行精準(zhǔn)的翻譯。而當(dāng)用戶在國外點餐時,通過百度翻譯拍照識別同樣很重要。
其次是語音識別技術(shù)+翻譯,百度翻譯中有個“對話翻譯”功能,可以讓用戶和國外用戶直接實時對話,一旦用戶說完一個語言,機器就會馬上翻譯成另一種語言并語音讀出,實現(xiàn)無障礙交流。
3)中國企業(yè)的全球化賦能
百度翻譯還開放了API接口,助力廣大企業(yè)國際化。目前已有超過2萬個第三方應(yīng)用接入。華為、OPPO、中興、三星等手機廠商,金山詞霸、靈格斯詞霸、敦煌網(wǎng)等眾多產(chǎn)均接入了百度翻譯API。世界知識產(chǎn)權(quán)組織(WIPO)也將百度翻譯API集成到官網(wǎng),供用戶將專利信息翻譯成不同語種查詢。對于這些企業(yè)的國際化來說,百度翻譯有著極其重要的作用。
而未來隨著一帶一路戰(zhàn)略的推進,我國還將繼續(xù)鼓勵更多的企業(yè)進行全球化,而翻譯技術(shù)將在未來起到不可或缺的作用。
三,文化全球化時代,NMT翻譯技術(shù)或?qū)㈤_啟第二次全球化浪潮
此前一輪的全球化浪潮主要在于工業(yè)的驅(qū)動,分工的經(jīng)濟帶來了全球經(jīng)濟旺盛的增長,但隨著基礎(chǔ)設(shè)施建立的完成,滿足了溫飽階段之后,文化需求開始增長,各國之間的文化交流也越來越密切。
在娛樂領(lǐng)域,我們看到近期火爆國內(nèi)電影市場電影包括《神奇動物在哪里》、《佩小姐的奇幻城堡》、《你的名字》等等,均來自國外。此外,像各種英劇、美劇、韓劇、二次元動漫也都是網(wǎng)民們非常樂于觀看的節(jié)目,有著極高的受眾。大量觀看影片的網(wǎng)民們,其實早就習(xí)慣了那些充滿英語、韓語、日語的世界,通過大量的觀影,網(wǎng)民們早就消除了對其他國家在文化上的陌生與隔閡感。
與此同時在新聞領(lǐng)域,今年英國脫歐事件、法國恐襲事件、美國川普當(dāng)選事件、韓國樸槿惠閨蜜事件、也在國內(nèi)各大新聞客戶端持續(xù)發(fā)酵,成為網(wǎng)民們熱議的焦點,熱度一點都不遜色于國內(nèi)事件。
所以,現(xiàn)在不僅僅是經(jīng)濟的全球化,而是一個文化正在全球化的時代,國內(nèi)用戶有著與國外用戶交流的渴望,他們也開始越來越關(guān)心國外的文化娛樂、以及新聞事件,并且也越來越希望自己能夠在第一時間獲得國外大事件的信息,甚至是第一時間參與到對方的交流中。
但語言問題卻是繞不過去的障礙因素,而現(xiàn)在基于NMT的翻譯技術(shù)則讓機器翻譯上升到了一個全新的臺階,無論是百度,還是谷歌都在發(fā)力NMT翻譯技術(shù),這對于全球化的交流來說是一件好事。
基于文化逐漸融合的現(xiàn)狀,彼此交流的渴望,未來也一定會出現(xiàn)各個跨國的,滿足各種需求的網(wǎng)站或者APP,例如可以有一個韓劇迷的網(wǎng)站或者APP,同時容納中韓兩國國民,可以由美劇的網(wǎng)站或者APP同時容納中美兩國的國民。本國民眾都只需要輸入自己國家的語言,而通過翻譯技術(shù),在對方國家呈現(xiàn)出對方國家的語言,這一試想并非不可能,基于互聯(lián)網(wǎng)的NMT技術(shù)發(fā)展,這樣的一天或許就在不久后到來。
結(jié)語:
隨著互聯(lián)網(wǎng)的來臨、大數(shù)據(jù)的爆發(fā),機器翻譯技術(shù)也迎來了自身的春天。而同時隨著文化的全球化時代的到來,機器翻譯將會在其中扮演一股不小的力量。
NMT機器翻譯作為當(dāng)前最主流最有效的技術(shù),或?qū)㈤_啟下一次的全球化浪潮。
作者微信公眾號:首席發(fā)言者(shouxifayanzhe)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!