1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

搜狗擊敗訊飛阿里,獲IWSLT國際口語機(jī)器翻譯評測大賽冠軍

 2018-10-31 10:40  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

近日,在剛剛落幕的IWSLT(International Workshop on Spoken Language Translation)國際頂級口語機(jī)器翻譯評測大賽上,搜狗擊敗訊飛、阿里巴巴, APPTEK(美國應(yīng)用科技公司)、AFRL(美國空軍研究實驗室)以及KIT(德國卡爾斯魯厄理工學(xué)院)等國際國內(nèi)多個強(qiáng)勁對手,一舉奪得了2018年IWSLT大賽Baseline Model(基線模型)賽道冠軍,代表中國向世界彰顯了AI領(lǐng)域的技術(shù)硬實力!

表1 IWSLT大賽Baseline Model賽道最終結(jié)果

--取自IWSLT官方公布結(jié):https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

這是搜狗繼WMT 2017機(jī)器翻譯頂級評測大賽奪冠之后,所摘得的又一翻譯領(lǐng)域的技術(shù)桂冠。短期內(nèi)連續(xù)登頂世界第一的位置,充分證明了搜狗在翻譯行業(yè)特別是口語翻譯領(lǐng)域已位居領(lǐng)先地位。

IWSLT是什么比賽?

IWSLT是國際最具影響力的口語機(jī)器翻譯評測比賽,從2004年開始已經(jīng)舉辦了15屆。每屆比賽都吸引了世界各地機(jī)器翻譯領(lǐng)域的知名企業(yè)和研究機(jī)構(gòu)參與,本屆比賽吸引了訊飛、阿里巴巴等國內(nèi)公司,愛爾蘭ADAPT中心,美國約翰霍普金斯大學(xué),德國卡爾斯魯厄理工學(xué)院,芬蘭赫爾辛基大學(xué),英國愛丁堡大學(xué),美國AppTek公司等多家國際知名大學(xué)、研究機(jī)構(gòu)和公司參加。

表2 IWSLT2018大賽參賽情況

--取自IWSLT官方公布結(jié)果:

:https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

本屆IWSLT 2018的口語機(jī)器翻譯任務(wù)主要評測基于指定數(shù)據(jù)集從英語到德語的語音翻譯能力,共分為Baseline Model(基線模型賽道)和End-to-End(端到端賽道)兩個賽道,其中Baseline Model賽道主要評測語音翻譯的流水線方案,輸入語音先通過語音識別系統(tǒng)得到語音識別結(jié)果,之后將結(jié)果送入機(jī)器翻譯系統(tǒng)獲得譯文,這也是業(yè)內(nèi)最主流、效果最好的語音翻譯解決方案,市場上商用機(jī)器同傳、翻譯機(jī)等語音翻譯類產(chǎn)品幾乎都采用了類似的方法;End-to-End則是本次評測新增設(shè)的賽道,主要鼓勵參賽方探索基于神經(jīng)網(wǎng)絡(luò)的端到端語音翻譯解決方案,希望能夠輸入語音,基于深度神經(jīng)網(wǎng)絡(luò)模型直接輸出譯文,這種方法目前仍處于早期研究階段,受制于語音-文本平行語料難以大規(guī)模采集、算法研究不成熟等因素的限制,距離商用仍存在較大距離。本次評測中,在訓(xùn)練集、測試集相同的情況下,Baseline Model賽道最好的系統(tǒng)取得了28.09的BLEU(機(jī)器翻譯質(zhì)量評價指標(biāo),值越大代表翻譯質(zhì)量越好),而End-to-End賽道最好的系統(tǒng)僅取得了19.4的BLEU,較Baseline Model賽道相差8.69個BLEU,差距非常明顯,也證明了Baseline Model賽道評測的算法仍是目前最可行和實用的解決方案。

搜狗本次參加的是Baseline Model賽道的評測,并取得了第一名的好成績。評測任務(wù)面向TED演講和大會學(xué)術(shù)報告場景,測試集包括來自英國、歐洲、印度等各個國家的英語演講者,存在噪聲、口音、自由表達(dá)等復(fù)雜語音現(xiàn)象,同時語言中存在大量領(lǐng)域?qū)S忻~和口語化的表達(dá)(如:大量語氣詞、錯誤語法表達(dá)等),具有極強(qiáng)的實戰(zhàn)意義和挑戰(zhàn)性。最終,搜狗提交的系統(tǒng)BLEU值達(dá)到28.09,領(lǐng)先排名第二的科大訊飛1.6個BLEU,證明了搜狗在口語機(jī)器翻譯領(lǐng)域強(qiáng)大的實力。

AI賽道中持續(xù)發(fā)力,搜狗領(lǐng)跑語音翻譯行業(yè)

搜狗的AI戰(zhàn)略藍(lán)圖之中,語言是最核心的重頭戲。一直以來,搜狗都堅持著“自然交互+知識計算”的人工智能核心方向,并持續(xù)深耕技術(shù),推動技術(shù)向產(chǎn)品的快速轉(zhuǎn)化,2016年,搜狗發(fā)布了自有人機(jī)交互解決方案-知音引擎。擁有充足真實語料數(shù)據(jù)優(yōu)勢的搜狗,將語音識別與機(jī)器翻譯技術(shù)相結(jié)合,并在2016年推出了全球首款商用AI同傳系統(tǒng)-搜狗同傳,引領(lǐng)了語音翻譯技術(shù)的普及與應(yīng)用。通過數(shù)百場的國際會議“實戰(zhàn)”,搜狗同傳獲得了無數(shù)媒體和觀眾的好評,成為當(dāng)下炙手可熱的“AI字幕君”。

與此同時,搜狗也推出了一系列的智能硬件,將語音翻譯技術(shù)應(yīng)用到了更廣闊的場景之中,幫助用戶打破了跨國交流時的語言困境。2018年3月,搜狗推出了搜狗旅行翻譯寶,具備離線翻譯功能與拍照翻譯功能,讓馬化騰都為之心動,在朋友圈里大打廣告。作為首款智能翻譯硬件,它支持42種語言對話翻譯,解決了旅游場景中用戶聽不懂、看不懂、不會說等真實痛點。該項產(chǎn)品在京東平臺首發(fā)當(dāng)日即告售罄,首日銷售額破千萬。與此同時,搜狗還推出了錄音翻譯筆,提供錄音轉(zhuǎn)寫、對話翻譯、同聲傳譯等功能,把AI同傳落地到了消費級產(chǎn)品之中,開拓了語音翻譯的新航道。

眾所周知,人工智能是未來科技的風(fēng)向標(biāo)。通過這次在IWSLT比賽中的優(yōu)秀成績,可以看到以搜狗為代表的國產(chǎn)科技巨頭企業(yè),已表現(xiàn)出了引領(lǐng)行業(yè)的技術(shù)硬實力。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
搜狗翻譯
ai技術(shù)

相關(guān)文章

  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊

    標(biāo)簽:
    ai技術(shù)
  • 用友大易:邁入AI招聘2.0時代,讓人力資源回歸本質(zhì)

    這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓(xùn)練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特

    標(biāo)簽:
    ai技術(shù)
  • 新發(fā)布的PaaS2.0,能否助力涂鴉智能再起飛?

    文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定

    標(biāo)簽:
    ai技術(shù)
  • 大模型難掩AI制藥的悲傷:越過山丘,無人等候

    美團(tuán)曾經(jīng)的二號人物王慧文對標(biāo)OpenAI的創(chuàng)業(yè)項目光年之外,以20億賣給美團(tuán),再度引發(fā)市場對大模型的熱議。

    標(biāo)簽:
    ai技術(shù)
  • 拾起王慧文的AI夢,美團(tuán)沖向“光年之外”?

    2020年底,王慧文在朋友圈寫下這句話時,外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。

    標(biāo)簽:
    ai技術(shù)
  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

    標(biāo)簽:
    蘋果AI
    百度AI
    庫克
  • AI加速時代的“進(jìn)度條”,我們撥動了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C(jī)之父約翰·馮·諾依曼曾這樣說到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場”與“算法進(jìn)化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達(dá)股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機(jī)器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會,反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會火爆程度便可知

編輯推薦