隨著AI技術(shù)的跨越式發(fā)展,智能產(chǎn)品逐漸滲透在日常生活的各個領(lǐng)域。不過,智能產(chǎn)品的開發(fā),還是需要建立在AI技術(shù)進(jìn)步的基礎(chǔ)上。而AI技術(shù)的進(jìn)步,則能夠方便智能產(chǎn)品推進(jìn)商業(yè)化。
在語音識別領(lǐng)域,代表語音技術(shù)圈領(lǐng)先水平的INTERSPEECH為促進(jìn)語音識別技術(shù)的進(jìn)步,舉辦了2020屆語音識別挑戰(zhàn)賽。在今年舉辦的INTERSPEECH 2020 DNS挑戰(zhàn)賽中,搜狗以4.01的MOS評分奪得冠軍。
AI降噪技術(shù)取得的喜人成績,讓搜狗在語音識別技術(shù)的商業(yè)化推進(jìn)中有了更足的底氣。在推出S1錄音筆產(chǎn)品中,搜狗就將AI降噪技術(shù)應(yīng)用其中,并獲得了不錯的用戶評價。
不過,同樣身居AI錄音筆市場的科大訊飛也在不斷發(fā)力,和搜狗展開競爭。與此同時,搜狗在AI商業(yè)化方面,也受到來自產(chǎn)品以及商業(yè)模式兩方面的挑戰(zhàn)。而在這場競爭中,搜狗和科大訊飛誰能夠勝出,還有待市場考量。
DNS奪冠,醉翁之意不在酒
作為語音領(lǐng)域尖端組織之一,INTERSPEECH一直代表著國際語音技術(shù)領(lǐng)先水平,并在全球范圍內(nèi)擁有極大影響力。而DNS挑戰(zhàn)作為INTERSPEECH2020的競賽主題之一,其比賽結(jié)果就代表了企業(yè)在業(yè)界的語音識別技術(shù)最高水平。
據(jù)悉,今年舉辦的DNS挑戰(zhàn)主要以MOS評分作為語音技術(shù)評價標(biāo)準(zhǔn),考核內(nèi)容為微軟官方提供的500h數(shù)據(jù)集語音識別。最終,搜狗以4.00的MOS評分超過亞馬遜,奪得RT(實時降噪)技術(shù)賽道桂冠;而在NRT(非實時降噪)賽道,搜狗也已3.90的MOS評分位居第二,成績喜人。
RT、NRT技術(shù)賽道的亮眼成績,也讓致力于AI技術(shù)研發(fā)的搜狗略感欣慰。作為語音賽道早期的入局者,搜狗一直圍繞語音技術(shù)展開產(chǎn)品創(chuàng)新和技術(shù)探索,并憑借著多年積累的優(yōu)勢在業(yè)界居于領(lǐng)先地位,而這次DNS挑戰(zhàn)奪冠,也正是其在語音識別領(lǐng)域多年積累下強勁實力的體現(xiàn)。
除了獲得業(yè)界AI技術(shù)認(rèn)可之外,語音識別賽道取得的亮眼成就,對搜狗AI技術(shù)的商業(yè)化推進(jìn)也有重大意義。搜狗在AI領(lǐng)域多年深耕,研發(fā)投入超過數(shù)億美元,曾讓其面臨了巨大的財務(wù)壓力。而這次AI降噪技術(shù)奪冠,必然對其推進(jìn)AI商業(yè)化進(jìn)程、降低自身財務(wù)壓力大有裨益。
目前智能語音市場,對AI降噪技術(shù)的應(yīng)用還比較有限,僅應(yīng)用在語音通話等簡單場景。在市場技術(shù)應(yīng)用場景有限的情況下,搜狗率先變革創(chuàng)新,將AI降噪技術(shù)應(yīng)用在AI錄音筆上。
趁熱打鐵,力推AI錄音筆
雖然AI降噪技術(shù)奪得冠軍,但這并不是搜狗的最終目的。而搜狗在AI領(lǐng)域持續(xù)投入技術(shù)研發(fā),最終還是要將技術(shù)成果商業(yè)化。
語音識別技術(shù)的商業(yè)化落地,對持續(xù)虧損的搜狗來說刻不容緩。搜狗近日發(fā)布的財報顯示,2020年第二季度共虧損0.085億美元,搜狗解釋主要是搜索引擎、AI技術(shù)持續(xù)研發(fā)的投入所致。研發(fā)的持續(xù)投入,自然讓搜狗承壓,而抓住有限的變現(xiàn)渠道、擺脫虧損境況就成了搜狗必須要做的事。
事實上,搜狗早就在加緊AI技術(shù)的商業(yè)化落地。今年舉辦的“同舟共記”發(fā)布會上,搜狗發(fā)布了最新的S1、E1兩款具有AI降噪功能的錄音筆,并使用了pureVoice人工智能降噪算法、clairVoice8麥陣列算法。通過其領(lǐng)先的AI降噪技術(shù),搜狗的S1、E1錄音筆可以做到過濾4萬余種真實噪音,還能在嘈雜的環(huán)境高度并準(zhǔn)確還原人聲。
憑借著強大的AI降噪技術(shù)實力,搜狗的S1、C1、C1Pro產(chǎn)品受到用戶追捧,首發(fā)8小時就已售出5000臺。而在羅永浩直播中,搜狗的S1錄音筆也有不錯的表現(xiàn)。在吹風(fēng)機的強力干擾下,S1錄音筆也能將現(xiàn)場錄音清晰還原,其強大的語音還原能力受到了老羅和直播間網(wǎng)友的好評。
S1錄音筆取得的亮眼成績,多少對搜狗承受的財務(wù)壓力有所緩解。不過,搜狗的錄音筆雖然有AI降噪技術(shù)的優(yōu)勢,但同時也面臨著變現(xiàn)模式單一、產(chǎn)品同質(zhì)化的問題。
商業(yè)化之殤
搜狗在AI產(chǎn)品商業(yè)化推進(jìn)中,首先遇到的是變現(xiàn)模式單一的難題。
AI技術(shù)高額的研發(fā)投入,始終讓搜狗處于虧損的狀態(tài),而AI降噪技術(shù)的應(yīng)用也僅限于錄音筆產(chǎn)品。這樣的情況下,搜狗為了扭虧為盈,在語音轉(zhuǎn)錄應(yīng)用上開啟了會員收費模式。例如,用戶在知乎平臺爆出搜狗的S1錄音筆,購買后贈送一年會員(198元/年),但在會員時間結(jié)束后,轉(zhuǎn)寫文字功能需要收費才能使用。
和市場上主打轉(zhuǎn)寫功能終身免費的產(chǎn)品相比,搜狗的會員收費模式自然備受用戶詬病。而在眾多產(chǎn)品主打免費轉(zhuǎn)錄的情況下,用戶自然不愿意為搜狗的收費會員買單。
此外,錄音筆市場產(chǎn)品同質(zhì)化的問題也比較嚴(yán)重。例如搜狗的S1產(chǎn)品,和科大訊的SR501錄音筆相比并沒有明顯差異。例如,在外觀結(jié)構(gòu)設(shè)計上,SR501、S1錄音筆都使用了2+6麥克風(fēng)陣列,能在多場景模式下清晰收音;語音識別方面,SR501、S1都支持10種以上語言識別功能,且在中文方言轉(zhuǎn)寫方面勢均力敵。
從這兩款錄音筆功能對比中也不難發(fā)現(xiàn),SR501、S1錄音筆的識別能力、外觀設(shè)計都非常相近。這樣的情況下,搜狗AI降噪技術(shù)領(lǐng)先的光環(huán)就不再明顯,這也意味著搜狗錄音筆將面臨更大的競爭壓力。
戰(zhàn)場升級,勝負(fù)未知
搜狗AI降噪技術(shù)商業(yè)化取得突破后,科大訊飛也入局AI錄音筆市場。雖然入局較晚,但科大訊飛憑借著其在語音識別方面的優(yōu)勢地位,仍在不斷加碼布局,和搜狗展開正面交鋒。
在語音識別技術(shù)方面,作為后起之秀的科大訊飛,其AI語音識別技術(shù)積累也非常深厚,雖然搜狗有領(lǐng)先的AI降噪技術(shù),但仍很難拉開差距;在平臺服務(wù)方面,科大訊飛特有的“平臺+生態(tài)”優(yōu)勢,是搜狗無法企及的。
相比之下,搜狗也難以在和科大訊飛的競爭中取得較大優(yōu)勢,而且科大訊飛仍繼續(xù)在技術(shù)研發(fā)方面加大投入,縮小其與搜狗的AI技術(shù)差距。由此可見,在未來的AI錄音筆市場,科大訊飛將會是搜狗強勁的對手。
不過,在這場AI錄音筆的市場爭奪戰(zhàn)中,搜狗也并非沒有優(yōu)勢。騰訊收購搜狗后,搜狗由于虧損造成的現(xiàn)金流吃緊問題將會得到緩解,AI領(lǐng)域的技術(shù)研發(fā)也能得到騰訊全力的支持。在現(xiàn)金流緊縮問題緩解之后,搜狗的AI語音技術(shù)必然能夠得到進(jìn)一步提升,其商業(yè)化推進(jìn)也能更進(jìn)一步。
但是,騰訊的助力能否讓搜狗以技術(shù)優(yōu)勢領(lǐng)先科大訊飛,還是個未知數(shù)。不過可以預(yù)見的是,在接下來AI錄音筆市場,科大訊飛和搜狗的競爭只會更加激烈。
文/劉曠公眾號,ID:liukuang110
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!