一方面,作為最接近自然交互的形式,全雙工已經(jīng)成為智能語音領(lǐng)域的“香餑餑”,各大AI語音巨頭都在積極布局。
另一方面,車載場景的人機(jī)交互需求也越來越強(qiáng)烈,在手沒有被完全解放的情況下,駕駛員們對更自由、更隨性、更解放的語音交互有著更強(qiáng)烈的需求,全雙工為應(yīng)用“剛需”。
與普通生活場景不同,車載環(huán)境的用戶手動(dòng)操作更加不便捷,而同時(shí)又往往有諸多功能操作(例如關(guān)窗、開空調(diào))、生活服務(wù)(例如導(dǎo)航)、娛樂消遣需求(例如聽歌),多樣化需求更需要更連續(xù)的對話體驗(yàn) ——如果每一個(gè)指令都要喚醒口令,不但用戶體驗(yàn)不佳,從旁觀者看,這種交互方式也頗有些尷尬。
與此同時(shí),有限空間里的司乘對話,多人對話與人機(jī)交互疊加,加上駕駛環(huán)境的嘈雜,無疑對智能語音提出了更嚴(yán)峻的挑戰(zhàn)。
于是,迫切的用戶需求加上龐大的商業(yè)價(jià)值空間,以及車企這些年對產(chǎn)品創(chuàng)新的渴求,在這場全雙工的鏖戰(zhàn)中,車載語音場景不出預(yù)料成了玩家競逐的焦點(diǎn),全雙工+車載的“搭配”迎來廣闊的市場機(jī)會(huì)。例如,不久前的重慶智博會(huì)上,騰訊云小微就聯(lián)合騰訊車聯(lián)展示全雙工語音交互技術(shù),讓用戶對車載語音助手有了更多的好感和期待。
巨頭鏖戰(zhàn)全雙工,也推動(dòng)“第三空間”競逐走向臺前
目前為止,車載+全雙工落地應(yīng)用仍處于初期階段,技術(shù)研發(fā)與應(yīng)用適配同步進(jìn)行中。
1、車載全雙工,巨頭各有玩法姿勢
微軟在2018年3月底宣布“全雙工語音交互感官”已完成產(chǎn)品化落地,“長程語音交互成為可能”,到2019年8月,又宣布全雙工語言交互技術(shù)已經(jīng)通過車載設(shè)備完成測試,已經(jīng)有了幾個(gè)測試合作汽車廠。
微軟的全雙工語音及其車載應(yīng)用是小冰項(xiàng)目的延續(xù), 第七代微軟小冰的重心之一是實(shí)現(xiàn)車載商用,逐步由“玩具”轉(zhuǎn)向現(xiàn)實(shí)價(jià)值,車載無疑是當(dāng)下最恰當(dāng)?shù)倪x擇。
而百度在押寶AI戰(zhàn)略的大方向下,全雙工技術(shù)的推廣十分積極。今年7月,小度助手升級的全雙工語音已經(jīng)在小度在家智能音箱產(chǎn)品上使用,且開放賦能給更多智能硬件終端。
入局語音交互領(lǐng)域較早的科大訊飛,在2019年5月底發(fā)布了智能物聯(lián)網(wǎng)操作系統(tǒng)iFLYOS 2.0,也在多個(gè)領(lǐng)域開始了全雙工交互技術(shù)的應(yīng)用嘗試。
今年8月,重慶智博會(huì)上,騰訊云小微全雙工語音技術(shù)也正式對外展示。依靠騰訊云小微這些年在語音技術(shù)上的深耕,選擇了最為“剛需”的車載場景率先落地全雙工交互技術(shù),試圖從最符合用戶需求的駕駛場景打頭陣,然后進(jìn)行全域拓展。
車聯(lián)網(wǎng)與AI助手的結(jié)合,也是技術(shù)與生態(tài)基礎(chǔ)上的B+C的搭配,非常符合騰訊在ToB轉(zhuǎn)向過程中的一貫調(diào)性。
2、技術(shù)推動(dòng)下,第三空間正由概念走向?qū)嵺`
在很久之前,汽車就被認(rèn)為是家庭、工作之外的“第三空間”,在歐美等汽車文化濃郁的國家,車的第三空間價(jià)值十分明顯。
但在中國,日常出行的屬性仍然占據(jù)大頭,用戶進(jìn)入車內(nèi),聽音樂、導(dǎo)航、調(diào)空調(diào)……在不用重復(fù)喚醒的情況下,很自然完成一套操作……把全雙工放到車載場景中,如果從汽車角度看,本質(zhì)上是“第三空間”的一種強(qiáng)化。
拋開技術(shù),從具體場景實(shí)踐來看,巨頭們在全雙工領(lǐng)域的布局和競爭,也在推動(dòng)“第三空間”競逐走向臺前,誰能讓用戶真正體會(huì)到車上服務(wù)的便利,挖掘這個(gè)空間的用戶價(jià)值,誰就能在車載場景中實(shí)現(xiàn)商業(yè)突圍,這本身也與汽車廠商求新、求變、謀求市場增量的需求相吻合。
第三空間的體驗(yàn)塑造,將面對用戶痛點(diǎn)的“三重區(qū)分”的挑戰(zhàn)
離開汽車視角,從全雙工技術(shù)視角來看,其面臨的首要挑戰(zhàn)在于,如何在連續(xù)對話中還能擁有很高準(zhǔn)確率和響應(yīng)速度。
例如,從已有資料看,騰訊云小微的全雙工語音交互技術(shù),在30秒到90秒的時(shí)間范圍內(nèi)(用戶自行設(shè)定),一次喚醒即可實(shí)現(xiàn)連續(xù)對話,過程中用戶可以隨時(shí)打斷機(jī)器的回答。
而除了全雙工的特殊能力,騰訊云小微可實(shí)現(xiàn)車載復(fù)雜噪聲環(huán)境下喚醒率97%以上,語音識別準(zhǔn)確率96%以上,意圖理解準(zhǔn)確率高達(dá)98%。
這里不去對比這些數(shù)字的優(yōu)劣,畢竟多數(shù)語音助手都能拿出還不錯(cuò)的成績,但它們至少說明 “全雙工”交互下,準(zhǔn)確率仍能保持高水準(zhǔn)。不過,在汽車有限的第三空間里塑造用戶體驗(yàn),語音助手們還有三大硬骨頭要啃——實(shí)現(xiàn)用戶的三種“區(qū)分”需求。
1、在幾何級技術(shù)難度升級的基礎(chǔ)上,區(qū)分“情境”
騰訊云小微稱包括播放音樂、導(dǎo)航、查股票、查天氣等眾多服務(wù)在內(nèi),用戶都可以通過語音指令,跟車機(jī)一次喚醒、連續(xù)應(yīng)答、自然交互,這其中涉及一個(gè)很重要的問題:跨情境的全雙工服務(wù)。
目前的車載語音助手已經(jīng)可以做到在一定場景內(nèi)免喚醒,例如常用的聽音樂,想聽A歌曲又反悔,想聽B歌曲,機(jī)器自動(dòng)識別不需要用戶多次喚醒。
而當(dāng)場景需求延展后,全雙工語音技術(shù)就不得不面臨既要連續(xù)、又要跨情境“思考”的挑戰(zhàn), 而這又幾乎是汽車體驗(yàn)的必須,內(nèi)容、導(dǎo)航、查詢、設(shè)備控制……區(qū)分場景是“全雙工”的必要技能。
很明顯,即便是人的溝通在轉(zhuǎn)換話題時(shí)也需要適應(yīng),機(jī)器在面臨這種情境跨越的全雙工語音時(shí),其難度是乘法級的幾何提升,而非僅僅做疊加而已。
2、在復(fù)雜的對話環(huán)境中,區(qū)分“人”
與歐美不同,在當(dāng)下中國汽車文化中,家庭單位屬于仍然強(qiáng)于個(gè)人單位,“每家都有車”而不是“每人都有車”。很多時(shí)候,車中不只有司機(jī),而肯定有副駕駛等其他乘客。
所謂“第三空間”不只是為司機(jī)服務(wù),也為所有乘客服務(wù)。
對車載全雙工而言,這又帶來一個(gè)特殊的問題,如何讓不同的人有屬于自己的完整體驗(yàn)。 如果把全雙工比作一個(gè)人,與之溝通時(shí),司機(jī)或乘客肯定都希望他與自己的溝通是完整的。
從當(dāng)前的解決方式來看,行業(yè)主要采用多音區(qū)設(shè)置:主駕喚醒之后,都是聽主駕的聲音,副駕的喚醒后,都是聽副駕的語音,理論上,另一個(gè)人要接入全雙工交互,必須重新喚醒,才可以開啟自己的完整對話體驗(yàn)。嚴(yán)格來說,這是通過物理設(shè)置的替代性方案,并非機(jī)器對不同聲音的完全識別,而是通過聲音的來源區(qū)分“人”。行業(yè)內(nèi)也正在發(fā)展的“聲紋識別技術(shù)”,直接辨別不同的用戶,或才是未來更為徹底的解決方案,不過這仍需要等待。
3、在豐富多樣的服務(wù)中,區(qū)分“需求”
智能語音從一開始就是兩條腿走路:前端聽懂用戶說了什么,后端根據(jù)用戶的個(gè)性化需求推薦給不同的內(nèi)容、服務(wù),或者執(zhí)行某些操控指令。
放到車載全雙工這里,其實(shí)問題拓展到了兩個(gè)層面:
怎么聽懂是對機(jī)器說的,而不是對其他人說的(比如人和人聊天),不要誤解用戶的需求;
在確定是對機(jī)器的需求后,如何實(shí)現(xiàn)更為個(gè)性化的服務(wù)輸出,畢竟,如果用戶想吃點(diǎn)喜歡吃的,你隨便導(dǎo)航到了一個(gè)用戶不喜歡的店子,或者甚至用戶想要去放松一下,你給導(dǎo)航到了公司,這樣的連續(xù)交互也就失去了意義。
前者需要語音識別能力的極大加強(qiáng),它還有許多細(xì)節(jié)需要用技術(shù)實(shí)現(xiàn),例如騰訊云小微稱其借助云端大腦,不但能理解用戶的話哪些是需要響應(yīng)的指令,哪些只是用戶對別人說的話,這其中同樣涉及復(fù)雜場景需求問題,懂更多還要區(qū)分是不是需求,挑戰(zhàn)進(jìn)一步升級。
后者,本質(zhì)上可以視為個(gè)性化推薦機(jī)制的延續(xù),考驗(yàn)的語音助手背后的平臺數(shù)據(jù)能力,如何在盡可能短的時(shí)間內(nèi)了解眼前的用戶,為其提供定制化服務(wù),強(qiáng)化全雙工的“實(shí)質(zhì)”支撐,而不是只有花架子。 騰訊云小微打出“懂你所需”的旗號,通過訓(xùn)練后推送定制化服務(wù)內(nèi)容,這是全雙工技術(shù)的行業(yè)必然,只是看誰能更為準(zhǔn)確。
對用戶而言,同樣是自然的交互,如同與人交流一樣,與一個(gè)“懂你所需”的全雙工語音助手交互,就像是熟人聊天,而與無法實(shí)現(xiàn)定制化服務(wù)輸出的機(jī)器交互,就像是在和陌生人聊天, 其體驗(yàn)差距無需多言。
全雙工語音助手趨勢不可避免,車載只是拼圖的一塊
幾乎不會(huì)有人否認(rèn),語音助手是人機(jī)交互必然趨勢。經(jīng)過幾年的發(fā)展,在巨頭們的努力下,越來越高的語音識別準(zhǔn)確率,各平臺飚出的準(zhǔn)確率指標(biāo),本身就證明機(jī)器的“聽見”和“聽懂”已經(jīng)逐步實(shí)現(xiàn),剩下的是不斷完善的過程。
而“智商”問題一旦接近解決,“情商”問題就走向臺前,讓機(jī)器更貼近人,實(shí)現(xiàn)人性化、情感化,是語音助手必然的趨勢。
于是,全雙工等新技術(shù)不斷涌現(xiàn)。幾乎可以肯定的是,在未來,一方面全雙工必然要突破參數(shù)瓶頸,例如沒有30秒、90秒的區(qū)分,而是無限連續(xù)同時(shí)準(zhǔn)確識別需求,就是如科幻片機(jī)器人管家那樣的無縫交互,這是語音助手發(fā)展的必然;另一方面,更多其他的科技將不斷涌現(xiàn),例如多模態(tài)識別,將聲音、圖像、環(huán)境等諸多因素整合來與用戶自然交互。
而顯然,雖然車載急迫需要全雙工等更多自然交互技術(shù),但全雙工并不只會(huì)局限于車載。 幾乎所有巨頭的全雙工技術(shù)的“理想”都是全場景應(yīng)用,即便是騰訊云小微選擇以車載為典型,未來也必將在全領(lǐng)域發(fā)力——到目前為止,在出行領(lǐng)域之外,騰訊云小微憑借全棧AI能力及騰訊豐富的內(nèi)容和服務(wù)生態(tài),在文旅、政務(wù)、教育、智能硬件等多個(gè)領(lǐng)域都有涉獵。
以硬件為例,騰訊云小微AI應(yīng)用解決方案已經(jīng)輸送到機(jī)器人、智能電視、智能音箱、智能空調(diào)等多個(gè)品牌多款產(chǎn)品中,而且百度、科大訊飛、阿里等玩家都在積極布局。
可以說,車載是全雙工最熱的局部戰(zhàn)場,未來的全雙工將是全領(lǐng)域的戰(zhàn)爭,屆時(shí),當(dāng)物聯(lián)網(wǎng)真正全面落地時(shí),汽車這樣的第三空間將融入一個(gè)相互連接、不分彼此的“唯一空間”,車載全雙工與家居、工作全雙工聯(lián)動(dòng),人與虛擬數(shù)字世界將實(shí)現(xiàn)無縫對接。
拭目以待吧。
*此內(nèi)容為【科技向令說】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
【完】曾響鈴
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(huì)(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會(huì)的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會(huì)上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會(huì),市場的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定
美團(tuán)曾經(jīng)的二號人物王慧文對標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時(shí),外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個(gè)曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
蘋果16弄了兩個(gè)版本,一個(gè)是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個(gè)是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點(diǎn)。我們曾經(jīng)熟悉的一切,都開始變得陌生。”計(jì)算機(jī)之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場,而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)
智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)
崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場,BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國內(nèi)大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個(gè)數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會(huì)IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國際會(huì)展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知