近日,在國際人工智能聯(lián)合會(huì)議(IJCAI)上舉辦的第二屆多模態(tài)情感識(shí)別挑戰(zhàn)賽(MER24)中,Soul APP創(chuàng)始人張璐領(lǐng)導(dǎo)的語音技術(shù)團(tuán)隊(duì)(Soul AI)憑借優(yōu)秀的技術(shù)實(shí)力,在SEMI(半監(jiān)督學(xué)習(xí))賽道中脫穎而出,獲得第一名。
MER24由來自清華大學(xué)、中國科學(xué)院自動(dòng)化研究所、帝國理工學(xué)院等高校的多位專家學(xué)者聯(lián)合舉辦,吸引了近百支來自知名高校、科技企業(yè)的隊(duì)伍參賽。MER24共設(shè)置SEMI(半監(jiān)督學(xué)習(xí))、NOISE(噪聲魯棒性)、OV(開放式詞匯情緒識(shí)別)三個(gè)賽道。其中,SEMI賽道因其高難度和實(shí)際應(yīng)用價(jià)值而頗受關(guān)注。Soul語音技術(shù)團(tuán)隊(duì)在此賽道表現(xiàn)出色。
Soul語音技術(shù)團(tuán)隊(duì)?wèi){借平臺(tái)深厚的技術(shù)積累和前瞻性的創(chuàng)新思路,成功克服了半監(jiān)督學(xué)習(xí)中面臨的諸多挑戰(zhàn)。他們不僅提出微調(diào)模型EmoVCLIP,用于適應(yīng)視頻的情感識(shí)別,還創(chuàng)新性地采用了Self-training策略,通過循環(huán)對(duì)無標(biāo)簽數(shù)據(jù)打偽標(biāo)簽與訓(xùn)練模型之間相互迭代的方式,來提升模型的泛化性能。此外,針對(duì)模型不同模態(tài)之間融合存在的競爭效應(yīng)問題,團(tuán)隊(duì)首次在多模態(tài)情感識(shí)別領(lǐng)域使用Modality Dropout,有效提高了模型的情感識(shí)別準(zhǔn)確率。這些創(chuàng)新技術(shù)的應(yīng)用,不僅讓Soul語音技術(shù)團(tuán)隊(duì)贏得了比賽,更為未來AI在社交場景中的應(yīng)用提供了寶貴的技術(shù)借鑒。
作為新型開放式社交平臺(tái),Soul一直致力于通過底層技術(shù)和產(chǎn)品模式的創(chuàng)新,提升用戶的社交體驗(yàn)。在Soul APP創(chuàng)始人張璐團(tuán)隊(duì)的帶領(lǐng)下,Soul于2020年啟動(dòng)AIGC技術(shù)研發(fā),并在智能對(duì)話、圖像生成、語音及音樂生成等AIGC關(guān)鍵技術(shù)領(lǐng)域取得了成果。
值得注意的是,Soul在AI社交領(lǐng)域的探索并未止步于技術(shù)層面。Soul APP創(chuàng)始人張璐團(tuán)隊(duì)深知,在社交領(lǐng)域,AI的“情商”遠(yuǎn)比“智商”更為重要。因此,他們?cè)跇?gòu)建AI模型時(shí),始終注重其擬人化屬性的培養(yǎng),努力讓AI更能理解情緒,為用戶帶來更好的情緒反饋和陪伴感。這種以人為本的設(shè)計(jì)理念,使得Soul的AI社交產(chǎn)品能夠更好地滿足用戶的情感需求,實(shí)現(xiàn)更加有溫度、沉浸、趣味的互動(dòng)交流。如今,Soul不僅構(gòu)建了具備多模態(tài)情感識(shí)別能力的語言大模型Soul X和語音大模型,還推出了“AI茍蛋”“狼人魅影”等功能/產(chǎn)品,讓AI在社交場景中發(fā)揮更加積極的作用。
在Soul APP創(chuàng)始人張璐團(tuán)隊(duì)的領(lǐng)導(dǎo)下,Soul語音技術(shù)團(tuán)隊(duì)獲多模態(tài)情感識(shí)別挑戰(zhàn)賽第一名。這不僅是對(duì)其技術(shù)實(shí)力的有力證明,也是對(duì)“AIGC+社交”發(fā)展方向的堅(jiān)定信念,使得他們更堅(jiān)定地去致力于構(gòu)建情感化、個(gè)性化和生活化的人機(jī)交互新場景,為用戶帶來更加優(yōu)質(zhì)的社交體驗(yàn)。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!