遠傳科技從未停止“造人”的腳步。
除了有“AI虛擬主播”之外,現(xiàn)在連“數(shù)字主持人”也來了,“數(shù)字主持人”到底是什么呢?
遠傳科技的“數(shù)字主持人”是通過語音合成、唇形合成、表情合成以及深度學習等技術,克隆出具備和真人主播一樣播報能力的數(shù)字人。通過語音合成技術和視頻驅動技術,只需要輸入一段文本,它就能在屏幕展現(xiàn)虛擬數(shù)字人形象并進行新聞播報,且唇形動作能與播報聲音實時同步。
或許在不久的未來,你再也分不清視頻中的主持人,究竟是真人還是虛擬人,而這一天正在到來。
一、根源探究:「高逼真」的背后
遠傳科技“數(shù)字主持人”以真人為原型,通過將真人形象數(shù)字化掃描技術,建立超寫實 3D 數(shù)字人建模,多模態(tài)識別及生成、實時面部動作生成及驅動、遷移學習等技術「熔爐」,煉就而成。
從效果上來說,3D AI 合成主播給人的最大印象便是高逼真,它較好的還原了真人的發(fā)膚、表情;同時,靈活性、可塑性更強,擁有的豐富的面部表情動作,嘴部唇動,以及身體的輕微擺動,具備在更廣闊空間使用的潛力。
透過 3D AI 合成主播技術實現(xiàn)過程,我們探究它為何擁有如此逼真的效果。
1.數(shù)字化掃描技術還原真人形象
建立人物模型必須要有海量數(shù)據(jù),遠傳科技數(shù)字化掃描技術通過攝像頭對真人原型的身體各個部位進行全方位「打點」掃描,采集每一處細節(jié),并對其多種形態(tài)的面部表情動作,嘴部唇動,以及身體的輕微擺動進行細致入微地捕捉記錄,還原真人形象。
2.深度學習算法生成3D數(shù)字人模型
遠傳科技算法工程師熟練應用深度學習算法,對算法里的大量參數(shù)進行調(diào)優(yōu),確保生成的3D數(shù)字人模型能夠精確的還原真人在正常說話時候的唇部動作,臉部表情及微動作,對3D數(shù)字人模型進行實時驅動、渲染,使其面部肌肉驅動、表情肢體和語言表達能力達到一個較高的度契合。確保非專業(yè)人士無法分辨出是真人拍攝的視頻還是通過數(shù)字技術合成出來的視頻。
二、核心亮點: AI 驅動、多模態(tài)交互
1.AI 驅動的 3D 數(shù)字人
遠傳科技“數(shù)字主持人”是一種由AI所驅動的虛擬存在,擁有和真人一致的音容、笑貌和言談舉止,擁有表達情感和智慧的能力。仔細觀察你會發(fā)現(xiàn), 3D AI 合成主播是基于 AI 算法實現(xiàn)驅動。
具體來說,3D “數(shù)字主持人”靠 AI 算法實時驅動,輸入一個文本就能輸出一個視頻,往往生成一個 1 分鐘的視頻,僅只需要 1 分鐘,幾乎可以看作實時生成。
2.關鍵技術賦能多模態(tài)交互創(chuàng)新
唇動算法、3D建模技術、深度學習算法、5G通信等關鍵技術探索文本、語音和視覺多模態(tài)交互創(chuàng)新的無限可能。
遠傳科技利用唇動算法分析出數(shù)字人應顯示的口型標記,突破語言交流過程的表情和唇動的無縫鏈接;根據(jù)給定人物形象要求,建立數(shù)字人3D模型,綁定骨骼,創(chuàng)立動作動畫和口型動畫;基于深度學習算法、肢體捕捉技術,將文本、音頻和圖片實時生成數(shù)字人視頻;5G通信技術則讓用戶跟數(shù)字人進行語音視頻互動成為可能,麥克風和攝像頭捕捉用戶的語音和動作,數(shù)字人的后端人工智能算法根據(jù)場景生成對應的數(shù)字人交互動作、表情和語音。
三、未來已來,你準備好了嗎?
遠傳科技“數(shù)字主持人”雖然基于真實的人進行建模,但呈現(xiàn)在人們面前的行為都是完全逼真的,能像真實主播一樣,去笑,去哭,去表達,是被創(chuàng)造出來的一個“數(shù)字人”。
數(shù)字人的未來將會作為主體人的一個副本形式存在于數(shù)字世界中,在未來的數(shù)字世界中我們將無法分辨出真人和數(shù)字人,大量在數(shù)字世界的服務將都會由數(shù)字人來代替,在電話客戶服務、線上產(chǎn)品講解、電商直播甚至線上演唱會等眾多場景都將會有數(shù)字人的角色參與,數(shù)字化終極未來也許就是數(shù)字人的世界。
你準備好接受一個數(shù)字世界了嗎?
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
繼VisionPro之后,蘋果正在籌備VisionPro的“平替版”6月初,蘋果公司發(fā)布了其第一代MR頭顯——VisionPro,產(chǎn)品一經(jīng)發(fā)布,便在科技圈引起熱議。甚至庫克本人在發(fā)布會上表示:“就像Mac讓我們接觸到個人電腦,iPhone讓我們接觸到移動計算一樣,VisionPro將向我們介紹空間計
全球數(shù)字貿(mào)易迅猛發(fā)展下,第三方外貿(mào)支付機構的角色已經(jīng)從支付服務進化為數(shù)字化綜合服務,在資金流通、守護資金安全等方面也根據(jù)廣大企業(yè)時代背景下的新需求需要承擔更多的職責。同時,隨著大數(shù)據(jù)、人工智能等數(shù)字技術對貿(mào)易各經(jīng)濟領域的滲透,對于外貿(mào)支付來說,這也意味著能整合和發(fā)揮自身天然的數(shù)字化能力和資源優(yōu)勢將成
第81屆中國教育裝備展示會于4月21日-23日在江西南昌綠地國際博覽中心如期舉辦。展會上,大朋VR旗下產(chǎn)品在包括萌科科技、東湃科技、矩道網(wǎng)絡在內(nèi)的多家教育培訓內(nèi)容商聯(lián)合展區(qū)之中頻頻亮相,展示內(nèi)容囊括元宇宙教育、消防安全教育、K12現(xiàn)代化教育等諸多領域,吸引了眾多關注。教育領域多面手:元宇宙、安全、K
4月1日下午,上海Razer雷蛇陸家嘴中心店內(nèi),B站百萬粉絲UP“守拙君”與知名游戲UP“沈奕辰”各帶一隊人馬,頭戴大朋VRE4,在虛擬空間你攻我守,酣戰(zhàn)地不亦樂乎......這是大朋VR所舉辦的首屆“E起熱愛”菁英玩家見面會活動的精彩一隅,參與者們所展現(xiàn)出的投入與快樂,正貼合該活動題的主題——熱愛
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。作為主辦方之一,歐美同學基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負責人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點,IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進行答題。裁判委員會副主席杜瑜皓認為,選手最終目標并
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認為與來自全球的參賽者交流是自己學到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實錄(有刪節(jié)):吳林林
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學工程學院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,
昨天新出了一個AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊申請Manus邀請碼了,而且它邀請碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛
蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)