當(dāng)前位置:首頁(yè) >  科技 >  互聯(lián)網(wǎng) >  正文

互聯(lián)網(wǎng)公司投入大模型的原動(dòng)力:反哺自己的「根據(jù)地」

 2023-04-26 09:46  來源: A5專欄   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

文 / 六金

出品 / 節(jié)點(diǎn)商業(yè)組

大模型熱度遲遲不退,有能力的企業(yè)紛紛搶占生態(tài)位。百度、阿里、華為、商湯、科大訊飛、360等大型互聯(lián)網(wǎng)公司,都已經(jīng)在國(guó)內(nèi)展開了“諸神之戰(zhàn)”。

在媒體報(bào)道中,參與了大模型競(jìng)技的公司幾乎都是大公司。這是因?yàn)橥度氪竽P?,最直觀的需求就是“錢”。大廠能成為“開卷”的主力軍,主要是因?yàn)榇竽P偷拈_發(fā)訓(xùn)練,資金、技術(shù)門檻都很高,并非創(chuàng)業(yè)者以及小公司可以輕松吃下的蛋糕。

例如國(guó)盛證券的一份研報(bào)顯示,GPT-3訓(xùn)練一次的成本約為140萬(wàn)美元,對(duì)于一些更大的LLM模型,訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。這一成本于全球科技大企業(yè)而言并不便宜,但也在可接受范圍內(nèi)。

將大模型的投入“坦誠(chéng)相告”

由于“貴”,投身大模型的很多企業(yè)其實(shí)都沒告訴投資者們,自己花了多少錢,估計(jì)也是怕投資者看到后會(huì)產(chǎn)生認(rèn)知偏差。

最近科大訊飛發(fā)了財(cái)報(bào),倒是對(duì)這一點(diǎn)很坦誠(chéng),2023年一季度科大訊飛的利潤(rùn)轉(zhuǎn)虧,其管理層明確表示,除了一些去年遺留的特殊問題外,是因?yàn)楣驹?022年12月15日啟動(dòng)了“1+N認(rèn)知智能大模型”的專項(xiàng)攻關(guān),將于2023年5月6日正式發(fā)布訊飛星火大模型,攻關(guān)項(xiàng)目的新增投入一定程度上影響了當(dāng)期利潤(rùn)。

科大訊飛的掌門人劉慶峰說得很明白:“針對(duì)大模型的技術(shù)投入,我們?cè)撏兜耐?、絕不手軟。”所以在行業(yè)內(nèi),大家不妨都坦誠(chéng)點(diǎn),畢竟大模型已經(jīng)成為了“陽(yáng)謀”,花錢投入也是為收獲果實(shí)打基礎(chǔ)。當(dāng)年馬斯克不就是嫌再次投資OpenAI太貴,后來又想去“摘桃子”被拒之門外了嗎?

除了“投錢”以外,大模型還需要“投人”,在這一點(diǎn)上,國(guó)內(nèi)外廠商的爭(zhēng)搶都很激烈。“谷歌大腦”的大模型人才,從去年底到今年被OpenAI挖走了好幾個(gè);節(jié)點(diǎn)財(cái)經(jīng)也聽說,某一線大廠開價(jià)140萬(wàn)美元年薪,挖腳OpenAI的員工。在國(guó)內(nèi),有公司廣發(fā)英雄帖,把公司的大部分股權(quán)拿出來獎(jiǎng)勵(lì)研發(fā)人才。

但是有NLP領(lǐng)域的專家對(duì)節(jié)點(diǎn)財(cái)經(jīng)表示,做大模型這樣的前沿核心技術(shù)研發(fā)還不能只靠高薪挖人才,更要考慮團(tuán)隊(duì)適配程度。

該人士舉例,研發(fā)大模型是為了落地在業(yè)務(wù)上,技術(shù)團(tuán)隊(duì)?wèi)?yīng)該充分了解業(yè)務(wù)特性。具體到業(yè)務(wù)場(chǎng)景,訴求存在著不小的差異,大模型的作用是實(shí)時(shí)掌握這些需求,并對(duì)此作出快速響應(yīng)。

聽起來理論很簡(jiǎn)單,落地可一點(diǎn)都不容易,如果技術(shù)團(tuán)隊(duì)沒有磨合、不適配業(yè)務(wù),很可能會(huì)導(dǎo)致迭代落后于業(yè)務(wù)變化。

不過科大訊飛卻表示,未來一段時(shí)間公司不需要太多額外的人力投入,現(xiàn)在訊飛的團(tuán)隊(duì)和資金完全靠得住。有業(yè)內(nèi)人士分析,科大訊飛敢于這樣說,大概率是因?yàn)橛嶏w研究院作為人工智能創(chuàng)新研究院的“元老級(jí)”機(jī)構(gòu),建制完整、團(tuán)結(jié)且沒有技術(shù)上的內(nèi)耗。

公開資料顯示,目前訊飛研究院最核心的研究團(tuán)隊(duì)有200余人,其中有兩位是《麻省理工科技評(píng)論》“35歲以下科技創(chuàng)新35人”榜單中頂尖的年輕科學(xué)家,其他團(tuán)隊(duì)成員不少是和訊飛一起成長(zhǎng)的博士,憑這一點(diǎn)可以能推測(cè)出,這群科學(xué)家的特點(diǎn)是“懂訊飛的業(yè)務(wù)訴求”。

此外在算力算法方面,訊飛也是業(yè)界公認(rèn)的AI領(lǐng)域長(zhǎng)期堅(jiān)守者。公開資料顯示,科大訊飛在Transformer深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富經(jīng)驗(yàn),已經(jīng)應(yīng)用于訊飛的語(yǔ)音識(shí)別、圖文識(shí)別、機(jī)器翻譯等任務(wù)中,并達(dá)到國(guó)際領(lǐng)先水平;而且訊飛創(chuàng)新提出了知識(shí)與大模型融合統(tǒng)一的理解框架X-Reasoner,有望彌補(bǔ)大模型的模糊記憶技術(shù)短板。

而在算力投入上,訊飛過去幾年就一直牽頭承擔(dān)著國(guó)家自主可控人工智能平臺(tái)的諸多項(xiàng)目、在總部自建有業(yè)界一流的數(shù)據(jù)中心,為大模型訓(xùn)練平臺(tái)建設(shè)奠定了基礎(chǔ)條件,另外它之前與華為、寒武紀(jì)、曙光等企業(yè),也都建立了深度算力合作。

所以推出大模型,并且讓它具備商業(yè)化條件,對(duì)于互聯(lián)網(wǎng)大廠來說并不是一蹴而就的,以科大訊飛為例,它能在認(rèn)知大模型能實(shí)現(xiàn)快速突破、并且敢于披露和預(yù)測(cè)自己的投入,與長(zhǎng)期在人才、算法、算力上的積累密不可分。

大模型賽道,國(guó)家隊(duì)下場(chǎng)

在這場(chǎng)大模型帶來的AI熱中,還有很多“吃瓜群眾”很難理解科技圈對(duì)大模型的擁躉,畢竟類似的場(chǎng)景在元宇宙、AR/VR等領(lǐng)域都出現(xiàn)過。但如果深入回顧人工智能的發(fā)展歷史與傳統(tǒng)AI時(shí)代的困境,就能理解大模型之于科技時(shí)代的含義。

我們可以將大模型的開發(fā),理解為打造AI時(shí)代的“操作系統(tǒng)”,就像我們使用windows系統(tǒng)在電腦中完成工作一樣,經(jīng)由AI時(shí)代的“操作系統(tǒng)”大模型,人人都可以是開發(fā)者,生產(chǎn)出新產(chǎn)品和新的應(yīng)用場(chǎng)景。

如果上升到這個(gè)層面,各個(gè)有能力的國(guó)家對(duì)大模型的基本要求就是“自主可控”。在360宣布進(jìn)軍大模型領(lǐng)域時(shí),周鴻祎也在采訪中提到,GPT是個(gè)生產(chǎn)力工具,這將決定未來國(guó)際競(jìng)爭(zhēng)當(dāng)中的國(guó)運(yùn)。所以,國(guó)家隊(duì)也在大模型的開發(fā)和訓(xùn)練上陸續(xù)下場(chǎng)。

不久前,中國(guó)電信布局了企業(yè)版的ChatGPT;復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室開發(fā)的MOSS 模型已經(jīng)上線開源;中科院自動(dòng)化所早在2021年就發(fā)布業(yè)界首個(gè)圖文音三模態(tài)大模型“紫東·太初”,清華大學(xué)、北京大學(xué)等院校雖然沒有推出大模型,但是也在人工智能領(lǐng)域國(guó)際頂級(jí)期刊發(fā)表了多篇大模型相關(guān)的重要文章。

某知名互聯(lián)網(wǎng)公司的NLP團(tuán)隊(duì)負(fù)責(zé)人對(duì)節(jié)點(diǎn)財(cái)經(jīng)表示,國(guó)家隊(duì)下場(chǎng)更容易在一些核心數(shù)據(jù)、參數(shù)上占有優(yōu)勢(shì)。大模型的訓(xùn)練的本質(zhì),就是把語(yǔ)料、數(shù)據(jù)、參數(shù)等當(dāng)作“食物”喂給大模型,當(dāng)食物品質(zhì)越高,大模型就會(huì)越智能,還能節(jié)省算力。

例如作為“人工智能國(guó)家隊(duì)”,科大訊飛在中文語(yǔ)料上有著明顯優(yōu)勢(shì)。據(jù)了解,在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中,科大訊飛積累了超過50TB的行業(yè)語(yǔ)料和每天超10億人次用戶交互的活躍應(yīng)用,擁有大量的機(jī)器翻譯、語(yǔ)音識(shí)別、語(yǔ)音合成等方面的數(shù)據(jù),這些數(shù)據(jù)均是用于大模型訓(xùn)練和優(yōu)化自然語(yǔ)言處理模型的重要來源之一。

另外,科大訊飛要搭建的“認(rèn)知大模型”特別注重多輪對(duì)話和邏輯推理,才能在行業(yè)中深度應(yīng)用,這就意味著需要更高質(zhì)量的數(shù)據(jù)和參數(shù)。以醫(yī)療領(lǐng)域?yàn)槔拼笥嶏w是全國(guó)唯一通過國(guó)家執(zhí)業(yè)醫(yī)師資格考試的“人工智能系統(tǒng)”,超過了96.3%的醫(yī)學(xué)考生,現(xiàn)在科大訊飛已累計(jì)為基層醫(yī)生提供了超過5.8億次、日均超過70多萬(wàn)人次的人工智能輔診。這就意味著在專業(yè)領(lǐng)域,科大訊飛可以避免一本正經(jīng)地回復(fù)錯(cuò)誤消息,使得專業(yè)保障性更強(qiáng),大模型的落地也“更有專長(zhǎng)”。

科大訊飛,將人工智能與智慧醫(yī)療深度融合

還有不少機(jī)構(gòu)在研報(bào)中提到,科大訊飛在教育領(lǐng)域的應(yīng)用規(guī)模比醫(yī)療更大、數(shù)據(jù)更翔實(shí),未來的增長(zhǎng)更強(qiáng)勁。機(jī)構(gòu)們的肯定也印證了,在真正有剛需、適合認(rèn)知智能大模型的地方,國(guó)家隊(duì)下場(chǎng)后可以推動(dòng)大模型在具體行業(yè)上做得更透。

投入大模型,反哺根據(jù)地

在大模型的“諸神之戰(zhàn)”中還有個(gè)特點(diǎn),即面對(duì)著市場(chǎng)上成百上千個(gè)大模型投資標(biāo)的,一級(jí)市場(chǎng)和二級(jí)市場(chǎng)在投資上都有些不知所措。

有VC合伙人評(píng)價(jià),大家都看好大模型的發(fā)展趨勢(shì),也更愿意做跟投,但是一級(jí)市場(chǎng)的投資人不一定都能看懂大模型的落地前景,沒有領(lǐng)投人就不知道如何開始。二級(jí)市場(chǎng)的投資者則提出了靈魂疑問,現(xiàn)在宣布投身大模型的公司這么多,如何判斷他們是蹭熱點(diǎn)還是真做大模型?我不想買到只會(huì)炒作概念的“妖股”。

上海一券商的計(jì)算機(jī)行業(yè)賣方分析師提出了一個(gè)解決方案,對(duì)于上市公司,可以仔細(xì)觀察企業(yè)有沒有讓大模型反哺主要業(yè)務(wù)的發(fā)展。

例如百度的文心一言全面嵌入百度內(nèi)部工作平臺(tái)如流、對(duì)外也上車了百度apollo等業(yè)務(wù);釘釘也表示全面接入阿里的 "通義千問 "大模型,增加了 10余種 AI能力、對(duì)外也表示要開放;WPS AI表示將嵌入金山辦公全線產(chǎn)品,科大訊飛的投資者交流會(huì)中也表示,大模型對(duì)于其根據(jù)地業(yè)務(wù),有著很大推動(dòng)意義。

據(jù)了解,科大訊飛即將發(fā)布的星火大模型是“1+N認(rèn)知智能大模型”,其中“1”是代表的是大模型訓(xùn)練平臺(tái),“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、工業(yè)、汽車等多個(gè)根據(jù)地領(lǐng)域的專用大模型版本。

能提出這樣的模型架構(gòu),是因?yàn)榭拼笥嶏w在行業(yè)內(nèi)是少數(shù)既懂B端又懂C端的AI公司。劉慶峰預(yù)測(cè)道,超大規(guī)模的大模型已經(jīng)到了一個(gè)臨界點(diǎn),下一個(gè)階段應(yīng)該用更多專業(yè)的子模型來協(xié)同訓(xùn)練,獲得更可靠的成效。

這個(gè)專業(yè)階段的子模型,關(guān)聯(lián)的就是科大訊飛的“根據(jù)地業(yè)務(wù)”,之前我們看科大訊飛的財(cái)報(bào)時(shí),其根據(jù)地業(yè)務(wù)的基本盤一直非常穩(wěn)健,例如去年即使在宏觀因素的擠壓和疫情影響時(shí),科大訊飛根據(jù)地業(yè)務(wù)仍能實(shí)現(xiàn)23%的增長(zhǎng)。而基于上文提到語(yǔ)料、數(shù)據(jù)、參數(shù)的優(yōu)勢(shì),專業(yè)模型通過協(xié)調(diào)聯(lián)動(dòng),根據(jù)地業(yè)務(wù)還能形成效益的提升。

劉慶峰同樣預(yù)測(cè)道,訊飛在教育、醫(yī)療等根據(jù)地業(yè)務(wù)上的大模型成效不比千億級(jí)模型差。特別是想要形成通用領(lǐng)域的智慧涌現(xiàn),需要把這些模型的知識(shí)相互銜接,在整體的大模型中去統(tǒng)一訓(xùn)練,未來就有希望在教育、辦公、醫(yī)療等應(yīng)用領(lǐng)域搶占先機(jī)。有不少機(jī)構(gòu)同樣預(yù)測(cè)道,星火認(rèn)知大模型反哺業(yè)務(wù),會(huì)讓科大訊飛的根據(jù)地業(yè)務(wù)壁壘更加深厚。

幾天前,被譽(yù)為“AI界傳奇”的陸奇在《我的大模型世界觀》演講中提到了對(duì)于大模型的展望,即大模型是平臺(tái)型機(jī)會(huì),以模型為先的平臺(tái)需要以下幾個(gè)特征:1.開箱即用;2.要有一個(gè)足夠簡(jiǎn)單和好的商業(yè)模式;3.有自己殺手級(jí)應(yīng)用。

所以星火大模型的發(fā)布落地,不僅是簡(jiǎn)單易用的專業(yè)化模型;還可以在科大訊飛自己的教育、醫(yī)療、辦公等場(chǎng)景打造經(jīng)典應(yīng)用;再經(jīng)由訊飛的開放平臺(tái)開放出去,讓AI認(rèn)知大模型從“可用”階段邁入“常用”階段,帶動(dòng)AI時(shí)代的“操作系統(tǒng)”更加普惠化;最后為大模型的使用者創(chuàng)造現(xiàn)金流、創(chuàng)造真金白銀的產(chǎn)業(yè)附加值,這才是大模型的發(fā)展“偉力”。

節(jié)點(diǎn)財(cái)經(jīng)聲明:文章內(nèi)容僅供參考,文章中的信息或所表述的意見不構(gòu)成任何投資建議,節(jié)點(diǎn)財(cái)經(jīng)不對(duì)因使用本文章所采取的任何行動(dòng)承擔(dān)任何責(zé)任。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
互聯(lián)網(wǎng)公司

相關(guān)文章

熱門排行

信息推薦