如果沒有開源,就沒有Linux、PHP、MySQL,也就沒有中國的數(shù)據(jù)庫和互聯(lián)網(wǎng);如果沒有Transformer的開源,也就不會有OPEN AI和ChatGPT。但正因為有了開源,才會出現(xiàn)AI同質(zhì)化,也就將導致MaaS(模型即服務)不稀缺,進而導致@百融云-W(6608.HK)們即將面臨價格戰(zhàn)?但,這是事實嗎?
以上觀點刻舟求劍、完全錯誤,因為傳統(tǒng)IT開源的是全部源代碼,但AI大模型不會開源訓練過程和訓練數(shù)據(jù)。而語料的缺失,正是中國AI公司想爭奪MaaS業(yè)務和B端市場但又缺乏競爭壁壘的關鍵。
曾經(jīng)的“LAMP”棧:Linux是開源的操作系統(tǒng)內(nèi)核,開放源代碼與開發(fā)者社區(qū),后世的安卓系統(tǒng)便脫殼于此;Apache HTTP Server是一個Web服務器軟件,處理HTTP請求并提供Web頁面;PHP是開源的服務器端腳本語言;MySQL是開源關系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),用于網(wǎng)站和在線應用的數(shù)據(jù)存儲,共同構(gòu)成了互聯(lián)網(wǎng)世界的基座。但早在AI時代到來之前,云計算時期的開源就已經(jīng)發(fā)生了變化。
核心原因,就在于——“商業(yè)化”,也就是科技公司開始利用開源做生意。
彼時的云服務商通過大量采用和貢獻開源技術,如OpenStack、Docker,將開源軟件與云服務緊密結(jié)合,通過提供基于開源軟件的云服務來創(chuàng)造商業(yè)價值,如AWS、Azure等。而到了現(xiàn)在的AI時代:OpenAI已不再Open。
AI大模型的開源戰(zhàn)場,交給了Meta、Llama這些AI大模型,但Llama2并不符合開放源代碼促進會(OSI)設定的定義,比如禁止使用Llama2去訓練其它AI模型以及如果該模型用于每月用戶超過7億的應用程序和服務,則需要獲得Meta的特殊許可證。
作為中國MaaS的頭部玩家,百融云曾經(jīng)也一度擔憂開源AI帶來的競爭壓力,但事實上,開源AI除了訓練許可之外,商業(yè)化領域最大的痛點還在后面。
首先是開源的方式,Llama的開源方式是指在開放源代碼的同時,對使用、修改和分發(fā)該模型的行為施加一定的限制。這與完全開放的開源許可證不同,后者通常允許用戶在幾乎不設限的情況下使用和修改軟件。雖然Mistral、谷歌的開源AI模型Gemma,同時開源了模型的權重和架構(gòu),但是對于AI模型訓練的數(shù)據(jù)和訓練過程并不開源。
這兩項,恰恰就是MaaS模式已經(jīng)出現(xiàn),但玩家少之又少的原因。因為沒有Fine-tune和垂直領域私有化數(shù)據(jù)訓練的AI模型,是沒有任何商業(yè)化可能性的。
百融云MaaS業(yè)務的主要戰(zhàn)場是金融業(yè),作為中國六大基石產(chǎn)業(yè)之一,中國金融機構(gòu)是不可能允許將數(shù)據(jù)用于訓練開源AI模型的,尤其是來自海外的開源AI。
金融機構(gòu)對于MaaS服務的使用,第一層是單次使用直接得到信息輸出(Equivalent模式);第二層是基于現(xiàn)有搜索引擎,AI通過對實時信息的智能檢索和分析,經(jīng)過加工后再生成信息反饋(2-Stage Search Summarizer模式)。所以中國的金融機構(gòu)需要不停的在業(yè)務流程中調(diào)取實時信息,并且依賴百融云MaaS服務的擴展能力,假定AI模型會檢索傳統(tǒng)搜索引擎中的相關內(nèi)容,并基于每條搜索內(nèi)容生成結(jié)果響應,如貸款申請評分、財富管理產(chǎn)品推薦等等,并將模型認為最好的答案輸出給用戶,50 tokens的信息輸入條件下,每次基于傳統(tǒng)搜索引擎生成10個響應,每個響應中有平均1000 tokens,并最終生成400 tokens的搜索結(jié)果。
舉一個MaaS在財富管理的實際應用,一位客戶提出了“有5萬元可供投資”的需求,百融云的MaaS服務就會調(diào)用所有的AI模型庫,其訓練數(shù)據(jù)來自金融機構(gòu)的產(chǎn)品中心、客戶中心、賬戶核心、風控、商戶、運營管理等不同的業(yè)務部門,最終形成的MaaS業(yè)務調(diào)用結(jié)果就會是:“您的投資風格是穩(wěn)健型,您是我行尊貴的鉑金客戶,我行目前有平均年化收益3%的理財產(chǎn)品,起投金額正是5萬……”。
中國企業(yè)用戶從來要的就不是AI大模型,而是能幫助用戶創(chuàng)收的AI解決方案,可以是AI產(chǎn)品,也可以是AI服務。但很明顯,上述百融云MaaS業(yè)務的案例,是所有開源AI模型無法實現(xiàn)的。
因為無法獲得垂直領域訓練數(shù)據(jù)的開源AI,與不能變現(xiàn)的小程序沒區(qū)別。
百融云MaaS業(yè)務在2023年實現(xiàn)收入8.91億、同比增幅17%、且有99%的核心客戶留存率。如果開源AI模型能取代百融云的地位,或許客戶早就更換AI服務商了,因為在Scaling law法則下,就算開源具備私有化部署的成本優(yōu)勢,也彌補不了無法商業(yè)化的劣勢。
百融云們,似乎之前也高估了開源AI的威脅。換言之,開源AI上不了中國商業(yè)化的高端局。
目前百融云的MaaS收入僅僅相對于金融機構(gòu)信貸總額的萬分之幾,中國消費信貸這么大的市場,即使成為千分之一的體量,百融云要面對的也將是幾百億規(guī)模的普惠金融AI市場?,F(xiàn)在便開始展望天花板,未免早了些。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!