算力作為推動人工智能產(chǎn)業(yè)發(fā)展的核心動力,在將數(shù)據(jù)及算法轉(zhuǎn)化為最終生產(chǎn)力的過程中發(fā)揮著重要作用。可以說,大模型時代,AI領(lǐng)域正從數(shù)據(jù)和算法層面的競爭,轉(zhuǎn)變?yōu)榈讓铀懔Φ母偁?。相關(guān)機構(gòu)分析顯示,我國算力產(chǎn)業(yè)保持高速增長,其中AI算力在整個算力結(jié)構(gòu)中的占比已經(jīng)超過25%。我國算力總規(guī)模近五年年均增速近30%,數(shù)據(jù)中心機架數(shù)量年復(fù)合增長率超過30%。
青云科技(qingcloud.com)總裁林源表示,AI和大模型,毫無疑問是推動生產(chǎn)力變革的有效工具,不僅能促使所有行業(yè)積極擁抱AI,降低使用的門檻,還能把原來很多不能做的事情變成可能。然而,在AI技術(shù)催生市場變化的過程中,用戶對于底層架構(gòu)、算力及應(yīng)用部署的要求也在發(fā)生變化。
“未來將是一個以GPU為核心的時代”。林源表示,這一時期,將以云原生和AI應(yīng)用為主。同時,用戶的算力部署環(huán)境和業(yè)務(wù)形態(tài)也將呈現(xiàn)多元化的趨勢:在算力方面,既包括傳統(tǒng)云計算(以CPU為主)、智算(以GPU為主)、超算(以HPC為主)等多元算力,還包括國外芯片及國內(nèi)芯片等異構(gòu)算力;在業(yè)務(wù)形態(tài)方面,既有成本敏感型業(yè)務(wù),也有延遲敏感型業(yè)務(wù)。這不僅會使得應(yīng)用部署變得更復(fù)雜,也對技術(shù)和平臺提出了更高的要求。
新問題“呼喚”新方法
大模型時代,行業(yè)內(nèi)正在進行大規(guī)模智算中心的建設(shè),以滿足急劇增加的算力需求。不過,受算力復(fù)雜度提升和缺口擴大等因素的影響,行業(yè)內(nèi)對于智算中心要怎么建、建成什么樣、未來要支撐什么業(yè)務(wù)等問題,并沒有想得很透徹。例如,智算中心的設(shè)計規(guī)劃、運營和運維、多元算力的統(tǒng)一調(diào)度、高效網(wǎng)絡(luò)與存儲的提供等內(nèi)容都是模糊化的。
“智算中心投資巨大,能否盈利取決于運營效率和平臺能力。因為平臺能力越強,能支撐的用戶業(yè)務(wù)類型就越多,盈利模式也就越清晰。以國家超算濟南中心為例,該中心依托于算力調(diào)度平臺,實現(xiàn)了底層架構(gòu)、中間PaaS平臺以及上層應(yīng)用之間的算力存儲、調(diào)度及運維,而憑借多元異構(gòu)的算力平臺以及信創(chuàng)適配能力,使該中心能夠支撐科學(xué)計算、政務(wù)云建設(shè)以及智慧城市建設(shè)等多種業(yè)務(wù)類型,從而大幅提升了中心的運營和盈利能力。”林源如此說道。
事實上,國家超算濟南中心所構(gòu)建的算力調(diào)度平臺,正是青云科技經(jīng)過持續(xù)的技術(shù)積累、沉淀以及市場實踐之后,所推出的計算中心運營工具。同時,也是青云科技解決AI時代算力難題的邏輯和思路所在。“該平臺的客戶群體是現(xiàn)在和未來投入計算中心建設(shè)的企業(yè),目標(biāo)是通過提供多元算力調(diào)度、高速并行存儲、統(tǒng)一運維和運營、異構(gòu)GPU支持、模型倉庫、信創(chuàng)適配等能力,幫助這些運營者建立從算力中心建設(shè)到運營的閉環(huán)。”林源如是說。
具體來看,青云AI算力調(diào)度平臺,在分布式調(diào)度和管理上,基于就近使用的原則,能夠在最靠近數(shù)據(jù)的節(jié)點上承載業(yè)務(wù),并保障所有節(jié)點服務(wù)體驗一致;在資源調(diào)度上,能夠立即調(diào)度擴容數(shù)萬卡資源、設(shè)置最短優(yōu)先調(diào)度鏈路、支持異構(gòu)平臺、提升感知作業(yè)級單卡顆粒度等;在高速并行存儲上,能夠構(gòu)建統(tǒng)一的數(shù)據(jù)存儲底座,實施數(shù)據(jù)生命周期分層策略,降低存儲成本。
此外,青云科技產(chǎn)品經(jīng)理苗慧表示,面對行業(yè)內(nèi)普遍存在的多元資源統(tǒng)一調(diào)度管理、高速網(wǎng)絡(luò)瓶頸、環(huán)境搭建復(fù)雜、多業(yè)務(wù)整合瓶頸等挑戰(zhàn),青云AI算力調(diào)度平臺還將在多種硬件架構(gòu)和GPU卡適配、全生命周期管理、多種AIGC模型一站式交付以及多種應(yīng)用模式支撐上,進行持續(xù)研發(fā)和優(yōu)化。“基于以上關(guān)鍵能力,青云科技的目的是像管理本地資源一樣,為用戶提供智能化、多元化的算力調(diào)度能力,并幫助用戶管理AI基礎(chǔ)設(shè)施,支撐算力體系建立。”苗慧如此說道。
有產(chǎn)品,更要有服務(wù)
從發(fā)展歷程來看,青云科技和整個行業(yè)一樣,都是從通用云計算開始,然后在虛擬化、計算、存儲、網(wǎng)絡(luò)以及資源分發(fā)上做了大量工作。目前,在HPC領(lǐng)域和AI智算領(lǐng)域,青云科技的產(chǎn)品越來越面向終端用戶,并且有越來越多的政府、科研、企業(yè)等機構(gòu)用戶使用青云科技的平臺產(chǎn)品。
從市場角度上看,有產(chǎn)品,就要有相應(yīng)的服務(wù)讓其推而廣之。此時,在AI算力調(diào)度平臺的基礎(chǔ)上,青云科技思考的是如何聯(lián)合合作伙伴,為最終用戶提供一個完整的解決方案?;谶@樣的需求,青云科技AI算力云服務(wù)應(yīng)運而生。“青云科技AI算力云服務(wù)的定位是一個開放的生態(tài)同盟,所以青云在集結(jié)這些跟我們志同道合的合作伙伴,通過‘同盟’的方式一起運營AI算力云服務(wù)。”林源說道。
目前,青云科技在AI算力云“同盟”建設(shè)上,包括英偉達、AMD以及國產(chǎn)芯片廠商等AI算力組件生態(tài),商湯、無問芯穹、紫東太初等AI算力模型生態(tài),國家超算濟南中心、清華大學(xué)電子工程系智算中心等AI算力服務(wù)生態(tài)以及金融、制造、交通、能源等AI算力場景生態(tài)。
從行業(yè)的角度上看,AI算力云主要服務(wù)于客服、營銷、金融、交通、能源、法律等行業(yè)大模型的早期訓(xùn)練階段。接下來,在大規(guī)模研發(fā)工作取得階段性成果之后,基于大模型的推理服務(wù)將會成為AI算力云的主要工作。苗慧表示,青云科技AI算力云正持續(xù)對外運營中,并且推出了包括裸金屬服務(wù)器、虛擬化服務(wù)器、高速網(wǎng)絡(luò)、訓(xùn)練集群、推理集群、鏡像倉庫和并行文件存儲等在內(nèi)的諸多產(chǎn)品。
不難看出,青云科技的邏輯和思路是希望依托一個開放的、成熟的、可運營的AI算力調(diào)度平臺,通過自營、合營乃至支撐第三方運營的方式,與生態(tài)同盟一起貢獻AI Cloud。在這一過程中,青云科技并不是什么都干,而是聚焦于自己最擅長的AI算力調(diào)度平臺,其他的都會交由生態(tài)合作伙伴來提供,這恰恰是青云科技的差異化價值所在。
專注做自己最擅長的事情
林源表示,青云科技并不是一家項目公司,而是一家產(chǎn)品公司,因此所提供的產(chǎn)品都是標(biāo)準(zhǔn)化的,定制化內(nèi)容將會由客戶自己完成。此外,當(dāng)談到自身在算力上的投入時,林源表示,作為聯(lián)合運營方,青云科技通過提供技術(shù)和產(chǎn)品,將以輕資產(chǎn)的方式運營AI算力云,而不是買幾百張卡、幾百臺服務(wù)器,這并不是青云科技的價值所在。
事實上,青云從誕生之日起就提出“云之基石,自由計算”的理念,希望“把自由留給客戶,把復(fù)雜交給自己”,從客戶需求出發(fā),成為企業(yè)數(shù)字化轉(zhuǎn)型的基石。這一定位,11年來并沒有改變過。
聞道有先后,術(shù)業(yè)有專攻。在服務(wù)行業(yè)數(shù)字化轉(zhuǎn)型的進程中,青云科技最擅長做的是為企業(yè)提供底層的、基礎(chǔ)的、復(fù)雜的技術(shù)、產(chǎn)品和解決方案,并且致力于與合作伙伴一起服務(wù)最終客戶。今天,青云科技發(fā)布的AI算力調(diào)度平臺和AI算力云服務(wù),就是最好的解釋。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!