1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

浪潮信息“拓荒”:一場面向大模型時代的性能“壓榨”

 2023-11-03 15:04  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文 | 智能相對論

作者 | 沈浪

全球人工智能產(chǎn)業(yè)正被限制在了名為“算力”的瓶頸中,一側是供不應求的高端芯片,另一側則是激戰(zhàn)正酣的“百模大戰(zhàn)”,市場的供求兩端已然失衡。

然而,大多數(shù)人的關注點仍舊還是在以英偉達為主導的高端芯片領域。

半導體的創(chuàng)新固然關鍵,但是從現(xiàn)實處境來講,芯片從造出來到用起來,是一個龐大的系統(tǒng)工程,市場更需要一條能暫時繞開半導體創(chuàng)新的系統(tǒng)創(chuàng)新的技術路徑,來同步釋放算力,以滿足現(xiàn)階段爆發(fā)性的算力需求以及后期可持續(xù)的常態(tài)發(fā)展。

遵循著這一思路,就不難發(fā)現(xiàn),以浪潮信息為代表的本土廠商已經(jīng)開始了另一條釋放算力的創(chuàng)新路徑,即對服務器等硬件的基礎架構進行創(chuàng)新,在硬件層面“拓荒”,“壓榨”更多的硬件性能,打破算力桎梏。

只是這樣的路徑,似乎沒有想象中的那么簡單、輕松。

01 向底層“拓荒”,激活“牛鞭效應”

以服務器為例,一臺服務器有超過10000個零部件,同時還涉及30多個技術領域,包括材料學、熱力學、電池技術、流體力學、化學等一系列學科。此外,一臺服務器里還會應用超過100種傳輸協(xié)議。其制造過程更是需要經(jīng)歷30多道流程,使用100多種加工和制造工藝等等。

若要對這樣的高精密硬件的基礎架構進行創(chuàng)新,絕非易事。

在四五年前,一些大規(guī)模數(shù)據(jù)中心用戶幾乎都遇到過一個相似的問題:風扇轉速越快,硬盤越有可能出現(xiàn)性能波動,嚴重時還會直接掉線,非常影響硬盤的讀寫性能。

浪潮信息的工程師團隊做了大量實驗,最終鎖定原因:風扇產(chǎn)生的噪音一旦達到120分貝,就非常容易造成硬盤磁頭偏移、讀寫效率下降,進而導致扇區(qū)失效乃至硬盤報廢、服務器宕機。

盡管這樣的問題看起來很小,卻對服務器的性能有著嚴重制約。如何解決服務器內部的風噪問題,成為了一個業(yè)內共同探索的議題。國際開放計算社區(qū)OCP組織成員包括FaceBook(現(xiàn)為Meta公司)、微軟、浪潮信息、戴爾等企業(yè),共同發(fā)起Storage Vibration(存儲設備振動)項目,旨在解決相關的問題。

最終,浪潮信息的工程師們基于大量機理性研究和測試,發(fā)現(xiàn)了硬盤性能損失與聲壓強度間的數(shù)學規(guī)律,并構建出業(yè)界首個硬盤敏感度模型,量化出不同硬盤受到各類噪聲影響后的性能表現(xiàn)。

以此為依據(jù),浪潮信息也得以對最新G7服務器系統(tǒng)進行了全方位的優(yōu)化設計,譬如通過CFD流體動力學仿真改進·不同機箱布局下的風扇的葉片形態(tài),抑制扇葉表面因渦流脫落形成的高頻噪音,提升硬盤讀寫效率50%;或是在機箱內通過設計40多種歌院式的消音結構,消除特定的高頻噪聲等等。

這些“繡花針”功夫是創(chuàng)新底層架構的關鍵,而看似很微小的基礎改良,卻是提升服務器性能、保障硬件平穩(wěn)運行的重要因素。 在經(jīng)濟學領域,有一個專業(yè)術語叫作“牛鞭效應”,指一端微小的擺動被不斷放大,到了另一端將演變?yōu)榇蠓鶖[動的趨勢。

從硬件的應用來看,基礎部件的改良也將激活“牛鞭效應”——從一張硬盤到一個服務器,再到一個數(shù)據(jù)中心,隨著硬件不斷疊加應用,底層的改良價值將被逐步放大,向上層傳遞,成為服務器安全運作、釋放算力、促進人工智能產(chǎn)業(yè)發(fā)展的重要保障。

類似的,現(xiàn)階段備受關注的芯片互聯(lián)技術,也是支撐大模型大規(guī)模算力場景的關鍵技術,尤其是單個服務器內部芯片高速直連,是實現(xiàn)大規(guī)模算力集群高效協(xié)同工作的基礎。作為全球領先的服務器廠商,浪潮信息在高速互連領域定義了業(yè)界第一個符合OAM(開放加速模塊)規(guī)范的8卡互連硬件系統(tǒng),解決了高速信號的速率提升和信號失真問題,實現(xiàn)開放加速規(guī)范下芯片互連的最高速率,助力著人工智能產(chǎn)業(yè)的持續(xù)突破。

02 一場對性能的極限“壓榨”

在人工智能行業(yè),算力的巨大需求和供給緊張已然是擺上臺面的事實。為什么業(yè)內廠商想要不斷地改進傳統(tǒng)的硬件架構去釋放算力,哪怕只是一點細微的聲噪優(yōu)化,都不遺余力地花上四五年的時間去研究、探索和創(chuàng)新。

細究來說,算力的供應大抵可以歸結為兩條路徑,一是“增量拓展”,比如接入更多的服務器、建更多的數(shù)據(jù)中心,通過“堆量”的方式來提供更多的算力。二是“存量優(yōu)化”,對原有架構、原有機器進行優(yōu)化升級,通過“提質”的方式來把性能和效率提升起來。

其中,在這兩條路徑之下,“存量優(yōu)化”又是必然的一條。無關乎未來算力是否緊張或寬裕,如何對現(xiàn)有的機器和架構進行升級優(yōu)化,是行業(yè)發(fā)展的一個重要階段,只是時間早晚的問題。

值得一提的是,現(xiàn)階段,服務器行業(yè)已經(jīng)有著充分的理由去推進“存量優(yōu)化”這一路徑。

一方面,算力領域正在面臨著高端芯片緊張的問題,“增量拓展”被限制,那么業(yè)內廠商就不得不考慮“存量優(yōu)化”的事情。

另一方面,源于服務器的特殊性,在服務器概念上的簡單的“堆量”只能堆出各種形態(tài)和規(guī)格的服務器,但對數(shù)據(jù)中心計算能力的提升并沒有什么實質性的幫助。

對此,在2014年,浪潮信息提出了“融合架構”的技術理念,旨在創(chuàng)造一種新的體系架構,將硬件設備中的同類資源整合成一個資源池,即便是不同的設備也能夠任意地整合,再通過軟件動態(tài)感知業(yè)務的資源需求,從而利用硬件重組的能力來滿足各類應用的性能需求。

這種“融合架構”看似是“增量拓展”,但核心則是“存量優(yōu)化”。直到融合架構3.0的發(fā)布,就可以清晰地看到,這一技術理念打破了現(xiàn)有服務器的邏輯架構和應用模式,實現(xiàn)了整機柜級別的計算、內存、存儲與互聯(lián)等各種IT資源的池化,形成了以系統(tǒng)設計為中心的新架構模式,對構建高速高性能的互聯(lián)網(wǎng)絡起到了重要作用。

簡單來說,基于“池化”的概念,融合架構3.0將服務器內的計算資源、存儲資源、內存資源、異構加速資源等核心IT資源重新細化,并做了“重組”,從而能使其發(fā)揮出更高的性能和應用價值。

這相當于對現(xiàn)有的服務器性能做了一次極限地“壓榨”。 眾所周知,傳統(tǒng)服務器的性能利用率是無法達到100%,兩臺服務器相連得到大多是1+1<2結果,而基于融合架構3.0的支持,就有可能實現(xiàn)1+1>2的情況。

當然,這只是一個便于理解的理想化公式,現(xiàn)實大抵是達不到這個效果的。但是,其中的進步也是看得見的,特別是隨著服務器的增加,當我們再來估算1+1+1+...+N的效果時,在融合架構3.0下的服務器便能發(fā)揮出遠超傳統(tǒng)架構的性能和價值。

這是融合架構3.0的價值展望,同時也是“存量優(yōu)化”這一路徑在服務器行業(yè)的價值呈現(xiàn)。正如上文提及的“牛鞭效應”,當?shù)讓蛹毼⒌膭?chuàng)新不斷被放大到一個硬件、一個計算集群、一個產(chǎn)業(yè)生態(tài),那么其發(fā)揮出來的作用將遠超過往。

03 在算力之外

當前,在服務器行業(yè),就能看到類似的信號。

繼續(xù)以融合架構3.0為例,其打破了以往“以CPU為中心”的設計理念,從整體出發(fā),以系統(tǒng)為中心,通過硬件解耦將異構計算、內存、存儲等資源轉變?yōu)榭瑟毩U展的資源池。

在這個過程中,不僅實現(xiàn)了亞微秒級遠端內存訪問,并且還構建出了一種邏輯上可遠端共享的內存資源池,讓多臺主機訪問同一個內存池,從而大大提高了數(shù)據(jù)交換的效率,讓Spark、Hadoop和機器學習等使用分布式數(shù)據(jù)框架的應用,能夠更順暢地實現(xiàn)框架內各節(jié)點間的數(shù)據(jù)交換與協(xié)作。

也就是說,融合架構3.0解決的不僅僅是服務器性能、算力釋放等問題,實際上還繼續(xù)向上層拓展,解決了系統(tǒng)應用的問題——服務器的架構創(chuàng)新在算力之外,帶來了全新的價值呈現(xiàn)。

類似的,放眼全球市場,微軟與英偉達合作推出的虛擬機Azure ND H100 v5 VM系列,正基于強大的硬件能力支持結合Quantum-2InfiniBand網(wǎng)絡互連,從而幫助企業(yè)更好、更高效地處理生成式AI任務。

現(xiàn)階段,大多數(shù)硬件升級并非單線的,而是考慮到上層的應用需求,如大模型訓練、生成式AI任務等,結合軟件系統(tǒng)、網(wǎng)絡服務等進行融合創(chuàng)新,從而為應用場景服務。

縱觀當前人工智能產(chǎn)業(yè)在算力層面的困頓處境,以算力牽動整個人工智能產(chǎn)業(yè)的發(fā)展是必然的趨勢。而業(yè)內廠商在解決算力供給問題的過程,也將同步帶動其他模塊的升級。換句話說,解決算力問題就不能局限在高端芯片領域,更要從其他的路徑尋求多元化的發(fā)展。

在這個階段,以英偉達為主導的高端芯片領域和以浪潮信息為代表的服務器硬件升級,都將站在市場的聚光燈下。今天的市場,需要更多元、更勇敢、更執(zhí)著的探索者、創(chuàng)新者。

*本文圖片均來源于網(wǎng)絡

#智能相對論 Focusing on智能新產(chǎn)業(yè)新服務,這是智能的服務NO.247 深度解讀

此內容為【智能相對論】原創(chuàng),

僅代表個人觀點,未經(jīng)授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網(wǎng)絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。

•AI產(chǎn)業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬個為什么》

•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
大模型

相關文章

  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生。”計算機之父約翰·馮·諾依曼曾這樣說到。

    標簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標簽:
    ai智能
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡隨著數(shù)字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知

編輯推薦