當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

UFS分布式文件存儲(chǔ)接入能力升級(jí),支持Windows主機(jī)用戶使用

 2023-04-12 14:00  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

UFS分布式文件系統(tǒng)

UFS是一款分布式文件系統(tǒng)產(chǎn)品,它能夠?yàn)檫\(yùn)行于 UCloud 公有云、物理云、托管云上的各類主機(jī)提供高可用、高可靠、易拓展的文件存儲(chǔ)功能。通過(guò) UFS 產(chǎn)品提供的共享存儲(chǔ)功能,可以方便地為各類數(shù)據(jù)備份、serverless、AI 數(shù)據(jù)分析、高性能 web 站點(diǎn)等應(yīng)用場(chǎng)景提供強(qiáng)有力的支撐。

之前UFS僅支持NFSv4.0協(xié)議,只能提供給Linux主機(jī)使用。針對(duì)用戶需要在Windows主機(jī)使用UFS的需求,近日,UCloud優(yōu)刻得升級(jí)UFS產(chǎn)品功能,支持SMB和NFSv3接入?yún)f(xié)議。存量UFS實(shí)例能夠直接使用NFSv3協(xié)議掛載,新建UFS實(shí)例時(shí)則可以選擇接入NFS或者SMB。從而使UFS擁有了全量接入Windows主機(jī)的能力,讓W(xué)indows用戶也能充分利用UFS分布式文件系統(tǒng)創(chuàng)造價(jià)值。

下圖為UFS整體io處理架構(gòu)。

SMB介紹和支持

SMB(Server Message Block)是一種網(wǎng)絡(luò)文件共享協(xié)議,用于共享文件和打印機(jī)等資源,Windows主機(jī)廣泛使用該協(xié)議進(jìn)行文件的共享。當(dāng)前UFS接入支持的協(xié)議版本有CIFS,SMB2.0,SMB2.1,SMB3.0。

和本地搭建SMB服務(wù)比較,UFS擁有以下優(yōu)勢(shì):高容量,彈性擴(kuò)展,可支持最高PB級(jí)別的容量按需進(jìn)行擴(kuò)容;高可靠,數(shù)據(jù)存儲(chǔ)有跨機(jī)器、跨機(jī)架的三個(gè)副本;高可用,整體服務(wù)路徑均采用節(jié)點(diǎn)多實(shí)例設(shè)計(jì)和部署,沒(méi)有單機(jī)故障的隱患。

通過(guò)SMB協(xié)議掛載訪問(wèn)UFS,Windows用戶可以使用UFS分布式文件系統(tǒng)進(jìn)行海量視頻素材的存儲(chǔ)和編輯等。

NFSv3提升小文件操作的吞吐

Linux和Windows主機(jī)均可以使用NFSv3掛載UFS文件系統(tǒng),在大批量操作小文件的場(chǎng)景下,NFSv3相對(duì)于NFSv4.0性能更好。

以下我們分別介紹兩種協(xié)議版本讀取文件的流程。

NFSv4.0讀取文件流程:

1. 打開文件:PUTFH設(shè)置文件父目錄file handle(文件系統(tǒng)內(nèi)唯一標(biāo)識(shí)文件對(duì)象),OPEN打開指定文件,GETFH獲取打開文件的file handle,ACCESS檢查文件訪問(wèn)權(quán)限,GETATTR獲取文件屬性信息。

2. 確認(rèn)Open-Owner(可選):如果server需要confirm,客戶端再發(fā)起OPEN_CONFIRM。

3. 讀取數(shù)據(jù):PUTFH設(shè)置文件file handle,使用返回的stateid讀取文件。

4. 關(guān)閉打開文件:PUTFH設(shè)置文件file handle,關(guān)閉stateid指定的文件。

NFSv3讀取文件流程:

1. 查詢文件:LOOKUP查詢指定目錄下的文件,返回文件file handle和屬性信息。

2. 確認(rèn)訪問(wèn)權(quán)限:ACCESS檢查文件是否有訪問(wèn)權(quán)限。

3. 讀取數(shù)據(jù):使用文件file handle讀取數(shù)據(jù)。

得益于NFSv4.0引入的COMPOUND Procedure,額外支持狀態(tài)的NFSv4.0協(xié)議RPC交互數(shù)量一般也和NFSv3一樣多。但是為什么NFSv4.0大批量操作小文件的性能會(huì)遠(yuǎn)遠(yuǎn)差于NFSv3?為了支持狀態(tài),NFSv4.0打開文件需要提供Open-Owner,協(xié)議中規(guī)定針對(duì)每個(gè)Open-Owner,同一時(shí)刻只能發(fā)起一個(gè)相關(guān)請(qǐng)求;在Linux內(nèi)核實(shí)現(xiàn)中,同一個(gè)用戶的進(jìn)程會(huì)共用同一個(gè)Open-Owner,因此在大量小文件讀寫的情況下,文件的打開流程會(huì)變成串行操作,影響性能。所以在大批量操作小文件并且沒(méi)有文件鎖需求的場(chǎng)景下,NFSv3相比NFSv4.0可以大幅度提高性能。

以下針對(duì)小文件夾的讀寫場(chǎng)景分別在NFSv3和NFSv4.0掛載下進(jìn)行了測(cè)試。測(cè)試環(huán)境為Centos8.3虛機(jī),測(cè)試文件為L(zhǎng)inux內(nèi)核源碼包,有8w+文件。

下面的表格為測(cè)試結(jié)果,可以看出在大批量操作小文件的情況下NFSv3比NFSv4.0性能好得多。

某知名在線英語(yǔ)教育公司使用UCloud GPU云主機(jī)進(jìn)行AI訓(xùn)練,訓(xùn)練數(shù)據(jù)存儲(chǔ)在UFS分布式文件系統(tǒng)中,最開始這家公司的客戶端使用的是NFSv4.0掛載,使用過(guò)程中發(fā)現(xiàn)訓(xùn)練性能不理想,在沒(méi)有達(dá)到硬件瓶頸的情況下,并發(fā)運(yùn)行多個(gè)訓(xùn)練任務(wù)也并沒(méi)有顯著減少訓(xùn)練時(shí)間。經(jīng)過(guò)排查后發(fā)現(xiàn),NFS掛載讀取吞吐較低,用戶的訓(xùn)練數(shù)據(jù)小文件居多,監(jiān)控?cái)?shù)據(jù)中看到大量的open請(qǐng)求,導(dǎo)致讀取數(shù)據(jù)性能差。更換使用NFSv3掛載后,沒(méi)有額外的open開銷,訓(xùn)練速度提升了至少2倍。

總結(jié)和展望

UFS分布式文件系統(tǒng)的接入能力升級(jí),支持了Windows主機(jī)使用,加速了用戶特定場(chǎng)景的使用功能。UFS還在進(jìn)行產(chǎn)品私有化的開發(fā)工作,未來(lái)會(huì)研發(fā)并行文件系統(tǒng),以更低的io時(shí)延,更高的吞吐,支撐HPC場(chǎng)景應(yīng)用。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
數(shù)據(jù)存儲(chǔ)

相關(guān)文章

  • 鵬云網(wǎng)絡(luò)分布式塊存儲(chǔ)社區(qū)版問(wèn)世,首發(fā)開源存儲(chǔ)解決方案

    2023年1月,南京鵬云網(wǎng)絡(luò)科技有限公司(簡(jiǎn)稱:鵬云網(wǎng)絡(luò))正式宣布開源ZettaStorDBS分布式塊存儲(chǔ)系統(tǒng),開放了自研10余年的分布式塊存儲(chǔ)技術(shù),自此踏上了“自研”與“開源”一體并行的生態(tài)閉環(huán)之路。研發(fā)十年,挑戰(zhàn)塊存技術(shù)上限成本、效率、高可用,一直都是企業(yè)IT系統(tǒng)建設(shè)所追求的重要關(guān)鍵點(diǎn),這三點(diǎn)在

  • “效能再進(jìn)化,數(shù)據(jù)更安全”威聯(lián)通舉行QTS 5.1.0及次世代NAS發(fā)布會(huì)

    2023年5月9日,以“效能再進(jìn)化,數(shù)據(jù)更安全”為主題,威聯(lián)通2023年新品發(fā)布會(huì)在上海隆重舉行,多家媒體、合作伙伴及威聯(lián)通愛(ài)好者蒞臨現(xiàn)場(chǎng),共同見證NAS網(wǎng)絡(luò)存儲(chǔ)行業(yè)朝向更高品質(zhì)、更強(qiáng)性能、更好安全性的再次啟航。威聯(lián)通QTS5.1.0系統(tǒng)發(fā)布時(shí)下,網(wǎng)絡(luò)存儲(chǔ)行業(yè)已從萌芽時(shí)代步入增速發(fā)展關(guān)鍵期,用戶對(duì)數(shù)

  • 面向海量非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),QingStor U10000幫助企業(yè)解鎖數(shù)據(jù)價(jià)值

    隨著經(jīng)濟(jì)社會(huì)數(shù)字化轉(zhuǎn)型的加速,各行各業(yè)產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)持續(xù)呈現(xiàn)井噴增長(zhǎng)態(tài)勢(shì)。而為了科學(xué)高效地利用這些非結(jié)構(gòu)化數(shù)據(jù),為企業(yè)加速數(shù)字化轉(zhuǎn)型打牢基礎(chǔ),在實(shí)現(xiàn)數(shù)據(jù)穩(wěn)定、專業(yè)的存儲(chǔ)的前提下,推動(dòng)數(shù)據(jù)的合理流動(dòng)是關(guān)鍵。作為業(yè)內(nèi)技術(shù)領(lǐng)先的企業(yè)級(jí)云服務(wù)商與數(shù)字化解決方案提供商,青云科技(qingcloud.com

  • 得一微對(duì)話Arm,打造計(jì)算型存儲(chǔ)新生態(tài)

    高可靠存儲(chǔ)控制芯片、高端汽車存儲(chǔ)芯片等領(lǐng)域都已成為備受矚目的黃金賽道,被持續(xù)加大研發(fā)投入,頗受市場(chǎng)認(rèn)可。在這樣的市場(chǎng)背景下,得一微電子CEO吳大畏與Arm物聯(lián)網(wǎng)事業(yè)部業(yè)務(wù)拓展副總裁馬健展開生態(tài)對(duì)話,圍繞存儲(chǔ)控制技術(shù)及應(yīng)用市場(chǎng)展開了探討,雙方將在ComputationalStorage計(jì)算存儲(chǔ)領(lǐng)域芯片

  • 百代可信OSS引領(lǐng)國(guó)產(chǎn)存儲(chǔ)技術(shù)新革命!

    近期互聯(lián)網(wǎng)圈頂流“ChatGPT”憑借著“天上文曲星”般的智能表現(xiàn)火速破圈,在諸如內(nèi)容生成、搜索引擎優(yōu)化、智能問(wèn)答等領(lǐng)域展現(xiàn)出了巨大潛力,引發(fā)了人工智能領(lǐng)域的新一輪技術(shù)升級(jí)與產(chǎn)業(yè)重塑,一個(gè)AI大規(guī)模商業(yè)化的時(shí)代正悄然來(lái)臨。AI大規(guī)模商業(yè)化時(shí)代背景,勢(shì)必伴隨著背后海量級(jí)的數(shù)據(jù)存儲(chǔ),數(shù)據(jù)就是一切,是支撐

熱門排行

信息推薦