1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 大數(shù)據(jù)
  4. 正文

國產(chǎn)圖數(shù)據(jù)庫廠商「費馬科技」通過LDBC-SNB官方審計測試,達到原紀錄的7.6倍

 2020-07-31 15:08  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

近年來,隨著大數(shù)據(jù)技術的發(fā)展,社交網(wǎng)絡、交易網(wǎng)絡、知識圖譜等圖數(shù)據(jù)也得以大量積累,從而有力的推動了圖數(shù)據(jù)的應用。目前,圖數(shù)據(jù)已經(jīng)被成功應用于包括金融風控、推薦、工業(yè)流程控制、設備管理等許多領域。圖數(shù)據(jù)庫作為管理圖數(shù)據(jù)的基礎軟件,也吸引了許多廠商的注意。近年來,包括Oracle、IBM、微軟在內(nèi)的傳統(tǒng)軟件巨頭及眾多初創(chuàng)企業(yè)都大舉進軍圖數(shù)據(jù)庫領域。

北京費馬科技有限公司是一家以研發(fā)圖數(shù)據(jù)庫和圖計算軟件為目標的初創(chuàng)企業(yè)。在此前36氪的報道中,我們注意到這家由多名清華博士創(chuàng)辦的公司對圖計算技術有深厚的積累。今天我們欣喜地看到,費馬科技的圖數(shù)據(jù)庫TuGraph取得了突破,在國內(nèi)企業(yè)中率先通過了國際基準官方審計測試并取得了國際領先的測試結果。

2020年7月30日,費馬科技宣布,公司成為國內(nèi)第一家通過圖數(shù)據(jù)庫國際標準基準測試程序LDBC-SNB官方審計測試的企業(yè),同時打破了LDBC-SNB已經(jīng)公布的最高紀錄。在中大規(guī)模數(shù)據(jù)集(300GB)上,吞吐率達到之前最高紀錄(由Virtuoso保持)的7.6倍。

圖1. 審計測試成功的聲明頁截圖(含認證審計員,LDBC SNB任務組主任和費馬科技CTO的簽名)

讀者可以通過以下鏈接訪問LDBC官網(wǎng)上的正式公布的測試結果,并下載測試報告、程序、說明文檔以及軟硬件信息等。

LDBC SNB官方網(wǎng)站 http://ldbcouncil.org/benchmarks/snb

測試報告下載: http://ldbcouncil.org/sites/default/files/LDBC_SNB_I_20200726_SF30-100-300_tugraph.pdf

關于LDBC和LDBC-SNB測試:

1.關聯(lián)數(shù)據(jù)基準委員會(LDBC,Linked Data Benchmark Council)是由Oracle、Intel等軟硬件巨頭和主流圖數(shù)據(jù)庫廠商NeoTechnology和TigerGraph等組成的非贏利機構,是圖(Graph)和RDF數(shù)據(jù)管理的基準指南制定者與測試結果發(fā)布機構。

2.社交網(wǎng)絡基準測試(SNB,Social Network Benchmark)是由關聯(lián)數(shù)據(jù)基準委員會(LDBC)開發(fā)的面向圖數(shù)據(jù)庫的基準測試(Benchmark)之一,分為交互式查詢(Interactive)和商業(yè)智能(BI)兩個場景。本次費馬公司測試了其中的交互式查詢場景,主要考察系統(tǒng)在并發(fā)情況下的更新和交互式查詢吞吐率。 與很多廠商采用的基于單項測試的評測方式相比,LDBC-SNB(Interactive)更接近真實場景并對數(shù)據(jù)庫系統(tǒng)的并發(fā)執(zhí)行性能和事務處理能力進行了更具挑戰(zhàn)性的評測。

測試詳情

據(jù)公司創(chuàng)始人洪春濤介紹,本次測試采用LDBC SNB的30G(SF30)、100G(SF100)、300G(SF300)三個規(guī)模的數(shù)據(jù)集,其中300G數(shù)據(jù)集包含8億結點53億邊及相關屬性。查詢操作由7類簡單只讀查詢,14類復雜只讀查詢和8類事務類更新查詢按LDBC SNB Interactive測試規(guī)范規(guī)定的比例組合并發(fā)執(zhí)行,并以吞吐率為性能指標??梢钥吹?,TuGraph在數(shù)據(jù)量增大時仍能保持較高的性能,體現(xiàn)了其對大規(guī)模數(shù)據(jù)的良好支撐能力。

下表為不同數(shù)據(jù)規(guī)模下的測試結果,吞吐率(OPS)表示每秒完成的操作次數(shù)。

表1. 不同數(shù)據(jù)規(guī)模SF30(30GB),SF100(100GB)和SF300(300GB)的測試結果

CTO朱曉偉表示,公司在測試環(huán)境準備、測試數(shù)據(jù)生成和導入、測試例程序的安裝和執(zhí)行、結果正確性的驗證方面都嚴格遵守LDBC-SNB的規(guī)范。整個測試過程由LDBC認證的評估師在其租用的標準云系統(tǒng)上操作完成,并對測試代碼進行了詳細的評審。整個測試環(huán)境和測試過程均完整披露并可在LDBC網(wǎng)站上公開下載,保證了測試結果的可信性和公正性。

LDBC-SNB Interactive的主要測試要求包括:基準程序會通過多個客戶端并發(fā)地發(fā)送各類讀寫請求到服務器端,每個請求都有相應的計劃時間,數(shù)據(jù)庫需要盡可能地使得所有操作都按計劃正常進行;一旦某個操作晚于計劃時間超過1秒以上則視作超時,如果超時比例大于5%則無法通過測試,對圖數(shù)據(jù)庫的更新和查詢性能提出了很高的要求;查詢分為7類簡單查詢和14類復雜查詢,每類復雜查詢在不同數(shù)據(jù)規(guī)模下根據(jù)其復雜度以不同的頻率混合在一起,簡單查詢則穿插在這些復雜查詢之間;8類更新操作中不少都涉及多個數(shù)據(jù)對象的更新,因此需要ACID事務的支持來保證操作的正確性,SNB規(guī)范要求隔離級別至少達到提交讀(Read Committed),并在審計過程中對ACID支持進行了特別的測試。

值得注意的是,在本次測試中,TuGraph的超時比例為0%,且SNB實現(xiàn)了最高的隔離級別可串行化(Serializable),說明TuGraph在提供了高級別的事務隔離保證的同時仍然獲得了低延遲和遠遠超過其它數(shù)據(jù)庫的吞吐率。

CTO朱曉偉表示,相比同類型的圖數(shù)據(jù)庫產(chǎn)品,TuGraph可以支持更大的數(shù)據(jù)量,提供更快的響應,支持更多的并發(fā)查詢,因此也更適應大數(shù)據(jù)時代。TuGraph在系統(tǒng)的設計目標上圍繞實時圖數(shù)據(jù)分析的特點展開:一方面,絕大部分請求是在最新數(shù)據(jù)上的只讀查詢,因此存儲引擎需要面向讀優(yōu)化,并需要對其中一些查詢操作采用并行的方式進行處理;另一方面,數(shù)據(jù)庫需要在快速完成這些只讀查詢的同時處理源源不斷的數(shù)據(jù)更新,而這些修改請求可能來自多個客戶端,因此需要完善的事務支持,并需要盡可能地避免使用全局鎖導致并發(fā)度的降低。為此,TuGraph實現(xiàn)了多版本的存儲使得只讀事務可以無阻塞地進行,并且提供了樂觀和悲觀兩種模式的讀寫事務,從而針對不同情形提供最優(yōu)化的事務管理,在并發(fā)度和讀寫效率間取得較好的權衡;針對復雜的分析任務,提供了并行遍歷和迭代式圖計算的接口,通過多個線程的協(xié)同工作來保障任務不會超時并持續(xù)占用系統(tǒng)資源。除此之外,TuGraph提供了豐富的開發(fā)接口:不僅支持描述式的查詢語言OpenCypher以方便用戶更快地上手和開發(fā)原型,還提供了過程式的核心API讓用戶可以通過存儲過程的方式對一些需要追求極致性能的場景進行加速;存儲過程支持開發(fā)效率較高的Python和執(zhí)行效率較高的C++,未來還將增加受眾較廣的Java作為開發(fā)語言;訪問上同時支持RESTful和RPC兩種方式供用戶選擇。這些豐富的選項使得用戶可以在開發(fā)和生產(chǎn)環(huán)境上根據(jù)各自不同的場景和需求靈活地選擇最適合的使用方式,在易用性和高效性兩方面取得更好的平衡。

關于費馬

根據(jù)36氪此前報道,費馬科技成立于2016年5月,擁有圖數(shù)據(jù)平臺(TuGraph,曾用名LightGraph)、圖分析平臺(PandaGraph)兩大產(chǎn)品。TuGraph的定位是高性能單機版圖數(shù)據(jù)庫,這也是目前市場占有率最高的產(chǎn)品類型。費馬科技基于創(chuàng)始團隊在圖計算領域積累的經(jīng)驗以及領先的科研成果,研發(fā)出的TuGraph具有高性能、大數(shù)據(jù)量以及穩(wěn)定易用的特點,因此被廣大客戶所信賴。目前,費馬科技的產(chǎn)品已經(jīng)被多個領域的頭部客戶所采用,包括京東數(shù)科、大型國有銀行及商業(yè)銀行等金融業(yè)客戶,以及國家電網(wǎng)、中國商飛、西門子等工業(yè)部門用戶。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

編輯推薦