十億級(jí)數(shù)據(jù)，秒級(jí)響應(yīng) | 觀遠(yuǎn)數(shù)據(jù)重磅發(fā)布「極速分析引擎」黑科技

2020-04-21 18:31 來(lái)源：A5專欄我來(lái)投稿撤稿糾錯(cuò)

　域名預(yù)訂/競(jìng)價(jià)，好“米”不錯(cuò)過(guò)

從Excel、報(bào)表系統(tǒng)到傳統(tǒng)BI，企業(yè)數(shù)據(jù)分析工具進(jìn)化的同時(shí)，背后需要支持的數(shù)據(jù)承載量也在以更快的速度一路攀升。

(各數(shù)據(jù)分析工具適合承載的數(shù)據(jù)量)

以一家連鎖零售企業(yè)為例，如果門(mén)店有2000家，在售SKU有5000個(gè)，一天單店單品庫(kù)存數(shù)據(jù)量就達(dá)到了1000萬(wàn)，一周就可能破億。

為了能讓性能跟上企業(yè)數(shù)據(jù)發(fā)展的速度，確保用戶在億級(jí)、十億級(jí)數(shù)據(jù)集的基礎(chǔ)上還能做絲滑的拖拽式數(shù)據(jù)分析和動(dòng)態(tài)查詢，同時(shí)又不會(huì)給IT人員帶來(lái)額外的數(shù)據(jù)管理與運(yùn)維壓力。觀遠(yuǎn)數(shù)據(jù)在2019開(kāi)始研究基于海量數(shù)據(jù)計(jì)算查詢的加速組件，并于2020年3月正式推出“極速分析引擎”黑科技功能，真正做到十億級(jí)數(shù)據(jù)秒級(jí)響應(yīng)。

“極速分析引擎”是嵌入在觀遠(yuǎn)一站式智能數(shù)據(jù)分析平臺(tái)中的一套計(jì)算查詢加速組件，在集群模式下最快支持十億級(jí)以上數(shù)據(jù)秒級(jí)響應(yīng)速度。適用于零售行業(yè)大數(shù)據(jù)量、大寬表、高并發(fā)的數(shù)據(jù)分析情況，比如海量庫(kù)存數(shù)據(jù)聚合分析與查詢、訂單分析、商品分析等場(chǎng)景。可以滿足業(yè)務(wù)人員持續(xù)的探索式自助分析、即席查詢、動(dòng)態(tài)分析的需求，保持連貫的分析思路，打造沉浸式分析體驗(yàn)，深挖數(shù)據(jù)價(jià)值，高效洞悉業(yè)務(wù)。

“極速分析引擎”到底有多快?我們?cè)趯?shí)驗(yàn)室環(huán)境下做了一個(gè)性能測(cè)試。測(cè)試的機(jī)器為16核128G內(nèi)存的單節(jié)點(diǎn)，未做加速組件的獨(dú)立部署(實(shí)際上加速組件可單獨(dú)部署，加速效果更明顯)。

Demo1：極速查詢演示視頻演示-https://v.qq.com/x/page/u09471ficps.html

以上案例中，我們模擬了某零售客戶基于訂單商品明細(xì)數(shù)據(jù)的任意時(shí)間區(qū)段銷量、銷售額、成本的聚合分析。

可以看到，左右兩張表都是基于同一張1億行的訂單明細(xì)表進(jìn)行聚合分析。區(qū)別在于左邊的表是使用的是Guan-Index數(shù)據(jù)集，是利用Spark計(jì)算引擎來(lái)進(jìn)行計(jì)算的。而右邊的表則是使用“高性能查詢表”，利用“極速分析引擎”來(lái)做加速查詢的。不難發(fā)現(xiàn)，在切換日期區(qū)間時(shí)，右側(cè)表格基本上能夠在2~3秒內(nèi)返回計(jì)算結(jié)果，而左側(cè)表格則需要10秒才能返回，整體的性能提升達(dá)到3~5倍，真正做到億級(jí)數(shù)據(jù)秒級(jí)響應(yīng)。

Demo2：一億行數(shù)據(jù)自由拖拽式分析-https://v.qq.com/x/page/a094711g02i.html

還是基于以上數(shù)據(jù)，我們?cè)僮鲆幌伦杂赏献降臄?shù)據(jù)分析進(jìn)行測(cè)試。從Demo中可以看到，基于1億行訂單明細(xì)數(shù)據(jù)的自由拖拽分析，也可以做到秒級(jí)響應(yīng)，絲滑體驗(yàn)。

如此強(qiáng)大的功能要怎么使用？

當(dāng)用戶導(dǎo)入千萬(wàn)級(jí)以上Guan-Index數(shù)據(jù)集，或者通過(guò)Smart ETL生成同等體量的數(shù)據(jù)集后，想要使用“極速分析引擎”來(lái)進(jìn)行查詢加速時(shí)，我們可以大致分三步進(jìn)行操作。

1、配置數(shù)據(jù)集

我們可以進(jìn)入到數(shù)據(jù)集詳情頁(yè)“高級(jí)選項(xiàng)”欄，將數(shù)據(jù)集配置為“高性能查詢表”。

2、設(shè)置分區(qū)字段

用戶需要設(shè)置分區(qū)字段——分區(qū)是為了數(shù)據(jù)在存儲(chǔ)時(shí)能合理地分片，以減少數(shù)據(jù)查詢時(shí)的數(shù)據(jù)掃描。一般建議使用日期字段來(lái)做分區(qū)，分區(qū)方式建議設(shè)置為“月”或者“日”。使用日期字段做分區(qū)，可以有效地控制分區(qū)數(shù)量，不至于把分區(qū)做得過(guò)粗或者過(guò)細(xì)。如果沒(méi)有日期字段，也可以謹(jǐn)慎選擇其他字段進(jìn)行分析，這時(shí)需要控制好分區(qū)字段的枚舉數(shù)量，一定不要選擇類似訂單ID之類的流水號(hào)，或者數(shù)值類字段作為分區(qū)字段。

3、確認(rèn)執(zhí)行

配置完分區(qū)字段后，點(diǎn)擊“確認(rèn)”即可以開(kāi)始模式切換。數(shù)據(jù)集數(shù)據(jù)量大的時(shí)候，數(shù)據(jù)導(dǎo)入需要花費(fèi)一定的時(shí)間，請(qǐng)耐心等候。內(nèi)部測(cè)試，3億行*26列的數(shù)據(jù)集導(dǎo)入花費(fèi)12min左右。數(shù)據(jù)集更新也會(huì)觸發(fā)數(shù)據(jù)重新導(dǎo)入，因此一般建議高性能查詢表更新頻率不超過(guò)一天一次。

以下就是一個(gè)配置了“高性能查詢表”的ETL輸出數(shù)據(jù)集，我們看到表面看起來(lái)它似乎與一般的ETL輸出數(shù)據(jù)集并無(wú)二異。但我們?cè)谑褂盟鼊?chuàng)建卡片時(shí)，卻是利用“極速查詢引擎”來(lái)查詢數(shù)據(jù)，能夠提供飛一般的體驗(yàn)。

“極速分析引擎”適用于哪些場(chǎng)景？

目前，“高性能查詢表”適用于數(shù)據(jù)量大于等于1000萬(wàn)行以上的數(shù)據(jù)集，可大大加速卡片端數(shù)據(jù)查詢的效率。并且特別適合海量數(shù)據(jù)下的OLAP查詢，適合在大寬表上做任意維度的數(shù)據(jù)聚合、切片(篩選)，也可以做明細(xì)數(shù)據(jù)的查詢。這些查詢相比直接使用Spark作為計(jì)算引擎，一般都能提供3~5倍的性能提升，如果硬件資源寬裕，將加速組件獨(dú)立部署，將能獲得更為優(yōu)越的極速體驗(yàn)。

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

相關(guān)標(biāo)簽: 數(shù)據(jù)分析; 大數(shù)據(jù)技術(shù)

相關(guān)文章

全國(guó)生物相分離和相變學(xué)術(shù)研討會(huì)圓滿落幕榮聯(lián)科技集團(tuán)亮相頂尖學(xué)術(shù)盛會(huì)

2023年6月1日至4日，第三屆全國(guó)生物相分離和相變學(xué)術(shù)研討會(huì)暨中國(guó)生物物理學(xué)會(huì)生物大分子相分離與相變分會(huì)年會(huì)在上海成功舉辦，榮聯(lián)科技集團(tuán)攜冷凍電鏡數(shù)據(jù)分析整體解決方案亮相活動(dòng)，云生數(shù)據(jù)副總經(jīng)理田鳳進(jìn)行了精彩的報(bào)告分享。本次盛會(huì)由中國(guó)生物物理學(xué)會(huì)生物大分子相分離與相變分會(huì)主辦，中國(guó)科學(xué)院上海有機(jī)化學(xué)

標(biāo)簽：

數(shù)據(jù)分析
有哪些免費(fèi)且強(qiáng)大的數(shù)據(jù)分析BI工具？

如今，諸多企業(yè)開(kāi)始進(jìn)入數(shù)據(jù)應(yīng)用階段，開(kāi)始追求數(shù)據(jù)對(duì)業(yè)務(wù)的實(shí)質(zhì)性提升。然而，一些企業(yè)雖然認(rèn)識(shí)到了數(shù)據(jù)的價(jià)值，卻由于缺乏一套高效好用的數(shù)據(jù)分析工具，導(dǎo)致數(shù)據(jù)應(yīng)用效果并不理想。在一些企業(yè)中，尤其是中小企業(yè)，由于缺乏預(yù)算，仍然在使用Excel等傳統(tǒng)工具進(jìn)行數(shù)據(jù)分析和可視化展現(xiàn)，需要手動(dòng)整合和處理數(shù)據(jù)，耗時(shí)耗

標(biāo)簽：

數(shù)據(jù)分析
Oxylabs 首席執(zhí)行官：了解靜態(tài)和動(dòng)態(tài)數(shù)據(jù)

數(shù)據(jù)收集的操作行為受到越來(lái)越多的關(guān)注,也變得越來(lái)越復(fù)雜。網(wǎng)絡(luò)抓取以及自動(dòng)獲取過(guò)程總體來(lái)說(shuō)極大地改變了數(shù)據(jù)收集的性質(zhì),舊的挑戰(zhàn)得到解決,而新的問(wèn)題也隨之浮現(xiàn)出來(lái)。

標(biāo)簽：

數(shù)據(jù)分析
大數(shù)據(jù)如何服務(wù)“三農(nóng)”？北京佳格天地受邀出席2022世界數(shù)字農(nóng)業(yè)大會(huì)作專題分享

日前,2022世界數(shù)字農(nóng)業(yè)大會(huì)舉行。大會(huì)以“種鑄強(qiáng)芯,數(shù)領(lǐng)未來(lái)”為主題,開(kāi)設(shè)多場(chǎng)數(shù)字農(nóng)業(yè)云端專題論壇,北京佳格天地科技有限公司受邀出席”農(nóng)業(yè)農(nóng)村大數(shù)據(jù)應(yīng)用論壇“,同與會(huì)嘉賓分享了農(nóng)業(yè)大數(shù)據(jù)的創(chuàng)新應(yīng)用。

標(biāo)簽：

大數(shù)據(jù)

大數(shù)據(jù)應(yīng)用

大數(shù)據(jù)技術(shù)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)副秘書(shū)長(zhǎng)裴瑋一行到訪極光考察指導(dǎo)

近日，中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)副秘書(shū)長(zhǎng)裴瑋，中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)中互網(wǎng)來(lái)總經(jīng)理宛嚴(yán)，中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)中互數(shù)智總經(jīng)理李曉昂一行到訪極光公司總部，現(xiàn)場(chǎng)參觀極光發(fā)展歷程、極光榮譽(yù)墻、極光價(jià)值觀文化墻等

標(biāo)簽：

數(shù)據(jù)存儲(chǔ)

數(shù)據(jù)分析

實(shí)測(cè)5家BI產(chǎn)品，誰(shuí)是中國(guó)的Power BI？

把脈中國(guó)數(shù)據(jù)智能化
“多云多模型”時(shí)代到來(lái)，火山引擎的數(shù)字化升級(jí)“刀法”

2023年，幾乎可以被定義為中國(guó)互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅，徹底點(diǎn)燃國(guó)內(nèi)的大模型賽道，曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場(chǎng)，接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了，沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時(shí)，大模型的快速發(fā)展也改變了云市場(chǎng)的現(xiàn)狀，企業(yè)對(duì)

標(biāo)簽：

數(shù)字化技術(shù)
數(shù)新網(wǎng)絡(luò)DataCyber云數(shù)據(jù)平臺(tái)入選《愛(ài)分析 · 數(shù)據(jù)智能廠商全景報(bào)告》

近日，數(shù)字化市場(chǎng)研究咨詢機(jī)構(gòu)愛(ài)分析發(fā)布了《2022愛(ài)分析·數(shù)據(jù)智能廠商全景報(bào)告》，愛(ài)分析從技術(shù)研發(fā)能力、服務(wù)客戶數(shù)量、收入規(guī)模等維度對(duì)廠商進(jìn)行了全面專業(yè)的評(píng)估

標(biāo)簽：

大數(shù)據(jù)
百分點(diǎn)科技在首屆中國(guó)大數(shù)據(jù)大賽中成功奪冠

2022年11月18日,首個(gè)國(guó)家級(jí)大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國(guó)大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術(shù)發(fā)展司數(shù)字經(jīng)濟(jì)推進(jìn)處處長(zhǎng)張建倫,中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院副院長(zhǎng)孫文龍出席頒獎(jiǎng)典禮并致辭

標(biāo)簽：

大數(shù)據(jù)

大數(shù)據(jù)產(chǎn)業(yè)
大咖云集 | 2022數(shù)據(jù)資產(chǎn)（廈門(mén)）論壇成功舉辦

2022年11月17日，在廈門(mén)市工業(yè)和信息化局的指導(dǎo)下，以“數(shù)據(jù)確權(quán)”為主題的2022數(shù)據(jù)資產(chǎn)(廈門(mén))論壇在廈門(mén)成功舉辦。本次論壇以“數(shù)據(jù)確權(quán)”為主題，由廈門(mén)市互聯(lián)網(wǎng)域名應(yīng)用服務(wù)產(chǎn)業(yè)協(xié)會(huì)和構(gòu)信網(wǎng)(公信.中國(guó))聯(lián)合主辦

標(biāo)簽：

數(shù)據(jù)中心

大數(shù)據(jù)
睿帆科技成功入選《2022愛(ài)分析·信創(chuàng)廠商全景報(bào)告》

近日，國(guó)內(nèi)知名數(shù)字化市場(chǎng)研究咨詢機(jī)構(gòu)愛(ài)分析正式發(fā)布《2022愛(ài)分析·信創(chuàng)廠商全景報(bào)告》(以下簡(jiǎn)稱“報(bào)告”)。報(bào)告綜合考慮企業(yè)關(guān)注度、行業(yè)落地進(jìn)展等因素，遴選出在信創(chuàng)市場(chǎng)中具備成熟解決方案和落地能力的廠商。

標(biāo)簽：

數(shù)據(jù)庫(kù)

大數(shù)據(jù)

百望云楊正道:數(shù)字經(jīng)濟(jì)正在催生由數(shù)據(jù)驅(qū)動(dòng)的“智能監(jiān)管”

10月31日下午,由數(shù)博會(huì)執(zhí)委會(huì)主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽(yáng)大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會(huì)“實(shí)踐先行觀公共數(shù)據(jù)價(jià)值與應(yīng)用”活動(dòng)成功舉辦。

標(biāo)簽：

數(shù)字技術(shù)

大數(shù)據(jù)
第一屆中國(guó)大數(shù)據(jù)大賽正式啟動(dòng)，3大賽道全面開(kāi)放

近日，由中國(guó)國(guó)際數(shù)字經(jīng)濟(jì)博覽會(huì)組委會(huì)主辦，中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國(guó)大數(shù)據(jù)大賽”(簡(jiǎn)稱大數(shù)據(jù)大賽)正式啟動(dòng)。

標(biāo)簽：

大數(shù)據(jù)

大數(shù)據(jù)產(chǎn)業(yè)
光點(diǎn)數(shù)據(jù)中臺(tái)產(chǎn)品GI大數(shù)據(jù)中臺(tái)與人大金倉(cāng)完成兼容認(rèn)證

廣州光點(diǎn)信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺(tái)產(chǎn)品GI大數(shù)據(jù)中臺(tái)V2.0產(chǎn)品是國(guó)內(nèi)率先推出符合新創(chuàng)標(biāo)準(zhǔn)的中臺(tái)產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺(tái)。

標(biāo)簽：

數(shù)據(jù)中臺(tái)

大數(shù)據(jù)
光點(diǎn)數(shù)據(jù)中臺(tái)產(chǎn)品GI大數(shù)據(jù)中臺(tái)與統(tǒng)信軟件完成兼容認(rèn)證

廣州光點(diǎn)信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺(tái)產(chǎn)品GI大數(shù)據(jù)中臺(tái)V2.0產(chǎn)品是國(guó)內(nèi)率先推出符合新創(chuàng)標(biāo)準(zhǔn)的中臺(tái)產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺(tái)

標(biāo)簽：

數(shù)據(jù)中臺(tái)

大數(shù)據(jù)

加載更多

十億級(jí)數(shù)據(jù)，秒級(jí)響應(yīng) | 觀遠(yuǎn)數(shù)據(jù)重磅發(fā)布「極速分析引擎」黑科技

相關(guān)文章

全國(guó)生物相分離和相變學(xué)術(shù)研討會(huì)圓滿落幕榮聯(lián)科技集團(tuán)亮相頂尖學(xué)術(shù)盛會(huì)

有哪些免費(fèi)且強(qiáng)大的數(shù)據(jù)分析BI工具？

Oxylabs 首席執(zhí)行官：了解靜態(tài)和動(dòng)態(tài)數(shù)據(jù)

大數(shù)據(jù)如何服務(wù)“三農(nóng)”？北京佳格天地受邀出席2022世界數(shù)字農(nóng)業(yè)大會(huì)作專題分享

中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)副秘書(shū)長(zhǎng)裴瑋一行到訪極光考察指導(dǎo)

實(shí)測(cè)5家BI產(chǎn)品，誰(shuí)是中國(guó)的Power BI？

“多云多模型”時(shí)代到來(lái)，火山引擎的數(shù)字化升級(jí)“刀法”

數(shù)新網(wǎng)絡(luò)DataCyber云數(shù)據(jù)平臺(tái)入選《愛(ài)分析 · 數(shù)據(jù)智能廠商全景報(bào)告》

百分點(diǎn)科技在首屆中國(guó)大數(shù)據(jù)大賽中成功奪冠

大咖云集 | 2022數(shù)據(jù)資產(chǎn)（廈門(mén)）論壇成功舉辦

睿帆科技成功入選《2022愛(ài)分析·信創(chuàng)廠商全景報(bào)告》

百望云楊正道:數(shù)字經(jīng)濟(jì)正在催生由數(shù)據(jù)驅(qū)動(dòng)的“智能監(jiān)管”

第一屆中國(guó)大數(shù)據(jù)大賽正式啟動(dòng)，3大賽道全面開(kāi)放

光點(diǎn)數(shù)據(jù)中臺(tái)產(chǎn)品GI大數(shù)據(jù)中臺(tái)與人大金倉(cāng)完成兼容認(rèn)證

光點(diǎn)數(shù)據(jù)中臺(tái)產(chǎn)品GI大數(shù)據(jù)中臺(tái)與統(tǒng)信軟件完成兼容認(rèn)證

熱門(mén)排行

編輯推薦