當(dāng)前位置:首頁 >  IDC >  服務(wù)器 >  正文

基因?qū)W的終極密碼,此刻就藏在HPC之中

 2018-08-31 16:47  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

基因?qū)W正在改變?nèi)祟惖奈磥恚槍?duì)遺傳出生缺陷的產(chǎn)前檢測,腫瘤基因檢測,病毒和細(xì)菌的基因研究等,通過基因測序都能找出“元兇”。

所以,基因測序產(chǎn)業(yè)正迎來一個(gè)發(fā)展的大時(shí)代,相關(guān)數(shù)據(jù)統(tǒng)計(jì),基因測序從2007-2013年復(fù)合增長率為33.53%,全球的市場規(guī)模2007年只有800萬美元,而2018年將達(dá)到約117億美元,說明基因測序的市場已經(jīng)逐漸成熟。

如今,基因測序技術(shù)已被列為國家重點(diǎn)發(fā)展產(chǎn)業(yè)。據(jù)研究,每年的基因測序分析增長會(huì)在30%以上,數(shù)據(jù)量也將是越來越多,如何傳輸,保存和管理海量的基因數(shù)據(jù)是一個(gè)非常棘手的問題所以,HPC正被廣泛應(yīng)用于基因測序行業(yè)。

年輕的諾禾致源,怎么做到領(lǐng)跑基因測序行業(yè)

基因測序行業(yè)是一個(gè)風(fēng)口上的行業(yè),也充斥著大量的新老玩家,但同時(shí)基因測序又是一個(gè)嚴(yán)謹(jǐn)?shù)男袠I(yè),只有抱著科學(xué)合理的出發(fā)點(diǎn),在不斷試錯(cuò),探索前進(jìn),才能最終勝出。諾禾致源顯然正沿著這樣一條路在前行著。

在國內(nèi)基因測序領(lǐng)域,諾禾致源是一個(gè)標(biāo)志性的企業(yè)。作為目前國內(nèi)基因測序領(lǐng)域的佼佼者,諾禾致源的業(yè)務(wù)覆蓋科技服務(wù)、腫瘤基因檢測及遺傳檢測三大領(lǐng)域,為全球研究型大學(xué)、科研院所、醫(yī)院、醫(yī)藥研發(fā)企業(yè)、農(nóng)業(yè)企業(yè)等提供基因測序、質(zhì)譜分析和生物信息技術(shù)支持等服務(wù)。

成立于2011年3月的諾禾致源最初以科技服務(wù)為主。2012 年,諾禾致源開始拓展腫瘤基因檢測服務(wù)。發(fā)展至今,諾禾致源業(yè)務(wù)已經(jīng)覆蓋科技服務(wù)、腫瘤基因檢測及遺傳檢測三大領(lǐng)域。

實(shí)際上,基因測序行業(yè)是一個(gè)知識(shí)密集型的產(chǎn)業(yè),衡量的標(biāo)準(zhǔn)有兩個(gè),一是對(duì)基因?qū)W術(shù)的貢獻(xiàn)度,二是先進(jìn)基因測序儀的擁有量。

那么首先,在基因?qū)W術(shù)的貢獻(xiàn)度方面。截止2018年6月,諾禾致源與項(xiàng)目伙伴合作發(fā)表SCI文章總計(jì)330余篇,累積影響因子大于2120;目前已取得軟件著作權(quán)115項(xiàng),自主研發(fā)專利49項(xiàng)。

其次,目前諾禾致源已在全球運(yùn)行25臺(tái)NovaSeq、20臺(tái)PacBio Sequel、30臺(tái)HiSeq X、11臺(tái)HiSeq 2000/2500/4000、4臺(tái)MiSeq、4臺(tái)NextSeq 500、6臺(tái)Life Ion Proton(DA8600)、2臺(tái)S5XL和5套Q Exactive™ HF-X等最先進(jìn)的基因測序儀,建立了亞洲通量規(guī)模最大的基因測序平臺(tái),將實(shí)現(xiàn)每年280,000人全基因組測序的超高通量。同時(shí),全國首家引入Q Exactive™ HF-X高端質(zhì)譜平臺(tái),打造最先進(jìn)的生物質(zhì)譜中心,為客戶提供全面、深入的多組學(xué)解決方案。

除了這兩個(gè)關(guān)鍵點(diǎn)之外,諾禾致源的生態(tài)建設(shè)也已非常完善,合作伙伴遍布全球,包括超過1920家科研院所和高校、720余家醫(yī)院、1430余家醫(yī)藥和農(nóng)業(yè)企業(yè)等。諾禾致源的企業(yè)夢想是成為全球領(lǐng)先的基因組學(xué)產(chǎn)品和服務(wù)提供者。

算法和數(shù)據(jù)之后,計(jì)算的三大瓶頸如何打破?

基因測序最核心的資產(chǎn)就是基因測序儀產(chǎn)生的龐大數(shù)據(jù)量,所以隨著基因測序的通量越來越大,行業(yè)產(chǎn)出的數(shù)據(jù)也越來越多,相對(duì)而言對(duì)存儲(chǔ)、計(jì)算平臺(tái)的能力也提出更高要求。

所謂高通量基因測序,是通過測序技術(shù)解析生物DNA分析排序特征,包括序列圖譜構(gòu)建,序列比對(duì),變異檢測等高性能計(jì)算。尤其在人類健康研究中,需要了解海量蛋白質(zhì)的結(jié)構(gòu),功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療。基于生物大分子結(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計(jì)等等。

所以在生物信息學(xué)的處理過程中會(huì)用到大量的軟件,例如面向序列組裝的SOAPDenovo,ALLPATHS-LG,F(xiàn)alcon, Trinity等;面向序列對(duì)比:BWA, Blast, bowtie2等;面向序列分析: CLUSTAL,HMMER等;面向進(jìn)化樹分析:PHYLIP,TreeBest, MrBayes等。

同時(shí)生物算法正逐漸成熟,生物數(shù)據(jù)通量也急劇提升,這必然會(huì)帶來對(duì)分析軟件和流程的全面優(yōu)化,所以計(jì)算力成為了精準(zhǔn)醫(yī)療行業(yè)面臨的最大瓶頸。對(duì)諾禾致源來說,對(duì)HPC的需求也遇到很多挑戰(zhàn)。

第一,數(shù)據(jù)量巨大。正因?yàn)榛驕y序儀產(chǎn)生的數(shù)據(jù)量是非常巨大的,這就要求在HPC系統(tǒng)中必須配置海量存儲(chǔ),滿足測序數(shù)據(jù)的存放。

第二,內(nèi)存的需求大。在序列對(duì)比或者拼接階段,需要一次性將海量數(shù)據(jù)載入到內(nèi)存中并且加以處理,如果內(nèi)存不夠或者性能不優(yōu),很可能無法進(jìn)行對(duì)比或者下一步的計(jì)算等工作,因此,我們建議對(duì)于生物信息學(xué)應(yīng)用環(huán)境,需要配置胖節(jié)點(diǎn)或者大內(nèi)存節(jié)點(diǎn),滿足數(shù)據(jù)載入和分析,充分提高工作效率。

第三,計(jì)算量大。對(duì)于不同生物信息學(xué)程序而言,基于不同算法的對(duì)于CPU的要求也不盡相同,但是總體計(jì)算量都十分巨大,有的支持并行,有的軟件在單節(jié)點(diǎn)內(nèi)進(jìn)行計(jì)算,總而言之,與其他高性能計(jì)算應(yīng)用相似,生物信息學(xué)類的計(jì)算也為CPU密集型的。

很明顯,如果有HPC的長期穩(wěn)定的支持,將會(huì)助力諾禾致源對(duì)未來的發(fā)展,在多方考察之后,諾禾致源選擇了聯(lián)想HPC成為服務(wù)商。聯(lián)想是如何滿足諾禾致源的需求的呢?

用H PC 筑底, 諾禾致源 背后的聯(lián)想之力

聯(lián)想作為國內(nèi)HPC的領(lǐng)軍者,首先對(duì)諾禾致源的問題做了縝密的需求分析。聯(lián)想認(rèn)為:生物信息學(xué)類計(jì)算的核心內(nèi)容是內(nèi)存密集型,存儲(chǔ)密集型,結(jié)合聯(lián)想多年來的經(jīng)驗(yàn),為諾禾致源提供了針對(duì)化專業(yè)化的解決方案。

主要解決諾禾致源對(duì)高性能、內(nèi)存、存儲(chǔ)和穩(wěn)定性的四大問題。

首先,對(duì)于高性能計(jì)算而言,一方面是浮點(diǎn)處理性能,另一方面為CPU本身的綜合性能,聯(lián)想結(jié)合生物信息學(xué)行業(yè)的特點(diǎn),推薦使用Intel處理器,不僅實(shí)現(xiàn)了較高的處理性能,并且在能效比,內(nèi)存支持,以及CPU本身的架構(gòu)上Intel都有很大的優(yōu)勢。

其次,在生物信息學(xué)應(yīng)用中,先期數(shù)據(jù)的載入對(duì)于內(nèi)存容量的要求越來越高,聯(lián)想采用大內(nèi)存服務(wù)器四路或者八路胖節(jié)點(diǎn),可以在單節(jié)點(diǎn)中配置最高達(dá)2TB內(nèi)存,充分達(dá)到應(yīng)用的實(shí)際需求。

其三,海量存儲(chǔ)系統(tǒng)是生物信息學(xué)計(jì)算的先決條件。聯(lián)想不僅可以提供了專業(yè)級(jí)的直連存儲(chǔ),更有通過專有的存儲(chǔ)節(jié)點(diǎn)構(gòu)建并行文件系統(tǒng)或者是分布式存儲(chǔ)系統(tǒng),接入以太網(wǎng),甚至40GB/56GB的Infiniband網(wǎng)絡(luò),總體容量可達(dá)到PB級(jí),除此之外還考慮到用戶的數(shù)據(jù)安全,數(shù)據(jù)備份等,從根本上解決了生物信息學(xué)的數(shù)據(jù)存儲(chǔ)難題。

最后,一套高穩(wěn)定性的系統(tǒng)能夠使我們的生物信息學(xué)應(yīng)用更加方便快捷,同時(shí)也能夠高效率的處理數(shù)據(jù),保證業(yè)務(wù)不中斷,聯(lián)想通過統(tǒng)一的集群監(jiān)控管理,作業(yè)調(diào)度,結(jié)合聯(lián)想高性能的服務(wù)器,從各個(gè)方面保證了整套系統(tǒng)的穩(wěn)定性,大大提高了用戶的使用穩(wěn)定性和減少了故障率,為用戶提高生產(chǎn)力提供持續(xù)不間斷的支持。

據(jù)了解,聯(lián)想提供的高性能運(yùn)算系統(tǒng),提供了將近200萬億次計(jì)算能力,配置超過10PB的存儲(chǔ)空間。本套集群很好的承載了諾禾致源華東地區(qū)的業(yè)務(wù),有效的改善公司在華東計(jì)算資源不夠的限制。

如今諾禾致源已經(jīng)擁有全球領(lǐng)先的高性能計(jì)算平臺(tái),數(shù)據(jù)中心運(yùn)算能力已提升至1727T flops,總內(nèi)存410TB,總存儲(chǔ)60.2PB,有效地支撐著生命科學(xué)研究和醫(yī)療健康兩大領(lǐng)域?qū)Υ髷?shù)據(jù)分析和存儲(chǔ)的需求。在通過高性能計(jì)算探索基因?qū)W的未來之路上,聯(lián)想HPC始終是諾禾致源最值得信任的技術(shù)服務(wù)商。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 影響云服務(wù)器性能的主要因素有哪些?

    性能是企業(yè)和云服務(wù)提供商比較關(guān)心的問題。那么為什么性能很重要,在使用美國云服務(wù)器時(shí)影響性能的因素有哪些?讓我們通過下面的文章一探究竟。

    標(biāo)簽:
    云服務(wù)器
  • 云服務(wù)器與物理機(jī)有哪些區(qū)別

    企業(yè)在選擇方面都是需要考慮很多因素,物理機(jī)就是獨(dú)立的一臺(tái)服務(wù)器,可以理解成物理機(jī)為一個(gè)大房子,這個(gè)房子的歸屬權(quán)就在你手里,而云服務(wù)器是大房子里的一個(gè)房間。

    標(biāo)簽:
    云服務(wù)器
  • 如何選擇更好的香港云服務(wù)器?

    云服務(wù)器很適合開發(fā)者和中小企業(yè)使用,不管是建站還是托管業(yè)務(wù)都可以放心使用云服務(wù)器。隨著香港云服務(wù)器越來越首歡迎,更多人關(guān)心如何選擇香港云服務(wù)器及云服務(wù)有哪些優(yōu)勢,

    標(biāo)簽:
    云服務(wù)器
  • 什么是裸機(jī)云?

    裸機(jī)云(BareMetalCloud),簡單地理解,它是一種裸機(jī)服務(wù)器,沒有預(yù)先安裝操作系統(tǒng)和應(yīng)用程序,用戶可以完全自定義配置。

    標(biāo)簽:
    云服務(wù)器
  • 香港云服務(wù)器有哪些優(yōu)勢?

    相對(duì)于物理服務(wù)器來說,云服務(wù)器使用更方便靈活,價(jià)格更優(yōu)惠,很多個(gè)人站長和小型企業(yè)都比較喜歡使用云服務(wù)器,其中香港云服務(wù)器更受歡迎。

    標(biāo)簽:
    云服務(wù)器

熱門排行

信息推薦