上周,全球計算機多媒體頂級會議ICME 2019(國際多媒體與博覽會議)在上海圓滿結(jié)束,網(wǎng)易易盾深度學習資深研發(fā)工程師姚益武受邀出席會議,展示了網(wǎng)易易盾在深度卷積神經(jīng)網(wǎng)絡int8量化算法上的最新研究成果。
ICME簽到處
ICME由 IEEE 下設的計算機學會、電路與系統(tǒng)學會、通信學會、信號處理學會聯(lián)合舉辦,始于 2000 年,至今已經(jīng)連續(xù)舉辦了 19 屆,是計算機多媒體領(lǐng)域最重要的國際會議之一。ICME是學術(shù)界交流多媒體領(lǐng)域最近研究成果的旗艦論壇,也是工業(yè)界展示最新產(chǎn)品或系統(tǒng)的平臺,涵蓋文本分析、圖形圖像、視頻、語音音頻等多媒體數(shù)據(jù)的處理、傳輸、分析與應用等主題。
在本次會議上,網(wǎng)易易盾深度學習資深研發(fā)工程師姚益武發(fā)表了題為《Efficient Implementation of Convolutional Neural Networks with End to End Integer Only Dataflow》的學術(shù)論文,展示了有助于構(gòu)建端到端的純整數(shù)運算通路的int8量化新算法。
姚益武表示,Int8量化由于精度損失低,能夠?qū)崿F(xiàn)4倍壓縮比,且兼容于現(xiàn)有的整數(shù)運算單元,在產(chǎn)業(yè)界已經(jīng)獲得廣泛應用,包括TensorFlow-Lite與TensorRT涉及的int8量化算法。
他指出,TensorFlow-Lite中的in8量化屬于線性量化方法,但是為了執(zhí)行量化卷積或矩陣乘法運算,需要提供額外的浮點乘因子,因而所構(gòu)建的量化網(wǎng)絡并非純整數(shù)運算通路,并且該量化算法需要借助重訓練以恢復精度損失。
“TensorRT中的線性int8量化方法,能夠在NVIDIA平臺上提供高吞吐、低延遲的推理性能,深度網(wǎng)絡的權(quán)重按非閾值方式映射到int8區(qū)間,激活輸出則按照閾值方式完成int8量化,每一層的實現(xiàn)方式相對簡單。然而當前層的整數(shù)結(jié)果需要還原回浮點實數(shù),方能傳遞至下一層,因此也不能構(gòu)建端到端的純整數(shù)運算通路。”
姚益武在ICME 2019上提出的int8量化新算法有助于構(gòu)建端到端的純整數(shù)運算通路,且統(tǒng)一表示層的設計簡化了網(wǎng)絡結(jié)構(gòu)的拓撲設計,因此非常適合在現(xiàn)有硬件平臺上實現(xiàn),包括CPU/GPU/FPGA等通用計算平臺。另外,所提出的int8量化算法,在復雜分類網(wǎng)絡與目標檢測模型上獲得了與TensorRT相接近的推理精度,工業(yè)應用潛力比較大。
“應用于易盾內(nèi)容安全圖像識別上,在確保業(yè)務模型推理精度的前提下,其服務的響應時間能得到顯著降低。”姚益武進一步解釋了int8量化算法在網(wǎng)易易盾業(yè)務上的應用潛力。
參會的第三方專家點評網(wǎng)易易盾這一研究成果時表示,該方法可以保持相對較高的準確性,有效解決TensorRT的問題。而另外個專家則更進一步指出,int8量化新算法能夠簡化CNNs中的運算,并讓精度損失顯得微不足道。
據(jù)悉,姚益武為網(wǎng)易易盾實驗室成員,該實驗室在2018年還研發(fā)出了一種對多視角多模態(tài)特征信息進行有效融合的自編碼器神經(jīng)網(wǎng)絡,在準確率、NMI、Purity、ARI等各項性能指標上,較當下多項國際先進的多視角多模態(tài)信息融合技術(shù)有顯著性的領(lǐng)先。
網(wǎng)易易盾實驗室成立于2016年,隸屬于網(wǎng)易安全部,目前擁有數(shù)十名AI算法專家、安全研究員、政策法規(guī)研究專員等。實驗室目前專注探索人工智能技術(shù)在安全領(lǐng)域的應用,以及安全相關(guān)法規(guī)、社會責任等研究。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!