當今時代,信息技術(shù)日新月異,人類文明正經(jīng)歷從信息科技(IT)時代向數(shù)據(jù)科技(DT)時代的飛速變革。
一、 數(shù)據(jù)孤島阻礙數(shù)據(jù)發(fā)展
當今時代,信息技術(shù)日新月異,人類文明正經(jīng)歷從信息科技(IT)時代向數(shù)據(jù)科技(DT)時代的飛速變革。數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源的地位日益凸顯。然而,數(shù)據(jù)孤島問題突出。出于對數(shù)據(jù)安全的傳統(tǒng)保護,數(shù)據(jù)流通的各方彼此難以互信,進而形成數(shù)據(jù)壟斷,阻礙了數(shù)據(jù)的共享和利用,使得不同數(shù)據(jù)擁有方彼此的數(shù)據(jù)相互分隔,就像海上一座座孤島,互不連通。數(shù)據(jù)只有流通才能充分釋放價值。在強化數(shù)據(jù)安全與保護個人隱私的前提下,追求數(shù)據(jù)價值的最大化釋放是這個時代應(yīng)有之義。如何在保證數(shù)據(jù)安全的同時,實現(xiàn)數(shù)據(jù)“可用不可見”,這是數(shù)據(jù)安全發(fā)展亟需解決的課題。
二、 隱私計算實現(xiàn)數(shù)據(jù)“可用不可見”
隱私計算技術(shù)為實現(xiàn)數(shù)據(jù)的“可用不可見”提供了解決方案,可破解數(shù)據(jù)保護和利用之間的矛盾,已在金融、醫(yī)療、政務(wù)等領(lǐng)域開始推廣應(yīng)用。隱私計算是在保護數(shù)據(jù)本身不對外泄露的前提下實現(xiàn)數(shù)據(jù)分析計算的技術(shù)集合。隱私計算并不簡單屬于某一學科領(lǐng)域,而是一套包含密碼學、數(shù)據(jù)科學、人工智能等眾多領(lǐng)域交叉融合的跨學科技術(shù)體系。隱私計算技術(shù)包括安全多方計算(MPC)、可信執(zhí)行環(huán)境(TEE)和聯(lián)邦學習(FL)等。
1. 安全多方計算(MPC)
安全多方計算(MPC)是隱私計算在密碼學領(lǐng)域的主流技術(shù)。安全多方計算技術(shù)旨在解決數(shù)據(jù)流通共享中的安全保密問題。安全多方計算問題數(shù)學模型是:假設(shè)有n個參與方P1、P2…Pn,分別擁有自己的秘密數(shù)據(jù)x1、x2、…xn,他們希望計算函數(shù)f(x1,x2,…xn),要求在不泄漏各自秘密數(shù)據(jù)的情況下各方協(xié)同計算。計算完成時,各方只能得到函數(shù)計算結(jié)果,而不能得到其他參與方的秘密數(shù)據(jù)。安全多方計算本身也不是單一技術(shù),包括不經(jīng)意傳輸、混淆電路、秘密分享和同態(tài)加密等多種技術(shù)。
不經(jīng)意傳輸(OT) ,也稱茫然傳輸,是一種保證通信雙方隱私安全的通信協(xié)議。在一個n選k不經(jīng)意傳輸協(xié)議中,發(fā)送方將n個消息加密后發(fā)送給接收方,接收方只能解密接收方所選取的k(k<n)個加密消息,發(fā)送方無法確定接收方得到的消息是其中哪k個。ot協(xié)議可以保護接收者的隱私(選取的消息的內(nèi)容)不被發(fā)送者知道。ot協(xié)議是安全多方計算的基礎(chǔ),在混淆電路、秘密分享中,可能需要執(zhí)行大量的ot協(xié)議來完成復雜的計算,安全性和效率是設(shè)計和實現(xiàn)ot協(xié)議的重要考量。< p="">
混淆電路(GC),又稱姚氏電路,它的核心技術(shù)是將兩方參與的安全計算函數(shù)編譯成布爾電路的形式,并將真值表加密打亂,從而實現(xiàn)電路的正常輸出而又不泄露參與計算的雙方私有信息。由于所有計算都可以歸結(jié)為底層的電路運算,因此GC適應(yīng)性強,可以用在所有可以用電路表示的計算中。但在與其他安全協(xié)議進行轉(zhuǎn)化時的代價較大,電路門數(shù)量大時,計算效率較低。
秘密分享(SS),也稱秘密分割或者秘密共享,是將秘密拆成多個份額或者分片(shares) 分給多個參與方。秘密分享根據(jù)其原理可以分為基于多項式的秘密分享和加性秘密分享?;诙囗検降拿孛芊窒淼牡湫头桨甘荢hamir門限秘密分享,加性秘密分享的典型方案是Beaver 三元組。SS是最早在商業(yè)環(huán)境中應(yīng)用的安全多方計算技術(shù)之一,技術(shù)相對成熟。
同態(tài)加密是一種特殊性質(zhì)的加密方案,支持密文計算。同態(tài)加密被譽為密碼學的圣杯。通過同態(tài)加密,數(shù)據(jù)擁有方可以將數(shù)據(jù)發(fā)送給云服務(wù)提供商進行處理,而不用擔心數(shù)據(jù)的原始信息被泄露,使其天然地與云計算具有極高的親和度,成為云計算安全技術(shù)體系的制高點。當然,同態(tài)加密方案的構(gòu)造極具挑戰(zhàn)性??梢钥隙?,既高效又安全的全同態(tài)加密方案一旦構(gòu)造出來,將會極大地推進隱私計算在各類實際場景的落地。
2.聯(lián)邦學習(FL)
聯(lián)邦學習(FL)基于聯(lián)邦架構(gòu)和機器學習,是一種多個參與方在各數(shù)據(jù)不出本地的前提下共同完成某項機器學習任務(wù)的活動。通過聯(lián)邦學習,不同的數(shù)據(jù)擁有方可以在不交換數(shù)據(jù)的情況下,建立一個虛擬的共有模型,這個虛擬模型的效果等同于把數(shù)據(jù)聚合在一起建立的模型。利用聯(lián)邦學習構(gòu)造的虛擬融合,采用“數(shù)據(jù)不動模型動”的思想,不用聚合原始數(shù)據(jù),而是各自在本地進行訓練后交換中間因子,再對模型進行優(yōu)化迭代。這樣,不同數(shù)據(jù)擁有方的數(shù)據(jù)可在本地控制,同時完成聯(lián)合建模,彼此之間實現(xiàn)數(shù)據(jù)“可用不可見”。
3. 可信執(zhí)行環(huán)境(TEE)
可信執(zhí)行環(huán)境,即TEE,是一種具有運算和儲存功能,能提供安全性和完整性保護的獨立處理環(huán)境。其基本思想是:在硬件中為敏感數(shù)據(jù)單獨分配一塊隔離的內(nèi)存,所有敏感數(shù)據(jù)的計算均在這塊內(nèi)存中進行,并且除了經(jīng)過授權(quán)的接口外,硬件中的其他部分不能訪問這塊隔離的內(nèi)存中的信息,以此來實現(xiàn)敏感數(shù)據(jù)的隱私計算。TEE的核心思想是隔離。隔離機制是TEE最主要的基礎(chǔ)。通過隔離的安全執(zhí)行空間,提供對代碼和數(shù)據(jù)的機密性和完整性保護。目前最有代表、應(yīng)用最多的技術(shù)方案是ARM的TrustZone和Intel的SGX。
小結(jié)
作為一類技術(shù)的集合,隱私計算技術(shù)體系的劃分并未統(tǒng)一。除了上述技術(shù)之外,零知識證明、差分隱私等也常被納入其中。伴隨著隱私計算一起出現(xiàn)的相關(guān)技術(shù)還包括數(shù)據(jù)脫敏、保留格式加密、區(qū)塊鏈等。在選擇技術(shù)方案時,只有結(jié)合具體場景在性能、安全性和通用性等方面的具體需求,從核心需求痛點入手,才能選擇最合適的技術(shù)路線。
三、 海泰方圓隱私計算和數(shù)據(jù)安全產(chǎn)品線
1. 海泰方圓隱私計算技術(shù)產(chǎn)品
以安全多方計算、聯(lián)邦學習、TEE等為代表的隱私計算技術(shù)為流通過程中數(shù)據(jù)的“可用不可見”提供了解決方案。海泰方圓在安全多方計算、TEE、數(shù)據(jù)安全治理、數(shù)據(jù)脫敏、保留格式加密等方面有深入的研究,在秘密分享(密鑰分割)、不經(jīng)意傳輸、匿名認證等方面均有技術(shù)專利授權(quán),同時公司還參與隱私計算相關(guān)內(nèi)容的國家標準和行業(yè)標準工作。2022年初公司設(shè)計完成基于同態(tài)加密的隱私計算服務(wù)系統(tǒng),提供基于密文的數(shù)學運算能力和復雜場景的多方聯(lián)合計算能力,實現(xiàn)數(shù)據(jù)“可用不可見”。該系統(tǒng)包含數(shù)據(jù)方、隱私計算平臺方、計算結(jié)果獲取方等多種角色。數(shù)據(jù)方對數(shù)據(jù)進行加密后傳給隱私計算平臺,隱私計算平臺基于密文進行計算,將密文計算結(jié)果傳給計算結(jié)果獲取方,計算結(jié)果獲取方擁有解密私鑰,對密文計算結(jié)果進行解密得到明文結(jié)果。隱私計算服務(wù)系統(tǒng)可用于數(shù)據(jù)安全交易、數(shù)據(jù)安全出境等場景。
隱私計算服務(wù)系統(tǒng)
2. 海泰方圓數(shù)據(jù)安全產(chǎn)品
當前,數(shù)據(jù)安全技術(shù)領(lǐng)域不斷細分,技術(shù)體系不斷完善,而且還在不斷發(fā)展之中,可以說,沒有哪項技術(shù)是全能而完美的,不同技術(shù)和方法的應(yīng)用往往需要相互融合。事實上,海泰方圓擁有豐富的數(shù)據(jù)安全類產(chǎn)品,近年推出的數(shù)據(jù)數(shù)據(jù)安全新品包括數(shù)據(jù)安全管控平臺、數(shù)據(jù)分類分級系統(tǒng)、數(shù)據(jù)脫敏系統(tǒng)等多種產(chǎn)品。
數(shù)據(jù)安全管控平臺是“數(shù)據(jù)安全”能力的底座。平臺關(guān)注于數(shù)據(jù)的安全保護,對數(shù)據(jù)安全能力進行集中化、標準化、規(guī)范化、常態(tài)化、場景化管理,全面掌握全域敏感數(shù)據(jù)資產(chǎn)分類分級及分布情況,有效監(jiān)控敏感數(shù)據(jù)流轉(zhuǎn)路徑和動態(tài)流向,通過集中化數(shù)據(jù)安全管控策略管理,實現(xiàn)數(shù)據(jù)分布、流轉(zhuǎn)、訪問過程中的態(tài)勢呈現(xiàn)和風險識別。平臺能夠?qū)Ψ诸惙旨壓蟮拿舾袛?shù)據(jù)做進一步安全處理,支持數(shù)據(jù)脫敏、數(shù)據(jù)加解密和數(shù)據(jù)完整性保護等安全防護功能。
數(shù)據(jù)分類分級系統(tǒng)基于AI智能引擎和分類分級模板實現(xiàn)企事業(yè)單位數(shù)據(jù)資產(chǎn)中的敏感信息分類分級自動識別,集中管控敏感信息的靜態(tài)分布和動態(tài)變化,為數(shù)據(jù)脫敏、數(shù)據(jù)資產(chǎn)安全利用提供基礎(chǔ)支撐,輔助決策人員制定數(shù)據(jù)安全方案。數(shù)據(jù)分類分級系統(tǒng)適用于企業(yè)內(nèi)部數(shù)據(jù)資產(chǎn)識別梳理、定位數(shù)據(jù)資產(chǎn)分布、滿足監(jiān)管檢測等場景。
數(shù)據(jù)據(jù)脫敏系統(tǒng)是一套在保留原有數(shù)據(jù)的有效信息特征的情況下,通過對部分數(shù)據(jù)進行遮蔽、替換、混淆等方法,隱藏數(shù)據(jù)中敏感信息的系統(tǒng)。系統(tǒng)通過敏感數(shù)據(jù)發(fā)現(xiàn)和處理引擎自動掃描數(shù)據(jù)庫,智能識別敏感數(shù)據(jù),系統(tǒng)默認支持地址脫敏、URL脫敏、身份信息脫敏、電話號碼脫敏等20種脫敏方式,支持自定義脫敏規(guī)則設(shè)置,支持保留格式加密,能夠應(yīng)用在生產(chǎn)環(huán)境數(shù)據(jù)導入開發(fā)環(huán)境、數(shù)據(jù)跨單位共享等場景。
海泰方圓數(shù)據(jù)安全產(chǎn)品具有三大技術(shù)特色。一是采用專業(yè)的密碼技術(shù),包括傳統(tǒng)密碼技術(shù)和隱私計算前沿技術(shù)。二是采用AI技術(shù),包含NLP(自然語言處理)和知識圖譜等技術(shù)。三是采用符合國家標準的DSMM數(shù)據(jù)安全治理框架,平臺類產(chǎn)品參照國家標準GB/T 37988-2019《信息安全技術(shù) 數(shù)據(jù)安全能力成熟度模型》的DSMM模型構(gòu)建數(shù)據(jù)安全治理框架。
海泰方圓以密碼全能力和可信數(shù)據(jù)治理為核心,提供商用密碼綜合解決方案和可信數(shù)據(jù)資產(chǎn)管理。海泰方圓愿與業(yè)界同仁一道,賦能共贏,推動隱私計算在數(shù)據(jù)安全治理中發(fā)揮更大的價值。
參考資料
[1]. 深入淺出隱私計算:技術(shù)解析與應(yīng)用實踐. 李偉榮著.機械工業(yè)出版社,2022.1.
[2]. 隱私計算:推進數(shù)據(jù)“可用不可見”的關(guān)鍵技術(shù). 閆樹等著.電子工業(yè)出版社,2022.3.
[3]. 隱私計算. 陳凱,楊強著.電子工業(yè)出版社,2022.2
[4]. Secure Multiparty Computation (MPC).Yehuda Lindell Unbound Tech and Bar-Ilan University.2020.
[5]. A Pragmatic Introduction to Secure Multi-Party Computation.David Evans, Vladimir Kolesnikov and Mike Rosulek. 2018.
[6]. Applications of Secure Multiparty Computation. P.Laud and L.Kamm (Eds.).2015.
[7]. 安全多方計算技術(shù)與應(yīng)用綜述.蘇冠通,徐茂桐,《信息通信技術(shù)與政策》2019年5月第5期.
[8]. 基于同態(tài)加密的安全多方計算協(xié)議及應(yīng)用.陳立朝,西安科技大學碩士學位論文,2019.
[9]. 大數(shù)據(jù)隱私動態(tài)防護框架.劉孟旭,《軟 件》 2019, Vol. 40, No. 7.
[10]. 《隱私計算白皮書2021》.中國信息通信研究院 隱私計算聯(lián)盟,2021.
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!