深度解析丨一文讀懂隱私計算多種技術路線

數(shù)據安全共享和價值轉化既是政策導向,也是大數(shù)據和數(shù)字經濟發(fā)展的關鍵。隱私計算技術,已成為數(shù)據流通安全的“最優(yōu)技術解”。

政策法規(guī)加速落地,市場關注度快速提升。我國多部與數(shù)據安全相關的法律法規(guī)落地實施,形成了較為完備的安全法律體系,多部法規(guī)與政策明確鼓勵運用隱私計算技術破局數(shù)據流通中的安全問題,使得隱私計算成為當下火熱的新興技術。

本文以隱私計算多種技術與未來發(fā)展為核心,帶你一文快速讀懂隱私計算多種技術路線,并對技術流變發(fā)展趨勢做出預測。

崛起70年:主流技術路線速覽

隱私計算是在保護數(shù)據本身不對外泄露的前提下,實現(xiàn)數(shù)據分析計算的一系列技術路線的統(tǒng)稱,可達到“數(shù)據可用不可見”的目的,在充分保護數(shù)據和隱私安全的前提下,實現(xiàn)數(shù)據價值的轉化和釋放。

隱私計算并非單一的技術,而是包含多種隱私保護技術、隱私增強技術,是一系列技術的統(tǒng)稱,涉及密碼學、安全硬件、信息論、分布式計算等多個學科。“隱私計算”這個概念雖然誕生時間不長,但從其現(xiàn)代密碼學的本質來看,其相關技術理論的研究有著相當?shù)囊欢螝v史。

從1949年香農開創(chuàng)現(xiàn)代密碼學時代起,安全多方計算、零知識證明被陸續(xù)提出,多種新的技術路線和隱私計算方案(例如混淆電路、基于秘密分享的MPC、半同態(tài)加密等協(xié)議和算法等)也陸續(xù)出現(xiàn)。七十余年間,隱私計算經歷多個里程碑,技術體系逐步發(fā)展和壯大,并開始有大規(guī)模的項目落地。

2019年后,隱私計算進入應用期,走出學院派與實驗室,廣泛與行業(yè)應用場景相結合。各類隱私計算廠商也如雨后春筍一般涌現(xiàn)出來,激發(fā)了隱私計算技術可用性的快速提升。

當前,隱私計算在應用中快速發(fā)展,領域內仍在持續(xù)涌現(xiàn)出更多新的技術特點和解決方案。

從技術層面來說,隱私計算主要有三類主流技術路線:一類是采用密碼學和分布式系統(tǒng),以多方安全計算(Secure Multiparty Compute,MPC)為代表;另一類是采用基于硬件的可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE);最后一類是近年來發(fā)展相當火熱的聯(lián)邦學習(Federated Learning,F(xiàn)L)。此外,還有零知識證明、同態(tài)加密、差分隱私等技術。各類技術路線融合應用趨勢凸顯。

多方安全計算

多方安全計算(Secure Multiparty Compute,MPC)是一種將計算分布在多個參與方之間的密碼學分支,參與者在不泄露各自隱私數(shù)據情況下,利用隱私數(shù)據參與保密計算,共同完成某項計算任務。

這項技術最早可追溯至1981年,Rabin首次提出通過Oblivious Transfer(OT) 協(xié)議實現(xiàn)機密信息交互。1982年,姚期智教授在論文《Protocols for Secure Computations》中提出“百萬富翁問題“,即兩個百萬富翁在沒有可信第三方、不透露自己財產狀況的情況下,如何比較誰更富有,這標志著多方安全計算技術的產生。1986年,姚期智教授提出混淆電路技術,實現(xiàn)了第一個多方(兩方)安全計算方案。1987年,Goldreich等人提出了基于電路的秘密共享方案GMW,并將其應用于多方安全計算。

同態(tài)加密

同態(tài)加密(Homomorphic Encryption,HE)是一種通過對相關密文進行有效操作(不需獲知解密秘鑰),從而允許在加密內容上進行特定代數(shù)運算的加密方法。其特點是允許在加密之后的密文上直接進行計算,且計算結果解密后和明文的計算結果一致。

1978年,Ron Rivest、Leonard Adleman和Michael L. Dertouzos提出同態(tài)加密問題,并在同年提出滿足乘法同態(tài)的RSA算法。同態(tài)加密問題的提出將加密技術的研究從靜態(tài)引向動態(tài),是理論上的巨大革新,也開創(chuàng)了隱私計算的先河。2009年,Gentry提出了首個實用的全同態(tài)加密算法,標志著全同態(tài)計算時代的開始。2017年,國際同態(tài)加密標準委員會成立,標志著同態(tài)加密在全球進入高速發(fā)展階段。

聯(lián)邦學習

聯(lián)邦學習(Federated Learning,F(xiàn)L)是一種具有隱私保護屬性的分布式機器學習技術。在機器學習中,通常會從多個數(shù)據源聚合訓練數(shù)據,并將其傳送到中央服務器進行訓練。然而這一過程容易產生數(shù)據泄露風險。在聯(lián)邦學習模型中,運算在本地進行,只在各個參與方之間交換不包含隱私信息的中間運算結果,用于優(yōu)化各個參與方相關的模型參數(shù),最終產生聯(lián)邦模型,并將應用于推理,從而實現(xiàn)了“原始數(shù)據不出本地”、“數(shù)據可用不可見”的數(shù)據應用模式。按照數(shù)據集合維度相似性構成的特點,業(yè)界普遍將聯(lián)邦學習分為橫向聯(lián)邦學習、縱向聯(lián)邦學習與聯(lián)邦遷移學習。

2012年,王爽等在期刊Journal of Biomedical Informatics發(fā)表論文,首次解決醫(yī)療在線安全聯(lián)邦學習問題,該框架服務于多個國家級醫(yī)療健康網絡,也是聯(lián)邦學習系統(tǒng)構架層面的突破。

零知識證明

零知識證明(Zero-Knowledge Proof,ZKP),是指證明者能夠在不向監(jiān)控者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的。零知識證明實際上是一種涉及雙方或更多方的協(xié)議,即雙方或更多方完成一項任務需要采取的一系列步驟,證明者需要向驗證者證明并使其相信自己知道或擁有某一消息,但證明過程不向驗證者泄露任何關于被證明消息的信息。

1985年,S. Goldwasser、S. Micali和C. Rackoff首次提出零知識證明(Zero-Knowledge Proof, ZKP)概念。目前在實際應用中,某些加密貨幣就采用了這一技術路線。

可信執(zhí)行環(huán)境

可信執(zhí)行環(huán)境(TEE)是一種基于硬件的隱私保護方法,是指計算平臺上由軟硬件方法構建的一個安全區(qū)域,可保證在安全區(qū)域內部加載的代碼和數(shù)據在機密性和完整性方面得到保護。2009年,OMTP工作組率先提出一種雙系統(tǒng)解決方案:在同一個智能終端下,除多媒體操作系統(tǒng)外再提供一個隔離的安全操作系統(tǒng),這一運行在隔離硬件之上的隔離安全操作系統(tǒng)用來專門處理敏感信息以保證信息安全,該方案是可信執(zhí)行環(huán)境的前身。

在實踐層面,目前以Intel SGX和ARM TrustZone為基礎的TEE技術起步較早,社區(qū)和生態(tài)已比較成熟。同時,國產化的芯片廠商在TEE方向上已經開始發(fā)力,國內芯片廠商如海光、鯤鵬、飛騰、兆芯等都推出了支持可信執(zhí)行環(huán)境的技術,信創(chuàng)國產化趨勢明顯,相關生態(tài)也正在加速建立、完善。

差分隱私

2006年,C. Dwork提出差分隱私(Differential Privacy, DP),這一技術路線的主要原理是通過引入噪聲對數(shù)據進行擾動,并要求輸出結果對數(shù)據集中的任意一條記錄的修改不敏感,使攻擊者難以從建模過程中交換的統(tǒng)計信息或者建模的結果反推出敏感的樣本信息。

隱私計算的未來:融合應用

除上述技術之外,還有圖聯(lián)邦、混淆電路、不經意傳輸?shù)榷喾N技術路線被先后提出,并不斷在科研和產業(yè)的推動下得到發(fā)展和應用。

縱觀隱私計算不同技術路線,可以發(fā)現(xiàn)各有其優(yōu)勢與不足,在可支持計算、隱私保護維度、隱私保護強度、安全性、性能等方面有較大差異,分別適合不同的應用和場景;同時,不同的技術路線目前正在持續(xù)融合、取長補短,實現(xiàn)1+1>2的應用效果。例如通過硬件加速的全同態(tài)加密算法構建強隱私、高性能的縱向聯(lián)邦學習系統(tǒng),就是一個不同技術路線深度融合的典型案例。

相信在未來,不同技術路線的融合以及與人工智能、區(qū)塊鏈等新興技術的結合,能夠推動隱私計算大規(guī)模落地,實現(xiàn)海量數(shù)據要素的價值釋放。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )