Ⅰ 隱私保護技術 安全多方計算
安全多方計算
同態加密
差分隱私
過程 :在安全多方計算中,目的是協同地 從每一方的隱私輸入中計算函數的結果,而不用將這些輸入展示給其他方。安全多方計算告訴我們,對於任何功能需求,我們都可以在不必顯示除了輸出以外的前提下計算它。
安全多方計算允許我們計算私有輸入值的函數,從而使每一方只能得到其相應的函數輸出值,而不能得到其他方的輸入值與輸出值。
eg.假設一個私有的數值 被 分給 位共享方,則每一方 只能獲知 的內容,所有方能夠協同地計算
所以, 只能根據自己的輸入 來獲知輸出值 ,而不能得知任何額外的信息。 但是 的計算結果同時有 的參與。
安全多方計算能夠通過三種不同的框架來實現: 不經意傳輸 (Oblivious Transfer,OT) [91, 92]、 秘密共享(Secret Sharing,SS) [93, 94] 和 閾值同態加密(Threshold Homomorphic Encryption,THE) [20, 21]。
不經意傳輸是一種由 Rabin 在 1981 年提出的兩方計算協議[95]。
研究者已發表了許多不經意傳輸的構造方法,例如 Bellare-Micali 構造[97]、 Naor-Pinka 構造[98] 以及 Hazay-Lindell 構造[99]。此處,我們介紹不經意傳輸的 Bellare-Micali 構造。該構造使用了 Diffie-Hellman 密鑰交換(Diffie-Hellman key exchange)演算法,並假設計算 Diffie-Hellman 假設(Computational Diffie-Hellman (CDH) assumption)成立[100]。
Ⅱ 什麼是隱私計算技術
在數字化浪潮推動下,數據領域的技術創新、場景應用與管理服務日益成為各個行業領域數字化轉型發展的重要驅動力。同時,「數據流通」與「數據安全」間的矛盾也日益升級,成為影響數字化發展的制約因素。
安全VS發展
「安全」與「發展」,一直是數據管理領域的兩大重要主題。二者既矛盾對立,相互制約;又在不斷的技術創新下追尋均衡,最大限度實現數據的價值。
矛盾制約
「數據」作為一種特殊的市場資源與生產要素,其自身特點決定只有在更大范圍的 社會 共享中才能發揮其真正的資源價值。 在人工智慧、大數據、雲計算等技術快速應用推廣的當下, 不斷提高的算力+不斷優化的演算法,將通過不同維度、不同領域的大數據發現事物間蘊藏的規律,並運用規律解釋過去、預測未來。
智能演算法持續優化、提升的重要前提即是通過海量、多元的大數據資源進行數據訓練, 客觀上有著較強的數據共享使用需求, 這與具有「信息數據共享和透明」特點的區塊鏈技術不謀而合,相輔相成,因此近年來區塊鏈技術發展應用迅速。 但需要注意的是,數據的共享交換雖然提升了數據自身價值,但也不可避免的出現侵犯數據所有者「數據隱私」的安全問題,數據共享挖掘面臨合規監管,數據技術發展應用陷入瓶頸。
均衡發展
「在矛盾中尋找平衡」,是目前數據領域技術創新應用的重要課題。 客觀市場環境的快速變化也為「數據流通」與「數據安全」的均衡發展形成強大驅動力。
2019年末,一場突如其來的新型冠狀病毒疫情在世界范圍內蔓延肆虐,大量民眾不幸罹難,各國經濟發展更是遭受沉重打擊。在客觀疫情防控形勢下, 「數字化轉型發展」成為各國恢復經濟秩序和建立全新國際競爭優勢的重要戰略措施。 在這樣的背景下,數據作為全新的生產要素,隨著功能價值不斷提升,技術應用不斷拓展,數據的「流通使用」和「安全保障」也日益受到行業發展與政府監管的重視。
數據技術創新應用,一方面對數據安全保障提出了全新挑戰,另一方面也以技術創新形式給出了相應的答案——「區塊鏈+隱私計算」。
區塊鏈+隱私計算
數據時代的信任機制與隱私保護
區塊鏈技術是一種通過去中心化、高信任的方式集體維護一個可靠資料庫的技術方案。 由於具有「去中心化」、「分布式數據存儲」、「可追溯性」、「防篡改性」、「公開透明」等優勢特點,區塊鏈技術能夠有效解決數據領域的數據真實性、安全性與開放性問題, 通過建立可信任的數據管理環境,防範和避免各類數據造假、篡改、遺失等數據管理問題,促進數據的高效共享與應用。
一如上文所述,區塊鏈技術具有「信息數據共享和透明」的特點,但無論從市場商業競爭角度還是個人信息安全形度來看,都沒有人希望自己的數據完全公開、透明。因此, 隱私保護合規成為數據管理領域的一條重要「紅線」,一方面保護著數據所有者的隱私安全,另一方面也影響著數據流通共享的效率與發展。
那麼有沒有一種技術既可以保證信息數據的高效流通共享,卻又不會越過隱私保護合規紅線?
如果說「區塊鏈」技術建立了數據時代的信任機制,那麼「隱私計算」則在數據共享洪流中為數據所有者建立了安全的隱私保護防線。
「隱私計算」, 即面向隱私信息全生命周期保護的計算理論和方法,是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統。 簡單來說,隱私計算即是從數據的產生、收集、保存、分析、利用、銷毀等環節中對隱私進行保護的技術方法。
同區塊鏈技術一樣,隱私計算並不特指某一門技術,而是一種融合了密碼學、數據科學、經濟學、人工智慧、計算機硬體、軟體工程等多學科的綜合技術應用。 隱私計算包括一系列信息技術, 如業界較早提出的 安全多方計算(MPC)技術、 以硬體技術隔離保護為主要特點的 可信執行環境(TEE)技術、 基於密碼學和分布式計算實現多方協作機器學習的 聯邦學習(FL)技術,以及如同態加密、零知識證明、差分隱私等輔助性技術,都屬於隱私計算范疇。
安全多方計算(MPC),是一種在參與方不共享各自數據且沒有可信第三方的情況下安全地計算約定函數的技術和系統。 通過安全的演算法和協議,參與方將明文形式的數據加密後或轉化後再提供給其他方,任一參與方都無法接觸到其他方的明文形式的數據,從而保證各方數據的安全。
可信執行環境(TEE),是指CPU的一個安全區域, 它和操作系統獨立開來,且不受操作系統的影響。 在這個安全區域里保存和計算的數據不受操作系統的影響,是保密且不可篡改的。
聯邦學習(FL), 是指在多方在不共享本地數據的前提下,進行多方協同訓練的機器學習方式。聯邦學習技術支持 數據不出域,而是讓演算法模型進行移動,通過數據訓練進而優化演算法模型。
隱私計算技術的目的在於讓數據在流通過程中實現「可用不可見」,即只輸出數據結果而不輸出數據本身。 這一方面保證了數據所有者的數據所有權不受侵犯,滿足數據流通的合規性;另一方面在隱私保護技術加持下,各方主體擁有的信息數據能夠高效流通使用,不斷擴大數據價值,賦能各個行業領域數據應用。
舉例如在醫療數據領域, 各類醫療數據的 隱私性要求較高、數據量較大, 通常只保存在本地機構的信息系統中, 很難實現高效的醫療數據流通、共享與使用, 無法為醫療領域的各類病理研究、醫療診斷與技術創新形成數據支持,不利於創新醫療技術研發與應用。
但如果能 通過隱私計算技術支持,在保證數據「可用不可見」的前提下,實現不同區域、不同醫療機構醫療數據的高效流通使用,持續優化醫療行業的各類演算法模型,將為實現醫療行業的精準醫療、遠程醫療、智能醫療等醫療技術服務創新形成強力數據支持。
數字化發展浪潮之下,「數據」作為一種全新的重要市場資源與生產要素,其快速發展與管理應用日益受到國家的重視,並不斷賦能各個行業領域發展。同時,數據領域存在的隱私安全問題也令數據管理應用陷入發展困境。 可以預見,區塊鏈技術和隱私計算技術的結合,將是數據管理領域一次重要的嘗試 探索 ,對數據領域發展產生重要影響。