⑴ 區塊鏈與隱私計算的結合是必然趨勢嗎
區塊鏈與隱私計算的結合是必然趨勢嗎?
我們目前對這個問題的思考框架是:如果不與隱私計算技術結合,區塊鏈技術的應用是 否受到限制、無法向前發展;如果不與區塊鏈技術結合,隱私計算技術是否受到限制、無法 向前發展。如果二者對彼此都是剛需,那麼它們相結合的趨勢就是必然。
以下為我們對這個問題的思考:
1、隱私計算技術的應用是否區塊鏈技術的剛需
區塊鏈技術有巨大的優勢,但是如果沒有隱私計算技術,區塊鏈技術的應用會大大受到 限制,因為無法解決鏈上數據的隱私保護問題,這使得大量涉及敏感數據的場景不願應用區 塊鏈技術,比如金融和醫療領域。
(1)區塊鏈技術的局限性
第一,鏈上數據公開透明,數據的合規處理和隱私保護能力不足 區塊鏈作為分布式賬本系統,數據的公開透明盡管有利於存證、防篡改,但也存在數據 可輕易被復制、泄漏個人隱私的風險。區塊鏈在公有鏈上要求不同節點對交易和交易狀態進 行驗證、維護辯陸,形成共識,因此每個參與者都能擁有完整的數據備份,所有的交易數據公開 透明。如果知道某個參與者的賬戶,就很容易獲取其每一筆交易記錄,從而據此推斷其 社會 身份、財產狀況等。以消費場景為例,平台之間存在競爭壁壘,用戶也希望保留消費隱私, 因此區塊鏈缺乏對用戶流水、物流信息、營銷情況等與企業、個人隱私相關的數據缺乏保護 能力,往往導致數據擁有方不願意讓數據進入流通環節。在鏈上系統的交易不再受中心賬本的控制,用戶通過使用唯一的私鑰進行交易,交易過 程被加密且加密前數據很難還原,僅以私鑰作為交易憑證使得區塊鏈內的交易變得更加匿名 和不可控。在分布式賬本系統上,所有的轉賬以地址形式進行,一但發生了詐騙或者洗錢等 金融犯罪,即便可以公開查詢地址,但對資金追蹤的難度極大,且私鑰作為交易憑證很難證 明使用者的身份,因此許多企業、個人通過區塊鏈進行洗錢等違法交易,不利於數據的合規 處理和合法共享。
第二,數據處理能力不足,制約技術的進一步落地和商業化拓展 鏈上計算受限於網路共識的性能,使得鏈上交易難以具備實時性和高效率,區塊鏈智能 合約的計算能力需要擴展。以最大的加密支付系統比特幣為例,每秒鍾只能夠處理大約 3 到 7 筆交易5 ,且當前產生的交易的有效性受網路傳輸影響,往往需要等待 10 分鍾左右的記賬周 期才能讓網路上的節點共同知道交易內容。此外,如果鏈上有兩個及以上節點同時競爭到記賬權力,則還需要等待下一個記賬周期才能確認交易的准確性,最終由區塊最長、記賬內容 最多的鏈來完成確認。
完全去早灶卜中心化的系統與現實中大部分現有體系的兼容性不足,缺乏鏈上鏈下協同、多業 務發展的系統和功能,制約區塊鏈技術的進一步落地。在區塊鏈的技術落地過程中,首先, 各行業本身具有成熟的體系,區塊鏈完全去中心化的形式不一定適合所有的領域和行業;其 次,區塊鏈的陸穗平台設計和實際運行成本巨大,其所具備的低效率和延遲性的交易缺陷非常明 顯,是否能夠彌補原系統更換的損失需要經過一定的精算和比較;此外,使用區塊鏈存儲數 據需要對原有數據格式進行整理,涉及到政務、司法領域的敏感數據,更需要建立鏈接線上 和線下數據的可信通道防止數據錄入有誤,這帶來了較高的人力、物力成本。
(2)隱私計算技術對區塊鏈技術的幫助
隱私計算技術保障數據從產生、感知、發布、傳播到存儲、處理、使用、銷毀等全生命 周期過程中的隱私性,彌補區塊鏈技術的隱私保護能力,實現數據的「可用不可見」。通過 引入隱私計算技術,用戶的收支信息、住址信息等個人數均以密文的形式呈現,在平台進行 數據共享的過程中,既能防止數據泄露,又能夠保障用戶個人隱私的安全,有利於進一步打 破數據孤島效應,推動更大范圍內的多方數據協作。隱私計算技術可與區塊鏈技術形成技術組合,提升數據處理能力、擴大可應用范圍。隱 私計算技術通過對數據進行規范化處理,能夠提升數據處理、數據共享的效率,提升區塊鏈 的數據處理能力。此外,隱私計算技術+區塊鏈技術的技術組合能夠應用於缺乏中心化系統、 但又對敏感數據分享有強烈需求的合作領域,擴展區塊鏈技術的應用場景。
區塊鏈技術的應用是否隱私計算技術的剛需
(1)隱私計算技術的局限性
第一,數據共享缺乏安全檢驗,制約數據流通的可信性
數據共享的整個流程涉及到採集、傳輸、存儲、分析、發布、分賬等多個流程,隱私計 算主要是解決全流程的數據「可用不可見」的問題,但是難以保證數據來源可信和計算過程 可信。
從數據來源可信的角度來說,在數據採集的環節,數據內容本身可能不完整,數據的錄 入可能會存在失誤;在數據傳輸的環節,數據的傳輸可能會被其他的客戶端攻擊,導致數據 在傳輸的過程中泄漏;在數據的儲存環節,儲存數據的角色方有可能會篡改數據或者將數據 復制轉賣到黑市,這些都不會被隱私計算技術記錄。如果無法保證數據共享各方的身份得到 「可信驗證」,就有可能導致數據的隱私「名不副實」。從計算過程可信的角度來說,在數 據分析和發布的環節,數據的共享方有可能私自篡改數據的運行結果和發布內容,對最終數 據處理的結果進行造假。因此,一旦信息經過驗證並添加到隱私計算的環境中,很難發現數 據是否被篡改、被泄漏,很難防止不同時間點不同節點的數據造假的情況,在涉及到金融、政務、醫療、慈善等關鍵領域里,如果數據有誤則產生的一系列法律問題則難以追究。
第二,業務水平整體層次不齊,制約技術平台的擴展
當前,隱私計算的技術實現路徑主要分為三種:多方安全計算、聯邦學習、TEE 可信執行 環境。三種技術路徑存在各自的應用缺陷和問題,由於行業內不同公司對於技術的掌握能力 和研發能力有限,導致技術平台的實際應用范圍有限,可擴展能力不足。
多方安全計算盡管具有復雜高標準的密碼學知識,但其計算性能在實際應用的過程中存 在效率低的缺陷。隨著應用規模的擴大,採用合適的計算方案保證運算時延與參與方數量呈 現線性變化是目前各技術廠商面臨的一大挑戰。多方安全計算雖然能保證多方在數據融合計 算時候的隱私安全,但是在數據的訪問、控制、傳輸等環節,仍然需要匹配其他的技術手段 防止數據泄露、篡改。
聯邦學習技術目前在業內的應用通常以第三方平台為基礎模型,在基礎模型之上進行隱 私計算,這樣的基礎模型本身存在被開發者植入病毒的隱患。此外,聯邦學習的機制默認所 有的參與方都是可信方,無法規避某個參與方惡意提供虛假數據甚至病害數據,從而對最終 的訓練模型造成不可逆轉的危害。由於聯邦學習需要各個參與式節點進行計算,因此節點的 計算能力、網路連接狀態都將限制聯邦學習的通信效率。
TEE 可信執行環境在國內目前核心硬體技術掌握在英特爾、高通、ARM 等少數外國核心供 應商中,如果在關鍵領域從國外購買,則存在非常高的安全風險和應用風險。第三,數據共享缺乏確權機制,制約數據流通的應用性 隱私計算通過使用多方數據共同計算、產生成果,然而在實際合作的過程中,由於各個 數據共享方業務水平不同、數據質量不一導致在數據處理的每一個環節難以實現合理的確權。
按照常規的利益分配機制,擁有高質量數據、高成果貢獻率的數據擁有方理應從中獲取更多 的利潤,但是隱私計算僅考慮到數據的「可用不可見」,數據共享方難以從最終結果來判斷 誰的數據對於成果的貢獻最大,造成利益分配的不公平。如果缺乏合理的成果貢獻評估機制和利益分配機制,就會難以激勵數據所有者和其他數 據持有者進行合作。尤其是在不信任的多方合作的場景下,會更加增加合作的信任成本,使 得多方協作難以達成,制約數據流通的實際應用性。
(2)區塊鏈技術對隱私計算技術的幫助
區塊鏈技術通過數據流通的所有環節、所有參與者進行記錄,實現數據共享流程中的權 責分明,提升了數據流通的可信性。在數據傳輸的環節,區塊鏈記錄數據的提供者,確認數 據提供方身份的真實性和有效性,有利於數據確權,為公平可行的利益分配機制提供參考;在數據儲存的環節,區塊鏈保證數據的每一次修改都有跡可循,防止數據的惡意篡改。區塊 鏈技術可作為隱私計算技術的底層平台,保證了加密數據本身的真實有效性,提升了隱私計 算平台里數據流通的可信性,拓展隱私計算技術的應用范圍。
3. 結論
隱私計算技術和區塊鏈技術的融合是必然的趨勢。對於數據資產的流轉來講,沒有隱私 計算,不能解決數據本身的安全和隱私保護問題;沒有區塊鏈,不能解決數據的確權問題以 及在更大范圍內的數據網路協作問題。將區塊鏈和隱私計算二者結合起來,建設大規模數據 流通網路,在目前的實踐中成為有所共識的 探索 方向。
區塊鏈與隱私計算的結合會改變什麼?
1、形成大規模數據流通網路和數據要素市場
當前,數據流通存在三方面問題:數據擁有方的數據保護和數據確權難以實現;不同來 源數據的整合處理成本過高、缺乏統一標准;數據利益的分配機制不完善。
如前文所述,區塊鏈和隱私計算技術相結合,可以一方面解決隱私保護問題,一方面解 決數據確權和多方協作問題,從而建立大規模的數據流通網路。
在大規模數據流通網路建立的基礎上,真正意義上的數據要素市場才能夠形成,數據作 為生產要素的價值才能夠被充分發掘出來。
2、推動數據資產化的發展
所謂資產,是指由企業過去的交易或事項形成的,由企業擁有或者控制的,預期會給企 業帶來經濟利益的資源。
數據的資產化就是讓數據在市場上發現價值,能夠為企業創造新的經濟益。
大規模數據流通網路和數據要素市場的形成,將大大推動數據價值的發現、數據資產化 的發展。
從企業一側來看,企業的生產經營活動當中沉澱下來的數據會成為寶貴的資產。一方面, 對這些數據的分析和運用,將推動企業改善自身的業務;另一方面,與外部機構進行數據的 共享,能夠推動數據發揮出更大的價值,企業自身也將從中獲取更多收益。這會反過來進一 步推動企業的數字化轉型和對數據資產的管理。未來,對數據資產的盤點可能成為企業在資 產負債表、現金流量表、利潤表之外的「第四張表」。
數據資產化的發展,也會推動圍繞數據價值挖掘形成全新的服務體系。其中包括數據確 權、定價、交易等各個環節。上海 社會 科學院信息研究所副所長丁波濤將未來數據資產服務體系中的機構分成四類:
第一類提供中介服務,包括數據經紀人,還有數據代理。
第二類提供數據評估,由於數據市場信息不對稱或信息混亂,需要提供合規評估、數據 質量和數據價格的評估。
第三類提供價格咨詢,如提供法律、經濟咨詢或者是上市輔導等的咨詢服務企業。
第四類提供專業技術服務,包括數據開發、數據處理服務、數據交付服等。數據資產化的發展,帶來的將是人們認知的提升、生產效率的提高、生產要素的重組、 創新的產生、經濟的發展以及全 社會 整體福利的提升。
3、對現有業態的改變
區塊鏈與隱私計算的結合,將提升企業和個人分享數據、利用數據的積極性,進一步推 動打破「數據孤島」。其對現有業態的改變主要體現在以下幾個層面:
第一,這將帶來新的數據和 科技 變革。
首先,這將推動數據密態時代的到來。數據密態時代的核心,是數據流通使用方式的巨 大改變,數據將以密態形式在主體間流動和計算,顯著降低數據泄露的風險,並在合規前提 下支撐各種形態業務的發展。此前,數據被加密之後只能用來傳輸或者存儲,但是未來數據 在加密狀態下可以被計算。這將帶來一系列新的問題和挑戰,引發許多相關技術領域的連鎖 反應。
其二,這將重塑大數據產業。隨著數據流通的安全化,以往較為敏感的數據領域逐漸開 放。以政務數據為例,隱私計算使聯合政務、企業、銀行等多方數據建模和分析成為可能, 進一步釋放數據應用價值,創造了多樣化的應用機遇。
其三,人工智慧產業將獲得新一輪的發展。數據、演算法和算力是人工智慧發展的三要素。近幾年來,由於缺乏可用的數據,人工智慧的發展遭遇瓶頸。未來,5G 和物聯網的發展將使 得萬物互聯,數據量大幅增長。區塊鏈+隱私計算技術的應用,可以使得人工智慧利用海量數 據優化模型,真正邁向「智能化」。其四,這將為區塊鏈產業的發展帶來新的機遇。區塊鏈與隱私計算相結合,將拓展聯盟 鏈的節點數量,從而進一步擴大可協同利用的數據資源的范圍。
第二,在 科技 變革的基礎之上,區塊鏈與隱私計算相結合,將給許多傳統產業帶來變革。
在政務領域,一方面,可以實現政府不同部門之間的互聯互通及數據共享,從而促進政 府不同部門的協同,提高政府的效率以及決策質量,推動智慧城市的建設;另一方面,可以 促進政務數據與民間數據的雙向開放。政務數據向 社會 開放,可以為企業或學界所用,釋放 更多價值。民間的數據源向政府開放,可以提高政府在決策以及政務流程等方面的效率。
在金融領域,支付、徵信、信貸、證券資管等各個領域都會因之發生變化。總體來看, 主要是影響到金融的風控和營銷兩個方面。區塊鏈與隱私計算技術的結合,可以在符合法律 規定、不泄露各方原始數據的前提下,擴大數據來源,包括利用金融體系外部的互聯網數據, 實現多方數據共享,聯合建模,從而有效識別信用等級、降低多頭信貸、欺詐等風險,也有 助於信貸及保險等金融產品的精準定價;同樣,內外部多方數據的共享融合也有助於提高金融機構的反洗錢甄別能力。
在醫療領域,未來在疾病治療、葯物研究、醫療保險等多個領域,區塊鏈與隱私計算都 能助推醫療信息化建設,帶來巨大變革。在疾病治療和葯物研究方面,區塊鏈與隱私計算結 合,能夠促進更多的醫療數據被聯合起來進行分析和研究,從而為許多疾病的治療帶來新的 突破。在醫療保險方面,區塊鏈與隱私計算技術結合,主要是可以使得保險公司可以應用到 更多的數據,改善保險產品的設計、定價、營銷,甚至可以促進保險公司對客戶的 健康 管理 等。
區塊鏈與隱私計算技術相結合,目前應用的重點領域是政務、金融、醫療領域,但是未來其應用將不僅僅局限於這三個領域,還將在更多領域發揮作用。
第三,數據權利、利益將重新分配。
這可能是區塊鏈與隱私計算技術相結合所帶來的最為核心,也是最為深刻的,與每一個人 的切身利益都息息相關的變革。
首先,這涉及到每個產業鏈不同環節利益的重新分配。
前述在廣告營銷領域的應用落地為例,此前廣告營銷的利益分配主要是在廣告主與渠 道商之間。但是,未來應用區塊鏈和隱私計算技術,可以在更大范圍內進行數據協作,則要 解決廣告主、多個渠道方、消費者之間多方數據協作的問題,這其中就涉及到多方之間權責 的劃分、利益的重新分配。
其次,這還涉及到企業與個人之間利益的重新分配。
歐盟的 GDPR,美國的 CCPA 等法案中涉及用戶的一項重要權益即「portability,(可攜 帶權)」。即第三方應用不能封鎖個人數據,一旦個人有下載的訴求,APP 需要提供便利的 API 利於個人拷貝數據。美國公司已陸續為用戶提供 API,如果在這方面功能缺失,個人客戶 可以提出訴訟,而公司也將面臨巨額的罰款。在中國的《個人信息保護法》當中,也有相關的條款。《個人信息保護法》第四十五條規 定,「個人有權向個人信息處理者查閱、復制其個人信息」、「個人請求查閱、復制其個人信息 的,個人信息處理者應當及時提供。個人請求將個人信息轉移至其指定的個人信息處理者, 符合國家網信部門規定條件的,個人信息處理者應當提供轉移的途徑。」
目前,中國公司的區塊鏈+隱私計算 探索 主要集中在 To B 服務領域,但是區塊鏈是全球 化的商業,如果美國已經出現這樣的模式,中國大概率不會完全不受影響。伴隨著消費級軟硬體技術能力的提升,區塊鏈與隱私計算技術結合,會逐步對個人與機構 之間的數據服務進行變革。對於個人用戶而言,將有機會獲得自身隱私數據的完全掌控權, 並為數據業務過程中所涉及的數據隱私需求獲得更強的技術性保障。目前關於 To C 服務的相關問題,國內業界還在探討當中。
為什麼區塊鏈+隱私計算的應用尚未大規模普及?
第一,區塊鏈+隱私計算的落地應用,主要是在涉及需要多方數據協作的情況,目前實際需求尚未爆發。
從隱私計算技術發展的角度來看,目前隱私計算尚在落地初期,解決的主要是兩方之間 的數據協作問題,涉及到多方的場景還不多,因此很多時候還沒有體會到對區塊鏈+隱私計算 應用的需要。
從區塊鏈技術發展的角度來看,區塊鏈技術在許多領域的應用目前並非剛需。不少問題 可以應用區塊鏈解決,但是不用區塊鏈技術也能解決,而應用區塊鏈技術解決的成本更高。因此,目前區塊鏈項目的建設主要是政務部門和大型企業較為積極,因為政府和大型企業從 長遠發展的角度來考慮,可以做前瞻性的投資建設和技術布局,但是大多數商業機構需要衡 量投入與產出。
區塊鏈技術與隱私計算技術結合,主要是用於處理數據協作問題。從數據治理的角度來 看,目前大多數機構都在處理自身內部的數據治理問題,內部的數據體系梳理好之後,才涉 及到與外部進行數據協作,因此還需要時間。
第二,區塊鏈+隱私計算的落地應用較為復雜,涉及到新商業模式的創造、權責以及利益 的重新分配,因此需要的時間更長。
以在廣告營銷領域的應用落地為例,目前的大多數應用 都只是落地了隱私計算平台,主要涉及兩方數據協作,直接應用隱私計算技術,延續此前商 業應用即可。但是,如果引入區塊鏈技術,則要解決廣告主、渠道方、消費者之間多方數據 協作的問題,這其中可能涉及到多方之間權責的劃分、利益的重新分配,新商業模式的形成 需要時間進行 探索 。
應用的大規模普及,還需要解決哪些問題?
區塊鏈+隱私計算的應用在大規模鋪開之前,還需要具備三方面的條件:
第一,從外部環境來看,需要全 社會 整體的數字化水平的提高。 打個比方,區塊鏈+隱私 計算將來會形成數據流通的高速公路,但是路上要有足夠的車。目前全 社會 的數字化正在快 速推進當中,大多數機構都是正在進行自身內部的數據治理,他們需要先處理好自己的數據, 之後才能產生更多的與外部數據進行協作的需求,這還需要時間。
第二,從技術發展來看,技術成熟尚需投入。 區塊鏈+隱私計算技術的應用,實際上是犧 牲了數據流通的效率、提升了安全性,但是數據流通的效率也非常重要,未來需要在效率和 安全這兩個方面形成一定的平衡,安全要保障,足夠的效率也要滿足,這其中涉及到許多技 術的研發、行業標準的制定,技術產品化的發展和完善、技術成本的進一步降低,還需要時 間。
第三,還需要相關法律法規的完善,以及數據交易商業模式的形成。 不過,這一條件與 前兩個條件相比,其在目前的重要性相對次之。因為隨著需求的爆發、技術的完善,相關的法律法規以及商業模式就會隨之形成,這一條件在現階段並非限制區塊鏈與隱私計算技術落 地應用的最關鍵因素。
區塊鏈+隱私計算的應用中還蘊藏著哪些趨勢?
1、國產化的趨勢
區塊鏈+隱私計算的應用,涉及網路安全、數據安全,未來將成為新基建的重要組成部分。這是關乎網路空間主權、國家安全和未來發展利益的重要方面,因此這個領域的國產化是未來趨勢。
在區塊鏈+隱私計算技術應用的國產化當中,軟體的國產化是相對容易實現的。難點在於 硬體的國產化,其中最難的部分是晶元的國產化。
這一部分的發展,與信創領域的發展相關。信創,即信息技術應用創新產業,其是數據 安全、網路安全的基礎,也是新基建的重要組成部分。信創涉及到的行業包括 IT 基礎設施:CPU 晶元、伺服器、存儲、交換機、路由器、各種雲和相關服務內容;基礎軟體:資料庫、操 作系統、中間件;應用軟體:OA、 ERP、辦公軟體、政務應用、流版簽軟體;信息安全:邊 界安全產品、終端安全產品等。
在區塊鏈+隱私計算領域,目前已經有企業在嘗試產品的國產化。例如,前文提到的,螞 蟻鏈自研了密碼卡、隱私計算硬體以及自研可信上鏈晶元,同時還推出了摩斯隱私計算一體 機。創業公司如星雲 Clustar、融數聯智也在進行相關國產化硬體產品的研發。
2、軟硬體技術相結合、更多技術融合發展的趨勢
目前,在區塊鏈與隱私計算技術相結合的實踐中,也呈現出了軟硬體技術相結合、更多 技術融合發展的趨勢。這主要是緣於幾方面的需求:
第一,是加強數據安全性的需求。
隱私計算主要是解決數據在計算過程中不泄露的問題,區塊鏈主要是解決存證問題,二者結合僅能解決數據安全的一部分問題。數據從產生到計算再到消亡,會涉及採集、傳輸、 存儲、計算、銷毀等多個環節,其生命周期可能會有數十年之久,要真正保障數據安全需要 一個更加全方位的、體系化的解決方案,以使得每個環節上都有對應的技術體系保障數據安 全 在數據採集階段需要精心設計設備可信架構,在網路傳輸階段需要合理運用安全協議, 在存儲階段需要兼顧加密與性能,在數據計算階段需要靈活選擇可信執行環境與密態運算。除此以外,計算環境的可信與安全在防禦縱深建設上也至關重要。這些安全保障能力的技術 圖譜會涉及到可信計算、軟硬體供應鏈安全、隔離技術、網路與存儲的透明加密、密鑰管理、 可信執行環境等等。這其中每一個技術點都有軟硬體結合、多種技術融合發揮的空間。
第二,是提升計算性能的需求。
隱私計算的性能目前還比較低,在計算機單機、單機和單機之間、計算機集群之間這三 個層面上都存在。
在計算機單機上,隱私計算由於運用了密碼學技術,計算過程中涉及到很多加密解密的 步驟,這使得計算量以幾何級數增加。以全同態演算法為例,在通用晶元上密文運算的速度比 明文運算慢了 10 萬倍。這意味著,做同樣的運算,如果用全同態演算法,在 Intel 最新的 Icelake 處理器上,跑出來的效果等同於 Intel 的第一代 8086 處理器,直接回退了數十年。這使得全 同態加密在現實情況下就不具備可用性了。算力問題也是導致全同態演算法一直未得到廣泛應 用的根本原因。
在單機之間和計算機集群之間,會涉及到單機之間和集群之間的通信效率問題。一方面, 主流的隱私計算技術無論是聯邦學習還是多方安全計算,都有通信問題。密文膨脹、傳輸次 數膨脹,會導致單機之間網路傳輸效率成為隱私計算的瓶頸之一。另一方面,由於大多數隱 私計算的場景都是跨多方的,多方要通過公網進行通信,公網的帶寬與時延目前也是巨大的 鴻溝。
性能的問題,會隨著時間的推移越來越嚴重。2021 年,隱私計算的落地尚處於頗為早期 的階段,主要是在一些機構內部或者是兩方、三方之間應用,處理的數據量較小,這個問題 還不明顯。可是未來,多方數據交換需求的到來、5G 和物聯網的發展所帶來的數據量急劇增 大,最終導致的將是數據量爆發式的增長,這需要消耗大量的算力。
到那時,隱私計算的性 能將面臨巨大的挑戰。現在在硬體的創新方面正處於體系結構的黃金時代。這是因為,移動互聯網的飛速發展 使得應用場景發展很快,上層的軟體也發展很快,這使得在計算機底層進行支持的硬體甚至 晶元都需要隨之進行改變,進入了新一輪的創新周期。
而從區塊鏈與隱私計算結合的長遠發展來看,軟硬體結合、多技術融合,對隱私計算來 說,可以提升性能、安全性和計算效果;對區塊鏈來說,可以促使更多機構低成本加入聯盟 鏈,擴大聯盟鏈應用范圍。
END
編輯 | 領路元
來源 | 零一 財經 《區塊鏈+隱私計算一線實踐報告(2022)》
⑵ 未來5年哪些技術將雄霸天下
3月19日-22日,IBM將召開IBM Think 2018大會,這個全球性的盛會將匯集40000多個高科技愛好者,會議主題將涵蓋人工智慧、數據分析以及物聯網等諸多熱點話題,旨在「讓商業世界更智能」。
在這次活動中,IBM將給出他們對於未來五年的技術發展的預測,並解答有關新技術創新的問題以及這些創新會如何影響我們的生活。這五大技術預測包括Crypto-Anchors、Quantum Computing、Hacking、AI Bias、 AI Microscopes。
1. Crypto-Anchors
造假者人人喊打,而Crypto-Anchors和區塊鏈結合起來能夠有效打假。據悉,因經濟欺詐全球每年會損失超6000億美元,而IBM開發的防篡改數字指紋可嵌入產品中並與區塊鏈鏈接以幫助證明真實性。
例如,Crypto-Anchors可以幫助證明拯救生命的葯物是合法的,而不是偽造的。原本的瘧疾葯片可以塗上一層可食用的磁性墨水,只需簡單掃描一下智能手機,醫生或患者就可以立即發現該葯片是安全和真實的。
除此之外,Crypto-Anchors還可以與特殊的光學設備、人工智慧演算法相結合,以識別物體的結構和標簽,以驗證它們是否真的如他們所說的。例如,一瓶1982年的波爾多葡萄酒或者昂貴的金屬。
IBM設計了世界上最小的計算機,據了解這款電腦比我們平時見到的鹽粒還要小,計算機能力可以達到1990年x86 PC的性能。
Crypto-Anchors的第一批模型可能會在未來18個月內推出,未來五年內,它們將推動各個領域的創新和進步。
2.量子計算
現在量子計算已經備受研究人員的青睞,五年內,量子計算必將成為主流,幫助開發人員解決之前一度被認為無法解決的問題。據IBM表示,量子計算只是將成為所有科學和工程計算的先決條件,大學教育將納入量子計算的教學,量子演算法和經典演算法會同時教授。
而這些進步將推動著量子時代的到來,量子計算機將能夠模擬更大的分子、化學反應和原子結合,這有助於新型材料的創造、個性化葯物的開發以及更高效和可持續能源的發現。
未來,量子計算機不再是神秘的,會被普通大眾所接受,未來五年內,業界將實現量子計算機和傳統計算機共同解決特定問題的應用。
3.黑客
未來,量子計算機能夠快速篩選出所有可能的安全概率,並且解密最強大的加密。目前IBM正在開發一種基於格密碼的安全方法,它會將數據隱藏在格的復數代數結構中。
在數學領域,lattice存在很難解決的問題,而這個困難問題對於密碼學家來說很有用,它可以用來保護數據,即使是在量子計算機中。
在數學領域,晶格存在很難解決的問題。這個困難對密碼學家來說很有用,因為它可以用來保護信息,即使黑客在量子計算方面也是如此。基於格的密碼術也是完全同態加密(FHE)的基礎,而這可以在不查看敏感數據的情況下在文件上執行計算,從而防止受到攻擊。通過FHE,信用報告機構可以在不解密個人數據的情況下分析和生成信用評分,初級保健醫生可以在不透露患者身份的情況下共享醫療記錄和相關數據。
目前我們的安全措施是嚴重不足的,未來五年,我們要在安全方面應該有更多的突破。
4. AI偏見
人工智慧偏差將在未來五年內爆發。人工智慧系統只與我們輸入的數據保持一致,如果我們輸入具有某些種族,性別或意識形態偏見的數據,那麼人工智慧偏見就會產生。不幸的是,許多AI系統現在都在接受這些不良數據的培訓。IBM研究人員正在考慮如何確保人為偏差不會影響AI。
MIT-IBM Watson AI實驗室正在研究使用計算認知建模來構建在決策中應用某些人類價值觀和原則的機器,這其中的一個關鍵原則是避免偏見和歧視。IBM研究人員開發了人工智慧演算法,通過從之前被認為具有歧視性的數據中學習,減少了訓練數據的偏差。IBM科學家還在開發一種無偏差的AI服務,a)補償數據偏差,b)跟蹤訓練集中的偏差,或者c)引入偏差。最終用戶可以確定每個場景中的可信度和偏差程度。
在未來的五年內,減少人工智慧系統的偏差將是人類信任人工智慧的關鍵,而且只有無偏差的人工智慧才能生存。
5. AI顯微鏡
2025年,世界將有一半以上的人口生活在水資源緊張的地區,因此科學家們正在努力收集相關數據以防止這種情況發生。但即使是能夠探測到水環境和化學物質的專門感測器,也不會無法預測意想不到的情況。
而檢測浮游生物是一種感知水生健康的有效方法,但因為它們的微觀大小,研究這些生物是困難的。IBM的研究人員正在建造小型、自主、人工智慧的機器人顯微鏡,可以監測浮游生物,更好地了解浮游生物的行為,以及它們如何應對環境變化,並預測供水威脅。顯微鏡的晶元可以捕捉浮游生物的影子,從而產生一個健康的數字樣本,而不需要聚焦。
在未來5年內,這些顯微鏡將發展的足夠先進,能夠在本地和實時分析解釋數據。
⑶ 大數據發展的前景怎麼樣
我國大數據產業發展得如何?未來發展存在哪些機遇和挑戰?
隨著信息技術和人類生產生活交匯融合,全球數據呈現爆發增長、海量集聚的特點。無論是國家、企業還是社會公眾,都越來越認識到數據的價值。因此,近年來,各地紛紛成立大數據發展局,企業紛紛推動數據資產治理,大數據輻射的行業也從傳統的電信、金融逐漸擴展到工業、醫療、教育等。一時間,彷彿各行各業都在談大數據,人人都在談大數據。但也有聲音說大數據迎來了「七年之癢」,面對大數據熱潮也需要一些「冷思考」。我國大數據究竟發展得如何?未來我國大數據發展還有哪些機遇和挑戰?
一、中國大數據產業進展顯著
過去幾年,大數據理念已經深入人心,「用數據說話」已經成為所有人的共識,數據也成了堪比石油、黃金、鑽石的戰略資源。五年來,我國大數據產業政策日漸完善,技術、應用和產業都取得了非常明顯的進展。
1、在政策方面,我國從中央到地方的大數據政策體系已經基本完善,目前已經進入落地實施階段。自從2014年「大數據」這個詞寫入政府工作報告以來,我國大數據發展的政策環境掀開了全新的篇章。在頂層設計上,國務院《促進大數據發展行動綱要》對政務數據共享開放、產業發展和安全三方面做了總體部署。《政務信息資源共享管理暫行辦法》《大數據產業發展規劃(2016-2020)》等文件也都已經出台。十九大報告中提出「推動大數據與實體經濟深度融合」,「十三五」規劃中提出「實施國家大數據戰略」。
衛健、農業、環保、檢察、稅務等部門還出台了領域大數據發展的具體政策。截至2019年初,所有省級行政區都發布了大數據相關的發展規劃,十幾個省市設立了大數據管理局,8個國家大數據綜合試驗區、11個國家工程實驗室啟動建設。可以說,大數據的政策體系已經基本搭建完成,目前已經紛紛進入落地實施甚至評估檢查階段。
2、在技術方面,我國大數據技術發展屬於「全球第一梯隊」,但國產核心技術能力嚴重不足。我國獨有的大體量應用場景和多類型實踐模式,促進了大數據領域技術創新速度和能力水平,處於國際領先地位。在技術全面性上,我國平台類、管理類、應用類技術均具有大面積落地案例和研究;
在應用規模方面,我國已經完成大數據領域的最大集群公開能力測試,達到了萬台節點;在效率能力方面,我國大數據產品在國際大數據技術能力競爭平台上也取得了前幾名的好成績;在知識產權方面,2018年我國大數據領域專利公開量約佔全球的40%,位居世界第二。但我國大數據技術大部分為基於國外開源產品的二次改造,核心技術能力亟待加強。例如,目前國內主流大數據平台技術中,自研比例不超過10%。
3、在產業方面,我國大數據產業多年來保持平穩快速增長,但面臨提質增效的關鍵轉型。2018年,我國大數據產業延續多年來的增速,繼續保持相對高速的增長。
據前瞻產業研究院發布的《中國大數據產業發展前景與投資戰略規劃分析報告》統計數據顯示,2015年我國大數據產業規模已達2800億元。截止至2017年我國大數據產業規模增長至4700億,同比增長是30.6%。初步測算2018年我國大數據產業規模達到5400億元左右,同比增長15%。預測在2020年我國大數據產業規模將突破萬億元。然而,綜合國內外環境、新興技術發展等多種因素,大數據產業的增速出現了下滑。我國的大數據產業也面臨著從高速發展向高質量發展的關鍵轉型期。
2015-2020年我國大數據產業規模統計情況及預測
數據來源:前瞻產業研究院整理
4、在應用方面,大數據的行業應用更加廣泛,正加速滲透到經濟社會的方方面面。隨著大數據工具的門檻降低以及企業數據意識的不斷提升,越來越多的行業開始嘗到大數據帶來的「甜頭」。無論是從新增企業數量、融資規模還是應用熱度來說,與大數據結合緊密的行業正在從傳統的電信業、金融業擴展到政務、健康醫療、工業、交通物流、能源行業、教育文化等,行業應用「脫虛向實」趨勢明顯,與實體經濟的融合更加深入。
二、中國大數據產業五大發展挑戰分析
雖然我國大數據總體發展形勢良好,也面臨難得的發展機遇,但仍然存在一些困難和問題。
1、涉及核心技術的產業發展薄弱,未能有效提升我國核心技術競爭力
核心技術的影響力在大數據產業有著極高的重要性。由於大數據企業在完成產品開發後,可以近乎零成本無限制的復制,因此擁有核心技術的大企業,很容易將技術優勢轉化會市場優勢,即憑借具體的信息產品贏得海量用戶獲得壟斷地位。當前,從大數據技術與產品的供給側看,我國雖然在局部技術實現了單點突破,但大數據領域系統性、平台級核心技術創新仍不多見。大數據處理工具都是「他山之石」,大部分企業用的都是國外的數據採集、數據處理、數據分析、數據可視化技術,自主核心技術突破還有待時日。尤其是開源產品的技術標准方面,我國的影響力尚亟待提升。
2、數據孤島和壁壘降低了大數據產業資源配置效率
大數據產業發展必須實現數據信息的自由流動和共享,如果數據不開放、不共享,數據整合就不能實現,數據價值也會大大降低。無論是政府數據、互聯網數據還是其他數據,數據擁有者往往不願對其進行開放流通。受制於前期信息基礎設施建設,目前我國政府數據往往還存在著諸多「數據孤島」和「數據煙囪」,數據價值難以發揮。
3、數據安全管理薄弱增加了大數據產業的發展風險
大數據技術為經濟社會發展帶來創新活力的同時,也使數據安全、個人信息保護乃至大數據平台安全等面臨新威脅與新風險。海量多源數據在大數據平台匯聚,來自多個用戶的數據可能存儲在同一個數據池中,並分別被不同用戶使用,極易引發數據泄露風險。利用大數據技術對海量數據(21.90
-5.19%,診股)進行挖掘分析所得結果可能包含涉及國家經濟社會等各方面的敏感信息,需要對分析結果的共享和披露加強安全管理。
4、產業壟斷與惡性競爭現象頻發,「劣幣驅逐良幣」現象明顯
由於資源型產業門檻低、利潤高,新興的大數據企業往往首先將目光盯在獲取數據資源上面。大量依託數據資源優勢的企業誕生,為大數據產業帶來了低附加值的壟斷經濟模式,使得依靠技術壁壘打江山的企業不得不面對殘酷的市場競爭,放緩了技術研發的步伐。同時,數據壟斷問題也愈發明顯。少數互聯網巨頭企業擁有巨大數據,不但對產業發展不利,甚至存在巨大的數據聚集隱患。
5、各地發展同質化嚴重,普遍存在重存儲輕應用的現象
由於缺乏統一的大數據產業分類統計體系和產業運行監測手段,各地大數據產業的定位相似,同質化競爭加劇。而盲目的重復建設,更是可能導致大數據產業過剩。同時,由於部分地區信息化發展程度有限,大數據應用場景不夠豐富,更是以數據中心等大數據存儲設施的建設作為發展大數據產業的關鍵,且規模巨大,目標動輒以百萬台計,後期若無法有效利用,將造成巨大的資源浪費。
三、未來三年中國大數據產業將呈現四大發展特點
未來三年,是我國大數據發展轉型的重要機遇期。大數據的發展本身也呈現著一些趨勢。在我看來,未來三年大數據行業有可能會呈現出如下特點:
1、大數據新技術繼續快速發展
未來大數據技術將會沿著工具平台雲化部署、多業務場景統一處理、專有高性能硬體適配幾個方面進行突破。目前大數據技術工具的主要應用模式為應用企業在自建機房內獨立部署,其存在資源浪費、彈性能力不足、管理復雜等缺點,這些缺陷可以通過基於雲計算技術的雲化部署方案解決,助力大數據技術工具的快速落地和應用;同時大數據技術工具主要瞄準的是分析型業務場景,但隨著電子商務以及智能終端的爆發性發展,轉賬、計費等事務型業務場景也需要大數據處理能力,所以未來的多業務場景統一處理技術將會得到充分發展;最後由於GPU/TPU等專用硬體的發展,此類專用硬體能夠助力某些大數據技術進行突破性升級,所以對新型硬體的適配成為很多大數據企業未來研發計劃的重點。
2、數據流通共享將迎來關鍵突破
這些年,推動數據開放共享的政策舉措一直在加強,然而效果與預期還有差距。可以說,技術手段將是數據流通共享瓶頸突破的關鍵。未來三年,隨著同態加密、差分隱私、零知識證明、量子賬本等關鍵技術的性能提升和門檻降低,隨著區塊鏈、安全多方計算等工具與數據流通場景進一步緊密結合,數據共享和流通將有望再前進一大步。
3、數據服務合規性將成為行業關注重點
近兩年來,隨著歐盟《通用數據保護條例》(GDPR)的頒布和正式實施,個人信息保護的重視程度被提到了前所未有的高度。GDPR對數據主體的權利規定細致入微,其「數據可攜權」「被遺忘權」等方面的規定可能會對我國數據立法帶來一定的參考。對我國企業來說,數據服務合規性的重要程度進一步提升,將對企業業務開展帶來重大影響。目前中國信息通信研究院正在著力推動的「可信數據服務」計劃也正是契合了行業的這一需求。
4、數據資產管理重要性將進一步提升
隨著大數據應用進入深水區,企業將越來越重視數據資產管理方法論體系建設——即從架構、標准、研發、質量、安全、分析到應用的統一,從而實現技術到業務價值的轉化和變現。未來三年,數據資產管理將仍是企業數據部門面臨的難點與挑戰。即使是領先的科技型企業,在數據資產管理這一課題上仍在不斷探索新的方法,如全鏈路智能管理體系、數據資產的貢獻度、數據基線度量與質量規范的工具化、可視化等。
四、四大建議應對挑戰
大數據產業作為具有國家戰略意義的新興產業,在發展初期不僅要充分發揮企業的主體作用和有效市場的主導作用,而且要更好發揮政府的引導作用。
1、要加強核心技術攻關與產業化推動
自主研發創新是提高大數據產業競爭力的主引擎。要徹底改變目前我國大數據產業創新能力不強、關鍵核心技術對外依賴度偏高的這一局面,必須抓住重點領域、關鍵環節和核心問題,找准著力點和突破口,加大政府財政資金的引導支持力度。為此,建議在國家層面上設立大數據重點領域的關鍵技術研發創新的國家財政專項資金,支持突破一批關鍵核心技術研發創新與應用,構建具有核心技術自主權的大數據產業鏈,形成自主可控的大數據技術架構,提高關鍵核心技術的自主研發創新能力,有效破解制約產業發展的瓶頸。
2、完善大數據安全政策
需要開展數據確權、資產管理、市場監管、跨境流動等數據治理的重大問題研究,協調有關部門共同推進數據治理的法制化進程,加強對敏感政務數據、企業商業秘密和個人數據的保護。同時,推動完善適用於大數據環境下的信息安全等級保護制度,建立兼顧安全與發展的數據管理和保障體系,加強數據安全評測、安全防範、應急處置等相關機制建設。此外,還要強化網路空間的安全信息共享與動態感知能力,提高重大風險識別分析水平。
3、鼓勵地方因地制宜發展大數據產業
大數據產業發展應注重差異化發展,形成差異化的產業布局。地方需要差異化發展,應該把大數據的發展重心放在因地制宜地促進應用創新上,放在打造完善的發展環境上,讓市場在大數據發展要素配置上起決定作用。各地要結合產業基礎和優勢特色,著重發展大數據特色場景應用,推動大數據與當地重要實體經濟行業加快融合。
4、推動行業加快大數據標准建設
當前大數據產業應用層出不窮,政府應通過標准化的途徑規范行業、整合資源,促進各方達成共識,為大數據產業的健康發展提供基石。尤其是通過加強快速迭代、市場認可度高的行業/團體標准研製工作,為用戶企業提供大數據產品選型指導,為數據安全提供保障,促進大數據交易等新興服務模式規范發展,對推動我國大數據產業進程具有重要意義。
⑷ 隱私計算-密碼學-同態加密
近年來,隨著大數據與人工智慧的盛行,針對個人的個性化的推薦技術的不斷發展,人們在享受便利的同時,也深深的感覺到無處不在的監控與監事,比如剛剛瀏覽了一個網站的商品,當去其他網站訪問的時候就會推薦類似的產品;剛剛搜索了某件商品,在很多其他的場景中都會給你推薦。這種體驗,談不上不好,也談不上多壞,但是如果仔細想想,就感覺自己的網上進行裸奔,個人隱私,一清二楚,毫無隱私可言,細思極恐。
不過隨著廣大用戶對於個人隱私的重視程度不斷加強,以及法律法規的不斷完善,針對個人隱私的保護提出了更高的要求,什麼樣的數據可以採集、收集與使用,如何使用都是一個比較敏感的問題。十三屆全國人大常委會第三十次會議表決通過了《 中華人民共和國個人信息保護法 》,並與2021年11月1日起施行。確立個人信息保護原則、規范處理活動保障權益、禁止「大數據殺熟」規范自動化決策、嚴格保護敏感個人信息、賦予個人充分權利等。新規施行後,違法的主體將 最高可處五千萬以下或者上一年度營業額百分之五 以下的罰款。
鑒於上述情況,近年來隱私計算技術被不斷的提及,源於其有優秀的數據保護作用,使得 「數據不出域、數據可用不可見、數據可算不可見」 ,限定了數據的使用場景,防止了數據的泄露,而引起了業界的熱捧。
隱私計算技術的演進歷程如下圖描述,以下是楊強教授在KDD 2021中國區的分享材料:
可以看到,隱私計算技術從1979年就開始了,最開始是安全多方計算、到差分隱私、到TEE, 再到最近火的不能再火的聯邦學習 ,一系列的技術應運而生。那為啥現在隱私計算這么火呢。
註:隱私計算技術成熟度曲線
但是這些技術本身的安全加密都是採用共同的方法與策略,下面講述下隱私計算的加密技術。
本文主要介紹同態加密,
眾所周知,優秀的程序員需要 嚴謹的邏輯思維與具象能力 ,當然在材料的時候,可能需要適當的渲染。但是對於技術的理解,對技術的探索,嚴謹的邏輯與堅實的推理是非常重要的。所以,對於「數據加密」這個命題,需要進行一番探索。
如此三態合一,即可保障數據的全鏈路的生命周期安全 。
那麼有沒有辦法解決數據計算的安全問題呢?答案就是 同態加密技術 。保障數據的運行態的安全,那麼同態加密技術具體是如何實現,如何應用,並且有哪些限制呢?
什麼是同態加密? ,引用Gentry大佬的原話:
同態加密(Homomorphic Encryption, HE),指滿足密文同態運算性質的加密演算法,即數據經過同態加密之後,對密文進行某些特定的計算,得到的密文計算結果在進行對應的同態解密後的明文等同於對明文數據直接進行相同的計算, 實現數據的「可算不可見」 。同態加密的實現效果如圖所示。
舉個例子: 國內某家大型的三甲醫院,由於歷史悠久,並且醫術精湛,歷史遺留了大量的用戶病例數據 。如今思考基於這些病例數據進行建模分析。但是由於數據量特別巨大,醫院本身的IT資源有限,計算能力不足。
這個時候,雲廠商找了過來。但是對於醫院來說,這些數據本身是用戶的隱私信息,並且也是醫院的核心價值,所以盡管雲廠商再三保證數據安全, 但是醫院還是不能夠放心的將數據上傳到雲廠商進行計算 。
正當這個事情推進不下去的時候,雲廠商從密碼行業花大價錢招來某個大牛,大牛提出一個方案,這樣吧,我們現在有 這樣一門技術,不需要傳輸明文數據,只需要傳輸密文就好,而且加密秘鑰由醫院自己保存,我們基於上傳的密文數據做不解密的密態運算( 並計算函數醫院提供就好),這樣數據不會泄露,雲廠商對數據無感知,之後傳回密文結果,醫院自己解密就好 。醫院一聽非常高興,那就這么辦吧。
下面將核心流程描述下。
這里,大家可能有個問題,這個f應該是什麼樣的函數,有什麼樣的限制條件?HE方案是支持任意的數據處理方法f,還是說只支持滿足一定條件的f呢?根據f的限制條件不同,HE方案實際上分為了兩類:
Paillier加密演算法是Pascal paillier[1]在1999年發明的概率公鑰加密演算法,該演算法 基於復合剩餘類的困難問題,是一種滿足加法的同態加密演算法 ,已經廣泛應用在加密信號處理或第三方數據處理領域。
前面我們分析過 同態加密的核心流程 ,大家可以一起回憶一下。核心的函數包括:秘鑰生成、明文加密、密文解密,下面我們來一步一步的分析,並且描述下,
秘鑰的生成主要有如下的步驟,
下面介紹一個完整的同態運算,m由 組成,介紹下同態加密的是如何使用密文計算的。
⑸ 同態加密的同態加密的主要應用
雲計算、電子商務、物聯網、移動代碼等。