隱私計算:讓資料成為資訊時代的生產要素

買賣虛擬貨幣

作者 |  Felix Xu

責編 | Carol

出品 | 區塊鏈大本營(blockchain_camp)

資料是現代商業與個人的核心價值與重要資產。資料正在重新塑造人類生活的方方面面,IDC Research統計2019年大資料和分析市場的銷售收入約為1870億美元。跨機構、跨行業的資料融合、聯合分析和建模的需求日趨增加。

但由於資料本身可複製,易傳播,一經分享無法追蹤,資料資產的確權困難,商業化被嚴重製約。在傳統大資料分析中,資料的集中化收集容易導致隱私資訊洩露等風險。私有化部署則需要開發人員現場部署模型於資料來源的伺服器上,耗時耗力,且演算法也存在洩露隱患

此外,資料隱私監管日益加強,中央出臺了《關於構建更加完善的要素市場化配置體制機制的意見》,首次將資料納入生產要素。2019年下半年,監管部門則密集出臺了《資料安全管理辦法》、《App違法違規收集使用個人資訊行為認定方法》、《個人金融資訊(資料)保護試行辦法》等多項徵求意見稿及草案。

針對資料共享面臨的問題,筆者認為隱私計算技術可為業界提供新思路,賦能資料確權並實現資料”可用但不可見”。設想參與資料分析的各方,互相看不到資料,但是可以共同做分析甚至訓練模型,將最終結果傳送給資料付費方,即可杜絕資料洩漏的風險。目前安全多方計算、聯邦學習等隱私計算技術逐步走向成熟,在涉及使用者隱私資料的金融、醫療、政務等領域中,讓機構間的資料合作成為可能。

而隱私計算與區塊鏈技術的結合,既能保證輸入資料可信,亦可隱藏運算過程,可謂魚和熊掌兼得。本文中筆者將簡單介紹安全多方計算的原理,並拋磚引玉介紹潛在應用。

安全多方計算(Secure Multi-Party Computation, MPC)技術,亦稱安全計算(Secure Computation)和隱私保護計算(Privacy-Preserving Computation)。安全多方計算是當今密碼學的一個重要分支,是繼成熟解決資料加密儲存、傳輸之後的重要嘗試,在密文資料上直接構建運算。

具體而言,安全多方計算由 n 個互相不信任的參與方進行,聯合對一個協商確定的函式進行計算,能夠保證參與方的隱私輸入資料 x1,x2,···,xn 無法被其他參與方獲得。姚期智院士(Andrew C.Yao)於1982 年發表的文章“ Protocols for Secure Computation”首次提出姚氏百萬富翁問題和安全多方計算的概念。這個有趣的問題是,兩個百萬富翁希望知道誰更富有,但是不希望對方或第三方知道自己的財富值。

之後 Goldreich,Micali 和 Widgerson 等密碼學家將這個問題一般化成為現在的安全多方計算問題。此後該領域內學術研究和商業應用蓬勃發展,如今安全多方計算協議是多種密碼協議的組合,如同態加密、零知識證明、秘密分享等。

近10年來,密碼學界對安全多方計算的探索有了長足的發展,筆者在實踐中發現一些特定協議的計算效率已經達到商用程度。與區塊鏈類似,安全多方計算同樣存在“不可能三角”,需要在安全性,通用性,計算效率這三點之間權衡。工業界,如ARPA,根據不同場景最佳化協議使之滿足商業需求。

當今使用的安全多方計算技術按底層技術分為兩個分支,基於混淆電路(Garbled Circuit)的與基於秘密分享(Secret Sharing)。混淆電路與不經意傳輸(Oblivious Transfer)為姚期智院士提出的安全計算技術路徑

簡單來講,基於混淆電路的協議更適用於兩方邏輯運算,通訊輪數固定,但是拓展性稍差。另一類基於秘密分享的安全多方計算中,資料輸入和計算中間值都會以“密文分片”的方式存在。秘密分享技術可以把隱私資料切割為2份或更多份後,將隨機分片分發給計算參與方,這個過程保護了資料隱私又允許多方聯合對資料進行計算。之後,就可以利用分片間存在的同態計算性質來實現在分片上計算並重建得到隱私資料計算結果。

基於秘密分享的安全多方計算目前主要由歐洲密碼學界主導,如Smart, Damgard等密碼學家,其拓展性較強,理論上支援無限多方參與計算,計算效率高,但通訊負載較大。

隱私計算正在逐步被應用於金融和保險風控、OTC交易、資產管理、網際網路營銷等領域。同時作為一項前沿技術,隱私計算的從業者在積極推動技術的標準化工作。

2019年6月,工信部直屬單位中國資訊通訊研究院正式釋出《基於安全多方計算的資料流通產品技術要求與測試方法》行業標準,ARPA、阿里巴巴、螞蟻金服、百度等企業參與制定。國際上,IEEE安全多方計算國際標準的制定和MPC Alliance企業聯盟的建立也預示著隱私計算從學術界向工業界的拓展。筆者接下來分享幾個值得探索的隱私計算應用場景。

金融、保險黑名單安全查詢

黑名單主要用於記錄個人或企業客戶的不良行為。每個機構都會維護多種業務的黑名單,從小型商業公司到跨國機構,從金融交易到信用記錄。機構之間的黑名單共享和查詢有助於幫助機構規避風險,如多頭借貸、多頭騙保等,然而對於黑名單的明文共享既危害使用者隱私也洩露商業機密。利用隱私計算進行的黑名單查詢可以在保護隱私的情況下降低機構風險。這類計算需要對比兩組列表並找出其中重合的部分,這個過程應能保證參與方無法獲得除結果外的資訊,並可以規避被查詢方獲得查詢條件。

營銷轉化率計算

轉化率計算這類資料共享問題即“隱私交集問題”。兩家公司分別持有自己業務範圍內活躍使用者資料集,一方擁有與第一個活動相關的使用者列表,例如在網際網路上檢視廣告的使用者,另一方擁有在第二個活動中進行過交易的使用者列表,例如購買過廣告商品的使用者,以及與每個使用者關聯的數值(比如該使用者的支出)。

其中一方希望瞭解他們共有的使用者數量以及相關數值的總和,而並不希望分享更多的資料。例如,廣告主希望知道“三十歲一下的男性消費總和是多少”,可以透過隱私計算在不共享資料和查詢條件的情況下獲得交集,計算轉化率等指標。

多維度風控模型

目前信貸風控需要透過多個資料來源採集資料,進行決策樹、邏輯迴歸、隨機森林等運算。從2019年下半年開始,國家對非法採集販賣個人隱私資料的大資料公司進行了整頓,原始資料愈加難以獲得。

隱私計算可以合規的連結同業和異業公司,組成資料聯盟,在各方輸入資料不洩露前提下進行分散式模型推斷或者訓練,有效降低多頭信貸、欺詐等風險。同時風控模型的引數在計算中亦不會暴露,保護了模型提供方的智慧財產權。

結語:資訊時代的大廈建立在資料的地基上,隱私計算即為這座大廈的電梯。筆者認為隱私計算目前在我國的仍處於萌芽階段,可以預見的是隨著國家對隱私資料監管的加強,企業於個人對自身資料價值重視程度的提高,隱私計算將在2020-2030年實現爆炸式增長,甚至有望從零發展到資料共享的技術基礎設施。

目前隱私計算行業既有螞蟻金服、百度、微眾銀行等大企業,也有ARPA、華控清交等具有技術實力的創業企業,以及中國資訊通訊研究院、央行等國家研究機構。未來發展如何,讓我們拭目以待!

作者介紹:

Felix Xu, ARPA聯合創始人 & CEO,紐約大學資訊科技和金融專業,曾於復星集團負責金融科技和區塊鏈領域的研究與早期投資。此前曾任職於紐約Sackler Family Office, Vertical Research Partners等機構。Felix於2018年創立ARPA,致力於新型隱私計算技術的開發,參與了與中國信通院牽頭制定的安全多方計算行業標準。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;