零知識科技徐茂桐:隱私計算的終極發展目標——保護每個人的資料

買賣虛擬貨幣

在鈦媒體、鏈得得聯合六脈數字科技、區塊鏈服務網路BSN聯盟共同發起的“T-EDGE X 全球產業區塊鏈峰會”上,零知識科技CEO徐茂桐對隱私計算的現狀、推動力、行業痛點等方面作了分享。

作者|程姝琪來源|鏈得得

7月17日,鈦媒體、鏈得得聯合六脈數字科技、區塊鏈服務網路BSN聯盟共同發起“T-EDGE X 全球產業區塊鏈峰會”。本次峰會上,零知識科技CEO徐茂桐對隱私計算的現狀、推動力、行業痛點等方面作了分享。

他認為,隱私計算最大的推動力其實是監管,這個在世界範圍內都是很明顯的大趨勢。個人隱私保護的崛起,一方面最大的推手還是國家立法層面,同時民眾對自己資料隱私認知也在逐漸提升。

他表示,整個隱私計算行業還是處於非常早期的階段,目前從金融領域切入是比較可行的,因為它的資料價值比較高,同時金融領域的資訊化程度比較深,資料結構化程度比較高,相信和未來五年、十年隱私計算的發展相比只是邁出了一小步。

最後,對於行業的發展他表示,隱私計算終極發展目標是保護每個人的資料,是把資料做確權,最終透過這些資料產生的價值可以回饋給每個使用者,或者回饋給這些企業,真正實現資料成為生產資料的巨集大目標。

以下為徐茂桐演講內容,略經鏈得得編輯:

大家好,我是零知識科技CEO徐茂桐,今天非常榮幸有這樣一個機會介紹隱私計算。在我們兩年半以前開始創業的時候隱私計算還是極其小眾的市場,在過去大半年的時間裡才有更多的關注,也是今年第一波有大的企業或者大型產業機構真正深入調研隱私計算,讓未來數字化對產業升級帶來影響。

零知識科技是一個基於先進的安全多方計算、隱私計算技術的資料安全公司。

監管:隱私計算最大的推動力

首先,我們為什麼需要隱私計算?眾所周知我們現在處於一個資訊時代,資料的規模在逐年的增長,最近10年中資料規模增長40倍,但是原油的產量過去10年只增長了20%。當提到爆發式增長、指數級增長的時候我們講的是資料,這也是對於年輕一代最大的歷史變革。

我們每天都在產生各種各樣的資料,這些資料從歸屬權角度都是屬於個人的,這些資料的使用權在各個機構,但是歸屬權是個人的。在2.0的時代,像亞馬遜、谷歌、微信等等,其實這些資料都是在分散狀態中,實際上我們最終的願景是把資料的歸屬權交還給資料的生產者,讓每個人可以管理資料,可以授權一些服務的提供商使用,但是我覺得這個方向還有很長的路要走。

我感覺隱私計算最大的推動力其實是監管,這個在世界範圍內都是很明顯的大趨勢。首先2018年歐盟透過了GDPR,GDPR是一個通用保護個人隱私的法案。目前GDPR也是全球其它國家立法的基礎、參照系。國內《網路安全法》三年前就提出了,過去一年中國家對於資料隱私的立法逐漸出臺,同時隨著前一段時間的微博、華住等等這些比較重大的資料洩露,個人隱私保護的事情也逐漸出現在大眾視野當中。我認為有兩方面的推手,一方面最大的推手還是國家立法層面,同時民眾對自己資料隱私認知也在逐漸提升。

美國2020年已經實施CCPA,是在加州的一個消費者隱私法,然後逐漸推向全美國。目前接觸到一些大企業,尤其出海型企業,頭條、抖音包括快手,其實他們在各個國家都要做這種資料隱私的保護。在歐洲他們需要做GDPR的規範,在美國需要做CCPA的規範。

資料價值示範的瓶頸我感覺主要在資料確權,所有人希望把資料變成生產要素,這也是國家層面的一個定性,資料屬於生產要素,但是如何發揮生產要素使用生產要素,實際上我們需要的是安全的資料共享技術。

這部分簡單說一下,首先資料價值釋放需要資料共享、整合和分析。但是傳統的資料共享手段無法安全地做到資料的安全共享和流轉。A把資料直接發給B,大資料公司收集各方資料做建模最終可以完成資料價值提取,但是這個過程中就存在資料洩露的風險。隱私計算就是要實現資料的可用但不可見,進而實現資料的確權、定價,真正把資料變成一個生產要素。

零知識科技在隱私計算行業活躍三年時間,我對資料行業的判斷是,目前我們處在企業內部的資料整合階段,比如說去年資料行業什麼最火?資料中臺。資料中臺把一個大型企業的各個資料觸點整合,把各個系統打通最終可以實現企業內部的資料分析、快速決策,這個階段也會再持續一段時間,從之前的資訊化到去年的資料中臺概念到未來的企業內部資料整合,我認為是一個非常大的市場,這也誕生了很多上市公司,優秀的大型企業。

我感覺未來的十年當中一個重要的驅動因素就是企業間的資料流轉。資料融合可以提升資料價值。但是每年國內的灰黑產交易,包括個人隱私分析的隱私資料都會造成非常高額的經濟損失,這部分不再一一列舉。我們需要透過技術賦能保護個人和公司隱私,這也是一個價值趨勢。

長期來講肯定是透過立法手段以及大眾認知解決個人資料的安全管理,無論透過消費者還是使用者透過授權方式或者技術的方式,最終實現的是個人管理個人資料。

目前隱私計算的市場滲透率是極低的,只有1%的公司是在共享或者變現自己的資料,而且他們並沒有用安全的手段,大資料市場規模也是巨大的。假設未來隱私計算可以變成資料共享的基礎設施,這個市場將是萬億級的市場。

美國非常著名的研究機構Gartner認為隱私計算處於一個爆發的前期。我覺得有幾個催化劑,首先是監管,第二就是它的滲透力極低。第三就是潛在市場供應巨大。假設所有的資料能夠做確權,交易,進而榨取資料價值,那麼無論對企業還是對社會都可以產生巨大的正面作用。

技術安全多方計算MPC

接下來說我們做的技術安全多方計算MPC。MPC是1982年由我國的姚期智院士提出的加密資料上操作方法,他當時提出一個百萬富翁的問題。比如說比爾蓋茨和巴菲特兩個人相比誰更有錢,又不參考福布斯,那怎麼不向第三方暴露有多少錢的情況下比誰更有錢。實際上是透過兩方的安全多方計算利用混淆電路解決這個問題。實際上怎麼做的呢?他需要把原始資料在一個分散式網路當中,有多個參與方,比如說比爾蓋茨和巴菲特兩個人共同參與,他們各自持有資料進行輸入,把這個資料透過一些演算法,比如說混淆電路或者是秘密分享做加密,直接在密文的資料上面跑,就是運算邏輯,然後在問題當中採用比較的運算邏輯最後產生一個結果。

這是一個典型案例,其實就是密碼學學界和工業界一直處於肩並肩往前推進的狀態,其實它和AI有一定區別。AI領域目前工業界還是利用十年、二十年以前的神經網路、深度機器學習的框架。但是密碼學的學界和工業界是挨的比較近的,最近的方向就是兩方可以變成多方、甚至安全多方的計算協議,同時也有一些不同的技術路徑。

技術這邊不再贅述了,非常直觀的舉一個例子。一個傳統的資料分析,我們把三方的資料彙集到一個可信第三方,一個大資料公司做分析、建模,但是安全多方計算的環境下或者聯邦學習,都是無需一個可信第三方,直接把密文的資料做一些秘密分享等等,我們直接在密文的資料上構建一個計算邏輯,最後獲得一個結果。

它有幾個層級:首先是無需第三方的歸集,第二就是參與方發出的都是密文資料,整個運算過程中沒有明文資料存在,這樣就可以保護各個資料方的隱私。

隱私計算的一些應用場景其實非常多,每個垂直行業都有資料共享的需求。目前看起來它的特點就是隱私不洩露。這些資料型別可能是比較敏感的生物資訊、個人金融資訊等等。目前我們探索比較深的場景是金融風控,還有像反欺詐等等這。它在醫療、精準營銷這些領域也是有很多應用的場景。

企業或者部門,或者企業之間、部門之間的資料共享場景通常包括模型的安全分析和訓練,就是多方的資料訓練一個模型或者做一次模型推斷。比如說聯合的黑名單查詢、資料碰撞,安全的資料匹配等等。

安全多方計算和區塊鏈之間的協同作用

安全多方計算和區塊鏈之間其實是有非常多的協同作用。從概念上來講安全多方計算的理念和區塊鏈非常接近。區塊鏈大家可能知道一組互相不信任的節點共同維護賬本,保證賬本的安全性不可篡改性。安全多方計算是互相不信任的節點共同在密文的資料上進行運算,最終共同獲得一個結果,所以它們兩個都是分散式的、去中心化的。當這兩個結合的時候可以產生1+1大於2的效果,比如說去中心化,可靠性更強,每次查詢的記錄可以利用區塊鏈做一次指紋的上鍊,可追溯不可篡改,同時透過隱私計算可以保證資料採用的集約性以及企業和個人的保護。

目前我們和一些聯盟鏈,包括以太坊這樣的公鏈合作,可以搭建在他們上面呼叫隱私計算網路,最終一些資料的查詢包括清算是在區塊鏈上執行的,我們相信這樣的方案也適合目前各個行業,包括政府正在大力推進區塊鏈,我們就可以把隱私計算加上區塊鏈同時賦能資料共享這個行業。

目前資料融合也是一個國家戰略,中國信通院工信部旗下的研究機構開始制定一些標準。比如說基於安全多方計算的技術要求和測試方法。我們也有參與的像可信硬體、聯邦學習這些不同的新技術的初步標準。同時國際上像IEE、IEC都在推進安全多方計算。除了我們之外還有螞蟻金服、百度、阿里巴巴這些公司的參與。

剛才講了很多關於技術的方面,我也覺得在過去這兩年裡我們也做了不少的嘗試,一會兒跟大家分享一些場景。目前我們的場景主要集中在金融行業、更多的是賦能企業之間的資料共享。但是我認為可能三五年之後隱私計算可以更多利用到個人的隱私保護裡面去。

目前其實個人對於自己的資料價值還沒有那麼強的認知,我認為監管是一方面,更多可能需要各個行業有這樣的推手,希望大家知道自己的隱私或者自己的資料是非常有價值的事情。

行業痛點:隱私的資料無法被有效的共享

首先我想跟大家分享兩方的安全計算場景,金融模型的安全分析。這兩方一個是金融機構,比如說像資管的公司,大型資管機構。另外是模型的提供方——金融科技的機構,有自己非常好的模型,比如說風控模型對持倉的風險計算模型。比如說像歸因、風控等等,這個場景下其實金融機構的持倉資料有非常強的保密要求,不可以洩露出來。同時金融科技的模型也需要做保密,尤其是模型引數需要保密。我們實際上提供了一條安全的API,在這條API把金融機構的持倉科技,以及金融科技Fintech核心引數,兩方作為密文輸入進來,整個運算過程中,我們作為技術提供方是不需要參與到運算的,就是我們不存在拿到任何一方客戶的資料。

接下來就是兩方共同做計算,在密文的資料上直接跑模型,最終得到一個結果,可能是風控的結果或者歸因的報告,這樣的話無需公開運算引數和交易資料,同時也不會洩露任何交易策略或者模型的一些情況。

這個案例其實我覺得目前也是很多資管機構正在尋求的,他們可能之前應用的是第三方的分析模型,但是隨著他們對資料的保密要求越來越高,也會切換到用這種安全多方計算或者可信計算做可信模型的分析。

第二個就是敏感資料以及黑名單的安全查詢,這是兩方的碰撞場景。比如說一個銀行想查一個大資料公司的黑名單。但是他並不可以把自己想查誰,比如說我查張三、李四這些資料告訴第三方的提供商,原因是提供商可能把這些使用者的資訊賣掉,或者是儲存下來,這樣我們可以用安全多方計算做一個兩方的安全匹配。就是相當於我們把中間的交集部分求出來,同時不暴露查詢的條件——就是查了誰。

之前的方案,比如說我需要一個第三方的,需要做資料脫敏或者資料的混淆最後導致匹配率非常低的,同時費用也會比較高。其實用安全多方計算可以更簡單的同時更便宜地解決這個問題。

目前安全多方計算也可以滿足比較標準化、大規模的查詢場景,基本上效率在可接受、可商用的一個層次。

第三個場景其實是一個跟區塊鏈結合比較緊的聯合風控場景。我剛才已經提到有黑名單共享,其實更進一步,尤其在金融機構的角度更想做多維度的資料風控,就是信貸風控或者保險反欺詐或者其它的風控場景。這個時候很有可能需要多個資料來源,比如說需要五個不同的資料來源一起組一個模型,甚至訓練一個模型。這種情況下我們五方都不可以把資料給到互相,因為相當於洩露。這樣的情況就可以透過安全多方計算或者聯邦學習的方式做模型推斷或者模型訓練,最終得到的是一個風控結果。我為每次資料的呼叫付費而不是為了資料本身付費,這樣其實也保證了這些資料來源的資料安全。

目前很大的趨勢就是各地都在成立大資料局、大資料交易中心,他們希望把一些當地企業的資料做變現。在這種大環境下我們更需要用隱私計算的方式賦能這些資料的安全、合規的共享,比如說和企業的共享,和金融機構的共享甚至是跨政府部門、跨省的資料共享。

這個場景下同時可以用到區塊鏈,我們可以用聯盟鏈收集這些資料指紋,可以把查詢記錄上鍊,這個時候就不會存在之後有查詢方面的糾紛或者監管機構可以回去查資料指紋,可以有一個全域性的合規和把控。

總結一下就是目前的行業痛點是隱私的資料無法被有效的共享,同時一些風控,比如說複雜的風控模型由於以前的資料提供方不合規所以目前也停擺。所以可以用安全多方計算加區塊鏈的聯合解決方案賦能這種風控的一些場景。

同樣在營銷領域也有非常多的兩方或者多方做聯合查詢或者聯合計算,甚至聯合建模的一些場景。比如說像異業的合作,比如說保險公司和電商他們想要找到共同的使用者標籤最佳化自己的保險產品或者投放策略。或者像廣告主和平臺,他們想去更好地追蹤自己的轉化率,ROI等等這些資料都可以用到安全多方計算。同樣在營銷場景當中區塊鏈起到的更多是去記錄所有的查詢,去記錄所有的查詢包括運算的發生最終可以有一個溯源機制。

最後一個是我們跟一個專門做大宗商品風險管理的機構一起設想的一個場景,當然這個場景還沒有實施,只是挺有意思的可以跟大家討論分享的案例。

目前很多央企或者地方國企有比較大的大宗商品的風險敞口。中航的石油寶在期貨交易中損失很大。為了提高能力同時保證企業的機密資料,這些資料到底有多少風險敞口。其實從國家層面可以對整個行業做一個風險篩查。比如說敞口大於一個什麼比例,同時我想知道全行業的風險平均的情況,這個時候我們都可以用安全多方計算或者隱私計算做調查。

如果可以把這些資料按時的提交,同時能找到一些非常特定的風險情況,比如說某個公司的重大的風險敞口,這個其實能非常有效的保障投資人,保障國企的抗風險能力。

剛才主要跟大家分享了幾個案例,這些案例主要在金融行業,也是我們目前主要進行的相對標準化,可以透過SDK或者一些解決方案能快速搭建的一些場景。通常情況下都是兩方或者多方需要聯合參與,因為一般都有兩個資料的提供方。

行業未來的終極發展目標:保護每個人的資料

最後我想介紹一下我們團隊,我們是在大概三年前成立的。我之前在紐約大學,在復星集團,其他成員均有在國內外頂尖科研、技術和金融機構有長期工作經驗。

隱私計算這邊我們一直都是屬於學界帶著工業界往前走的狀態。最新的安全多方計算的協議也是在過去兩三年才真正能有一個比較大的效率提升。SPDZ安全多方計算協議在2014年剛推出的時候比明文計算慢幾千倍、上萬倍左右。但是去年的時候最新的協議可以做到幾十倍的慢於雲端計算的效率。

中化集團,京東還有復星,我們是主要是把隱私計算模組搭載在他們的資料中臺當中。

我覺得整個隱私計算行業還是處於非常早期的階段,我們也是要想從哪個行業入手把這樣一個平臺級的技術推動出去。我們目前覺得在金融領域,因為它的資料價值比較高,同時金融領域的資訊化程度比較深,資料結構化程度比較高,這個領域我們做了比較多的實踐,但我相信和未來五年、十年隱私計算的發展相比只是邁出了一小步。

這個行業未來的終極發展目標是保護每個人的資料,大家把網際網路叫作資訊的高速公路,其實隱私計算就是保障這條高速公路運轉以及收費站。把資料做確權,最終透過這些資料產生的價值可以回饋給每個使用者,或者回饋給這些企業,真正實現資料成為生產資料的巨集大目標。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;