隱私洩露事件頻發,隱私計算如何化解?

買賣虛擬貨幣

3月25日下午17點30分,PlatON演算法科學家謝翔博士受邀做客TokenInsight《對話首席》線上AMA系列活動直播間,圍繞近期新浪微博平臺使用者隱私洩露事件發表看法,探討如何運用隱私計算保護資料隱私,同時分享了PlatON隱私計算最新進展。本次直播也得到了鏈聞、金色財經、PANews等媒體的支援。

以下是本次直播精彩實錄:

1. 不知道您最近有沒有看到關於新浪微博平臺使用者隱私資訊洩露事件的相關訊息,這件事受到了很多網友的關注。其實這並不是第一次新浪微博的洩露事件,早在2011年新浪微博就發生過一次比較大型的XSS攻擊事件(跨站指令碼式攻擊),能否請您談一下關於這個事件的一些看法呢?

其實我們的理解是,現在的網際網路行業在一定程度上獲取隱私資料,以此盈利。比如新浪微博,在平時收集到大家的隱私資料,因為一些操作或管理的失誤,很容易造成隱私洩露的問題。

這裡涉及到兩個方面:其一,傳統網際網路巨頭的行業模式與使用者隱私保護之間的矛盾,這一點不可跨越。我們希望在新的架構上避免這一點;其二,網際網路偏中心化的模式也會帶來隱私洩露的隱患,雖然在管理上或者業務處理效能上有較大的好處,但對於隱私安全來說,是存在風險點的。比如新浪微博的問題,本質是一個管理上的問題,沒有很好地管理隱私資料,導致最終的洩露問題。

但必須承認的是,資訊洩露的解決在技術上是一個非常複雜的過程,不是簡單地依靠換技術或換架構就能顛覆的。只能說,我們更傾向於分散式的架構,所有的資料被保護起來,這與以往單純儲存資料是不同的。

我們認為,隱私計算是唯一能改變現在隱私洩露頻發趨勢的新方式,這也是我們的初衷。

2. 其實這種擁有大量使用者的平臺發生資訊洩露的事件時有發生,這次新浪微博的洩露事件也是有人用爬蟲、連線API等方式暴力獲取了相關資料。我們知道PlatON主要的研究方向是隱私計算,能不能從您的角度分享下PlatON的技術是否能夠用來解決大型平臺資訊被人暴力獲取的問題呢?

很多隱私的問題都是在資料使用中出現的問題,PlatON隱私計算其實就是致力於在資料流動的過程中保護資料的隱私。

PlatON隱私計算的基本思路就是利用密碼學技術,保證資料在使用的過程中不洩露隱私資料。不能說完全解決隱私洩露問題,但至少提供一種新的解決方案,降低駭客洩露資訊的可能性或提高洩露資訊的成本。

我們的定位分為兩種。一種是基於區塊鏈來搭建分散式經濟體基礎設施,為上層的經濟活動提供平臺;另一種是隱私計算,讓資料在真正的流動過程中把關鍵部分隱藏起來。

基於這兩者,我們是希望搭建一個全數字化的分散式基礎設施。當然,我們內部是對這個目標的難度是有充分認知的,將會長期投入來完成,並吸引更多開發者參與搭建。

我們希望能為現在嚴重的隱私問題做出一些貢獻,但具體能做到什麼地步,還需要等到五到十年之後,當我們有了一定積累,基礎設施更加完善後再來評判。對這件事情,我們是充滿信心的。

3. 隨著資料時代的到來,隱私受到洩露的事件也不斷髮生。隱私計算是一個在傳統行業和區塊鏈行業都備受關注,同時又具有較高技術含量的研究方向。有人說區塊鏈技術天生適合隱私計算,能否請您針對這個觀點分享一下您的看法呢?

其實這裡涉及到一個理解誤區。我個人認為,區塊鏈和隱私計算其實是沒有關係的。

區塊鏈最原始的形態是比特幣,如果大家讀過比特幣相關的白皮書,就會了解到,比特幣是沒有任何隱私保護的。另外,大家對於比特幣、區塊鏈有一些概念上的誤解,比如說Cryptocurrency,準確的說法是密碼貨幣,不是加密貨幣。因為從密碼的角度,加密只是密碼學裡面一個非常小的部件,而有加密就一定會有解密。在密碼學的圈子裡,經常拿這個來看玩笑,如果有加密貨幣,就一定會有解密貨幣。

而且,在區塊鏈或比特幣裡面,其實沒有用到太多密碼演算法,最多用了簽名和Hash。

區塊鏈共識的本質是所有資料完全備份,並向所有人公開,從一開始就不具有隱私保護的功能。當然,區塊鏈為我們提供好的東西,有可能提供分散式基礎設施,實現支付功能。

因此,區塊鏈和隱私計算是相對獨立的,但又必須聯絡在一起。打個簡單的比方,隱私計算在上層和業務聯絡,能夠保護資料的隱私;區塊鏈在下層作為分散式經濟體基礎設施,提供支付和結算的功能。這對應到PlatON團隊的分工,隱私計算團隊和區塊鏈團隊是並行的,只是在後續將結合在一起。

4. 專注隱私計算方向的專案目前的技術路徑都不太一樣,能否請您介紹下PlatON專案在隱私計算上主要技術架構呢?

隱私計算是一個大的範疇,每個團隊實現的路徑各不相同。而PlatON是以密碼學技術為主,結合可信硬體等技術來實現隱私計算。從底層往上來看,有基礎的密碼學演算法,有區塊鏈,有隱私AI框架,有隱私資料平臺產品。

實際上,密碼學技術和可信硬體技術各有優劣。密碼學技術從演算法層面來說,有足夠強的安全性和理論支援,但代價是效能不夠;而基於硬體,需要對某一實體有強大信任,優勢是效能好。在商用上,我們往往要根據需求來選擇。而PlatON的選擇是先以密碼學為主,再逐步擴充套件到隱私AI的技術。

原因很簡單,我們不是純粹為了做技術而做技術,我們的最終目的是交付可部署、可運營的商用產品,密碼學只是一種技術實現。

在密碼學技術上,我們會結合安全多方計算、零知識證明和同態加密等技術來保護資料隱私,這是我們最擅長的地方。在此基礎上,我們後續再整合類似TEE的可信硬體技術來達到客戶的要求。

總結一句話,就是我們以最終的交付為最終目的,而不是以純技術為最終目的。

5. PlatON在2019年的活動中曾經說過2019年將是隱私計算元年,能否請您分享下2019年PlatON最大的進展以及2020年的一些發展規劃呢?

首先說下背景:2017年初,考慮到國內外資料隱私保護現狀,將可能導致新興市場的產生,PlatON加大對密碼學的投入,並與國內外權威密碼學專家密切接觸,邀請加入我們的隊伍。當年9月份,在萬向峰會時,開始提出安全多方計算的概念,但當時大部分人對此還不太瞭解。

從2017年初到2019年,我們進行了一些探索,包括技術選型、工程化等方面的探索和確定。期間,也就是從2018到2019年,市場上普遍都是“安全多方計算”的聲音,我們也由此看到了隱私計算的巨大潛力。

當然,從認知到實踐,還是有一定過程的。我們意識到,如果只是泛泛地做隱私計算的話,是沒有固定的目標市場的,也不知道為誰服務和如何提供服務。由於在AI層面,市場前景和應用廣泛度足夠大,將隱私保護技術和AI結合,將發揮前者更大的作用。

基於此,2019年,我們在隱私計算領域最大的進展是確定了隱私AI作為未來的核心方向,元件了強大的AI團隊,並與密碼學團隊一起確定了技術框架和產品框架。

而2020年,我們在隱私計算最為重要的兩個工作是隱私AI框架Rosetta的釋出和資料銀行產品的釋出,並基於此開展一系列產品及社羣的推動工作。隱私AI框架Rosetta是我們將密碼學和AI框架(例如Tensorflow)相結合進行開發,讓AI工程師沒有瓶頸地開發產品。希望透過開源的方式吸引更多的AI開發者、工程師或密碼開發者做貢獻。

當然,我們的最終目標是實現商用,並不純粹是為了開源,所以我們在該框架下搭建資料銀行的商業產品。

以上就是我們在隱私計算領域的整體規劃。

6. 之前採訪PlatON創始人孫總時,曾倡導“萬物互聯”的概念,請問是否由物聯網在硬體層面提供大量的資料,為隱私AI提供養料?

其實這裡涉及到一個大的理念,即我們不應純粹地從技術的角度看問題,而應從資料的整個生命流程看問題。

資料的生命流程分為資料的採集和生產、儲存和計算、分發和交換、分析和處理等四個階段。

物聯網是在資料的入口,透過先進裝置進行資料的收集,PlatON與物聯網相關的合作方共同搭建相關生態;關於資料的分發和交換,我們認為是以分散式賬本為代表的新技術為主來實現;而資料的分析和處理則主要用到AI和大資料進行處理。

PlatON是基於整體進行佈局,本質目標是在資料的全生命流程當中,透過隱私保護的方式,促進資料的流動。

7. 我知道PlatON最近公佈了Grants計劃,可以請您分享一下相關的內容嗎?

Grants計劃是PlatON建立社羣的一個非常重要的渠道,是吸引開發者為社羣做貢獻的絕佳方式。如果開發者成功申請Grants計劃,我們將提供一定的經費來贊助。

自發布以來,我們收到了很多社羣朋友的申請。主要包括區塊鏈方向的專案和隱私計算的專案,申請的主體包括高校、初創公司、社羣團隊等。而專案的內容包含了區塊鏈周邊工具、合約開發等。密碼學方向包括安全多方計算、零知識證明、同態加密的演算法實現、應用和軟硬體加速等。

因為我自己來自密碼學界,所以很清楚地知道它的難度所在。或者說,在這個領域,一定是需要有很多人一起來做貢獻,完全依靠一家公司來達成一個長遠目標是很難的。所以我們希望更多對密碼學、區塊鏈等感興趣的開發者參加,共同推動PlatON生態。當然隱私AI也屬於Grants計劃,同樣歡迎大家參與申請。

8. 能用幾句話簡單介紹下同態加密、零知識證明和安全多方計算嗎?

安全多方計算是保證資料不會彙集在一起,又能對資料做計算。它涉及到一個經典例子,即有兩個百萬富翁,要比較誰更有錢,但不想把財產的數量告訴對方。這最早是由姚期智先生提出的。“安全”是首先保障財產或隱私的安全性,“多方”是多個參與方,“計算”是致力於解決什麼事情。比如百萬富翁問題是比較財產數量的大小,這可以擴充到其他更復雜的金鑰場景裡去。

同態加密可以理解為資料是看不見、拿不走的,但是可以對它進行計算。這涉及到一個故事:Alice是個很富有的人,擁有很多金塊,需要請工人來將金子打造成首飾。但金子在打造的過程中會被分成碎片,她擔心碎片會被工人拿走。所以她想了一個辦法,將大塊的金子用透明的箱子鎖起來,工人可以戴上手套在箱子裡操作,然後Alice等工人離開並將首飾拿出來。

這是一個形象的比喻,如果把金塊當成資料,那麼盒子就相當於對資料做了加密,工人的手套意味著可以對加密的事物做操作。“同態”在數學裡是一個對映的關係,在外面操作可以對應裡面的操作,在這個例子裡,就是可以透過手套在外面對裡面的金子進行操作。

零知識證明也有一個故事,即阿里巴巴和四十大盜的故事。阿里巴巴知道有一個埋藏寶藏的地方的鑰匙,而強盜要求阿里巴巴把鑰匙交出來。這時,阿里巴巴面臨一個窘境:如果鑰匙交出來,他會被強盜殺死,如果不交出去,可能強盜不知道鑰匙的存在,覺得他沒有用處,也可能將他殺死。所以,有沒有可能,阿里巴巴告訴強盜他知道這個鑰匙的存在,但不告訴強盜在哪,暫時保命。這是一個經典的零知識案例,向別人證明我有這個東西,但這個東西是什麼又不告訴別人。

以上的三種密碼學技術,慢慢被市場認知,但仍有一些瓶頸和不足。目前來說,普遍效能有待提高,不同技術的瓶頸是不同的。比如安全多方計算,瓶頸在通訊上,需要很多的頻寬來進行通訊;而零知識證明和同態加密,需要大量的計算力,提高計算的速度。

對此,國內外專家都在推進和嘗試,並促進技術的落地應用。而PlatON所做的,在安全多方計算方面,是在演算法上做改進,將通訊量調到儘可能低,將通訊的負擔挪到計算的負擔上去,採取折中的方式。關於零知識證明和同態加密這兩方面,我們在杭州有一個硬體團隊,希望用硬體的方式提升計算效能,這也是我們Grants計劃當中涉及相關硬體實現的原因。

9. 請問零知識證明能否實現大規模商用?現在的需求有多大?

零知識證明的證明內容和業務是相關的。比如現在區塊鏈比較普遍的應用,range proof,只要向別人證明轉賬的錢比餘額少。我們的目標是要去解決具體的問題,而完全的通用是沒有太大意義的,並且我們發現在某些具體的場景裡已經足夠用了。

當然,當需求越來越複雜時,演算法將不斷改進;當演算法越來越好時,場景也能用得上。所以,這是一個慢慢迭代的過程。目前來說,零知識證明還處在偏早期、沒有完全成熟的狀態。

10. 請問安全多方計算業務的真實需求和實際業務是什麼?

其實安全多方計算和隱私AI有非常契合的點,相關的需求更加急迫和明確。這裡涉及到資料的歸集和資料的使用的矛盾。從隱私AI的角度,資料一定是越多越好,讓模型更加精確;但從資料資產的角度,大家的資料是越來越不想給出去的。這個矛盾在AI領域越來越凸顯。

安全多方計算是非常適合解決這個問題的主要工具,提供一種正規化來解決這個困境。所以我們發現,密碼學其實是被用來解決各種矛盾的。基於此,相關B端企業對此需求非常強烈。

目前,國內外都在探索如何將隱私保護技術和AI進行結合,很多主流機構都在入局這個戰場,而PlatON目前是比較靠前的,我們的優勢是在區域性戰場的投入更大些。

11. 您怎樣看待以太坊加入隱私計算的生態?

我覺得是必然趨勢,以太坊號稱是“世界計算機”,需要承載大量的資料,勢必涉及隱私的問題。因此,以太坊將更多地使用密碼學技術,來支撐整個網路的完備性。其實,以太坊2.0的設計有非常多與隱私保護或密碼學相關的工具和想法。另外,我們很看好以太坊,並且有關於MPC方面的合作,在社羣之間也有互動。

在直播的最後,謝翔博士總結道:未來是隱私計算的時代,將重構現在大部分網際網路的商業模式,而隱私AI奠定了人類在全數字時代的生存方式。希望藉助這個機會,呼籲更多的人參與隱私計算網路的搭建。

他表示,密碼學是人類先人智慧的結晶,由一個個具體的問題引發,讓大家對這個世界有新的認知。後續“PlatON”公眾號將推出一些與密碼學相關的技術科普,希望更多的人能瞭解並投入密碼學領域,一起搭建隱私計算網路和分散式經濟體基礎設施。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;