當資料成為市場化要素,區塊鏈技術如何保護隱私?

買賣虛擬貨幣
近日,國務院關於市場要素改革中專門增加了一項條例,將資料作為生產要素的一部分。它本質上為了加強整個市場化配置,並且向新舊動能轉換,向新經濟靠攏,把資料作為一種生產要素必然存在著對資料的確權,資料確權以後才能交易。在過去十年中,大資料已經逐步滲透到人們的日常生活,但仍舊面臨著許多問題,其中最重要的問題當屬資料隱私。2020年4月14日, Qtum隱私計算負責人鄭義接受國盛區塊鏈採訪,對話聚焦隱私保護,詳細闡述了隱私技術的發展,並進一步深入討論了在大資料行業內,隱私技術將如何落地解決行業痛點。以下為訪談文字實錄:Q 目前在大資料行業裡面痛點是什麼,資料隱私保護是怎麼做的?鄭義:我是區塊鏈專案Qtum的核心開發人員。我們對資料隱私包括區塊鏈上的資料隱私,是很少地能夠掌握這一領域技術的團隊。這一領域確實比較複雜,比較困難,尤其是密碼學在整個理工科裡面都是屬於比較難啃的硬骨頭。現在在資料確權領域,無論是區塊鏈裡面還是區塊鏈外面,最基本的做法是做電子簽名。我們在普通的電子交易裡面經常會有簽名、證書,我們訪問一些網站,大家會看到證書這個東西。區塊鏈裡面叫私鑰,一個非對稱加密技術。基本原理是你自己會有一個密碼,對應有一個公鑰,你可以理解這個密碼是一對組合,有一個公鑰,一個是私鑰,私鑰是自己知道的,公鑰是發出去所有人都知道,這是你的公鑰。在金融領域就叫證書,證書是公鑰,所有人都能知道的,私鑰是隻有自己本人所儲存的。
我們有了這樣一個公私鑰密碼對兩個資料之後,我們自己手裡唯一的密碼來對要確權的資料生成電子簽名。任何人拿著這個電子簽名、資料,公鑰三個東西可以透過驗證,說這個簽名確實是我生成的,大家可以發現簽名和我們普通場景下手寫的簽名非常像,這個東西只有我才能夠生成,我簽在這份檔案上,我向公眾確認這份檔案我確權了。在區塊鏈裡面受到一些限制,比如說希望我們簽名儘可能的小、希望多個人對同一份檔案進行簽名。這會衍生出很多演算法。比如ECDSA、Schnorr、BLS,基本上都是從效能的角度來考慮的。Q 什麼計算場景用到了隱私計算?鄭義:隱私計算是面對這樣一個場景的,比如說我自己是一個資料的生產者,我自己是運營商,我手裡有很多資料,第三方需要我的資料計算得出一個結論,比如說使用者徵信、資產水平。我不想把原始資料完整給你,這樣會面臨很大的風險,你有可能拿著我的原始資料進行二次販賣、洩露。所以痛點在於我既想讓你用我的資料做計算得出你想要的結論,我又不想把原始資料給你。去年國家提倡發展區塊鏈技術之後,很多傳統企業都想圍繞著這個場景做一些事情,我們接觸的是電力行業,它們有每個使用者用電資料,這個資料非常準確,特別是能夠反應一個企業的經營狀況,它想做一個系統,但它不想把資料給你,你又可以拿資料做計算得出你想要的結果。針對這樣場景最開始的解決方法,我們會經常聽到一些名詞,一個叫同態加密,一個是可信計算。
真正能落地的,大家都知道加減法的隱私計算是比較好做的,我不給你原始資料,而是給你加密後的資料,你拿加密後資料做加減乘除,最後得到一個結果找我要原始資料。有一個問題,加減法以外的計算能夠做到答案是可以做到的,但是計算量會增加很多,原本可能做的計算是很快,計算量很小,但是為了做隱私計算會加上很多計算量,導致現在計算過程中特別緩慢。這個技術叫ZK-SNARK技術,這已經用在區塊鏈領域了,但是效能不太理想。現在區塊鏈能夠做到十秒生成一份加密後的交易資料,交易資料無非是交易地址和交易金額。為了生成一份隱私後能夠參與計算的加密後資料,要花十秒鐘時間,這個代價非常大。技術最初由微軟研究院2013年提出的,一開始的演算法更加複雜,計算量更加大,2014、2015年的時候改了兩版,改完之後立刻用到區塊鏈領域裡面,可以做任意複雜的隱私計算,不涉及加減乘除範圍內,這是複雜計算的隱私計算技術第一次真正應用在我們的現實場景中,以前都是概念和理論階段,這是我個人認為的第一次應用。全世界領域做的比較好的是英國的倫敦大學、牛津大學和美國斯坦福這幾個學校,後續大多數技術由它們提出的,一直演變到今天,這個又經過很多迭代,最後效能問題還是沒有完全解決,但是已經是可用的狀態了,這也是目前業內最主流的廣義的複雜計算的隱私計算的技術方法,已經成熟應用到區塊鏈領域了。Q 為什麼隱私計算中計算量和效率會大打折扣?鄭義:技術領域資料同態加密演算法比較有限,最常用的是RSA和橢圓曲線的方式,加解密方式不難,難的是拿到加密後資料的使用者要對加密資料做加減乘除運算,不是原本的加減乘除,而是另外一種計算方式,技術領域叫做原本空間的資料對映到另外一個空間的資料。Q 這中間信任的過程需要用計算來彌補對嗎?又是如何實現加密的呢?
鄭義:是的,過程中需要用計算來彌補。目前加密技術主流就兩種,一種是RSA,一種是橢圓曲線,這兩種已經成熟應用到日常的領域中,包括網站上面的HTTPS加密和電子簽名。國內還會有一套國密系統,底層基本上都基於這兩個方式。加密要求把原文透過密碼變成密文,沒有密碼不能從密文推倒出原文。在數學上是拿了密文,我理論上可以拿原文試,我窮盡所有原文可能來試出密文,我在數學上保證概率很小,所有的加密系統、演算法都有這樣的前提假設,就是不是完全不可以解密,而是解密概率小到一定程度。怎麼實現這個系統呢?主要的兩種方法,RSA是基於素數的,就是不能被分解的數。橢圓曲線定義了橢圓形函式,它在函式上定義了一套加減法,可以定義這個點加那個點等於第三個點。Q 資料的擁有者目前參與隱私計算意願到底怎麼樣,或者會有什麼顧慮呢?鄭義:據我們接觸,目前我拿電力系統舉例,這也是我們參與比較深度的專案,它們擁有的電力資料本身是非常敏感的,但是它們又有強烈的變現需求。我們目前運營商資料變現較早,你打一個電話,各種推銷業務來了。之前P2P比較火,它可以透過各種資料知道你的資訊,從而進行徵信上的評定。我們接觸到電力系統的時候,它們也有非常強烈的變現需求,它們的這份資料之前嘗試拿出去過,拿完之後立刻被使用者洩露了,這個洩露概率非常大。它們資料用來給銀行做貸款是非常好的,銀行給企業做借貸,在評估徵信的時候拿用電資料可以非常準確評估企業經營狀況,而它透過企業納稅,包括交的社保,很多都是有水分的,但是用電是騙不了別人。最後還是難以落地,卡在了兩個環節,第一,隱私這項技術還是非常小眾,國內能夠掌握的人比較少,包括我們出去交流的時候不論和高校講還是和企業講,國內關注度都不高。隱私計算很多技術來自於國外,國內這項技術不夠普及的,理論上都是知道的很少,應用就更少了,最後在真正立項的時候還是會有所顧忌,它們更多的希望有一些高校,會有一些學者來給它們做背書或者把關。
我還是以電力系統舉例,它們自己雖然有意願,因為這個東西是一個千古無人,後無來者的東西,之前沒有任何人嘗試過,任何人也沒有去做第一個吃螃蟹的打算,它們會顧忌這裡面的風險和複雜的問題,因為它們沒有辦法掌握這項技術,對這個有畏懼的心理,誰也不願意第一個來做嘗試。總結一下,這個嘗試代價太大,代價和風險很大,這就是目前行業裡面的現狀。Q 技術上還是比較難?鄭義:我個人認為最好是重要的行業或者重要人物去嘗試一下這個技術,稍微落地一下,後面才會跟上。每個領域都是需要一個帶頭者,比如無人駕駛帶頭者是特斯拉。中國的企業更多地願意複製一個成功經驗,很少願意走出第一步,所以整個隱私計算還是等待第一個先驅邁出第一步才會有後面的事情。Q 隱私計算怎麼做審計?鄭義:這項技術也是比較成熟的。原理和之前的加密是一樣的,除了給你結果之外,還會給你一個證明,你拿著密碼和結果可以判斷這個資料的真實性和準確性。
最好的方法是直接把加密的密碼交給監管機構,讓它來完全看隱私資料,你沒有辦法只暴露部分資料,或者加密一部分、暴露一部分,也沒有辦法說防止拿到密碼之後不再洩露給第三方。  Q 假設作為電力系統的客戶,有這樣的一個審計需求,我們該怎麼樣實現對接,又該怎麼樣把資料給你,是開個介面線上訪問,還是用一個物理介質?整個過程中會不會有資料洩露?鄭義:在目前技術背景下能夠做到可實現,我們設計了一個方案。資料的供應方,比如電力系統,它提供一個平臺,使用者透過這個平臺來檢視資料,只能看部分,來做計算。使用者如果想要把計算用到所有的資料上,平臺提供者就把計算的過程應用到所有資料上,最後得出結果,反饋給使用者,同時提交一份證明,表示這份資料確實是透過某一個原始資料計算得到的。Q 平臺提供方的盈利模式是什麼?是怎麼衡量資料價值的?鄭義:目前我們仍在技術探索和研究階段,這個東西無論是國內還是國外都是比較新的,還沒真正落地。大家覺得相對可行的方案就是以甲方乙方的方式,直接交付一套系統,提供幾年服務。電力系統會有一些固定的IT解決方案供應商,我們也是跟它們聯合,最後系統交付了之後真正維護的人是由它們提供的。作為資料的擁有者,去搭建了這一套系統,怎麼向使用者收費,這是我們完全沒有考慮過的。Q 個人如何對隱私資料確權?
鄭義:這個問題最大的討論領域是醫藥。例如醫療資料產生了,一份病例產生了到底屬於誰,討論了很久,最後發現這個問題最終在政策方向上,技術領域上有一些解決方案的,無論是簽名還是加密,或者電子證書,但是官方或者從法律角度來說要承認這個東西是有效的。比如拿蘋果手機,在支付寶付錢,掃了一個臉,交易發出去了,錢就出去了,你必須要從法律角度先證明我蘋果手機面部識別功能可以作為交易發起依據,而國內國外都沒有立法。目前真正要實現,首先要立法,技術上是能保證的。Q 假設我個人的資料在某網際網路服務公司的伺服器上,它有我的隱私資料,它想用或者我想給別人去用,我可以透過什麼技術手段來授權?鄭義:加密是有手段的,首先上傳資料的時候不要上傳原始資料,而是上傳加密後的資料,這個密碼只有你本地知道。當任何一個第三方想要用你這份資料的時候,你和它溝通,溝通之後你們會商量出一個金鑰,這隻有你們倆知道,你自己在本地用這個密碼再對資料加一次密,把加密資料給對方,對方拿著密碼解密,它就有原始資料了,這個叫密碼協商的技術,用來做隱私資料的通訊、資料的加密通訊。這個技術還是沒有辦法保證使用者拿了你的資料之後再次洩露給第三方,我們現在能夠做到的是把你的資料有選擇地暴露給某些人,暴露了之後再去暴露給其它人是沒有辦法阻止的。Q 個人能從隱私計算中獲益嗎?鄭義:技術上是能夠保證的,法律上不支援,法律上沒有成熟的法律。需求也是強烈的,特別是像醫療系統裡面,它們想要做的事情非常好,它想把病例貢獻給人工智慧公司,這些公司拿到病例之後去完善系統,這個系統可以做智慧診斷。比如有人得病了,我現在去醫院之前透過系統大致判斷我有可能是哪幾種病,到醫院可以針對性掛對應科室。醫生看到了之後也可以把症狀表現輸入到系統當中,病例上也可以提示是大概什麼病輔助判斷,最後還是卡在病例資料確權問題。人工智慧公司願意拿出錢來給資料提供商,給醫院,它不敢收這個錢。收了錢,等於說醫療資料是屬於醫院的,而法律上是沒有界定的,到底是屬於病人還是屬於醫生還是屬於醫院。病人也是如此。
Q 可以簡單介紹一下MimbleWimble協議嗎?它跟別的協議有什麼不同?鄭義:隱私保護要解決的問題在大框架上叫零知識證明。比如我在公司裡面有很多朋友,我想向這些同事證明,我知道某一位美女同事號碼,但我不想把這個號碼告訴其他同事,我就當著所有同事面給她打電話,她電話響了。MimbleWimble是能零知識證明的一種演算法,ZK-SNARK也是一種。它們兩個區別是,ZK-SNARK適用於任何知識的證明,任何計算過程或者任何加減乘除,但是MimbleWimble只能適用於加減法的證明,這兩個技術最後都應用在區塊鏈領域裡面了。MimbleWimble已經足夠用在區塊鏈領域。區塊鏈裡面要證明的僅僅是我有這個數字貨幣的所有權,一個是我在發起一筆交易的時候這個交易的金額是能平的,我在轉移一筆資產的時候,資產接收方拿到的數量和發起方轉出去的貨幣資產數量是一樣的,最後證明了所有權和加法上的證明,加上成立的證明。MimbleWimble技術做到了這兩點,它底層能在同態性,就是橢圓曲線加密,保證了明文的加減能夠透過密文加減推出來。比如我手裡有十個貨幣,我加完之後變成一個數字,我們叫A1,我轉給你4個貨幣,我最後找6個貨幣,這個明文等於10=4+6,密文也可以證明,這是加法同態演算法,MimbleWimble做到了這一點,這個應用場景更加特殊化,所以效能會好於ZK-SNARK,在數字領域發起交易能夠在一秒之內實現的,這也是作為兩年前才真正落地的演算法,落地的時候還是比較受關注的。
Q 量子鏈現在研究隱私計算,主攻的方向是什麼,到了什麼程度?鄭義:MimbleWimble和ZK-SNARK我們都非常熟悉,這個領域我們在國內幾乎沒有可以討論的人,更多地還是在和國外交流。基本上可以打平國外最新水平的,國外的技術發展到什麼樣我們就能掌握到什麼程度,我們僅僅還是在創新應用上,我們自己設計一套新的或者超越已有演算法的新的演算法,這種我們目前還是做不到的。具體應用場景並沒有定論,我們更多的還是跟隨著總體的節奏。ZK-SNARK目前更受重視。數字貨幣領域裡面的賬本資料的加密,目前不是特別火。也就是說,最近更多的側重在廣義資料的加密上。Q 隱私計算和可信計算有什麼區別?還有什麼行業在隱私計算有比較好的落地應用?鄭義:關於第二個問題,我可以很明確地告訴你,沒有,最大問題是沒有先驅者。法律制定很重要,但是法律往往是滯後的,一般出現了大的落地應用,甚至影響到輿論時,法律才能跟上。它們倆僅僅是概念上不同,你可以理解成為我們理解的雲端計算和分散式計算。雲端計算這個名字更好聽一點,最開始從理論或者技術角度,大家先說分散式計算,你的計算本來集中在一臺電腦,後來大家把這個概念擴大化,提出來了雲端計算。
可信計算和隱私計算也是一樣的,從學術的角度大家先提隱私計算的概念,例如我剛才說的零知識證明,我要做一份計算不能暴露給你第三人原始資料,只能暴露給你結果,並且告訴你這個結果是可信的;後來又一些人演繹成故事,範圍擴大了,場景更多了,提出了可信計算。類似於分散式計算,隱私計算有嚴格定義,更學術,更小範圍的;類似於雲端計算,可信計算沒有嚴格定義,更商業化、範圍更大。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;