區塊鏈+大資料 任重而道遠——BB財經

買賣虛擬貨幣

隨著共享經濟的迅猛發展,“區塊鏈+大資料”似乎已經成為一個非常明顯的發展趨勢。一方面,區塊鏈可以解決大資料存在的諸多問題,從而使其為共享經濟提供更加優質的服務;另一方面,為了最大限度地體現自身價值,越來越成熟的大資料迫切需要一個應用實體。然而,作為兩種相互獨立的網際網路技術,大資料和區塊鏈要想真正實現深度融合,仍舊任重而道遠。

一、資料孤島問題突出

俗話說:“巧婦難為無米之炊。”資料是大資料的基礎,而且只有被共享才可以擁有“生命”。另外,如果不能獲得底層資料,那麼我們就無法進行資料分析。

對此,中國科學院院士、北京大資料研究院院長鄂維南說道:“第一個問題就是沒資料,理論上我們中國有很多資料,但實際做資料分析會發現非常困難。”由此來看,資料孤島確實是一個十分嚴重的問題。

通常情況下,不同企業會用不同格式將資料儲存在不同地方。在各方之間資訊不對稱、資料共享渠道十分缺乏、制度法律不完善等因素的影響下,很多企業和政府都不願意公開自己手中的資料,再加上已經公開的資料還會因為某些原因而無法關聯融合,形成資料孤島就成為了一個必然結果。

此外,形成資料孤島的原因還有另外一個——利益。從目前的情況來看,很多企業都會以保護商業機密為由而不把資料共享出來,不僅如此,一些政府部門也會因為各種各樣的原因(例如,資料已經被用於商業交易、工作人員懶政等)而讓資料“沉睡”。

實際上,無論是企業還是政府,不進行資料共享的根本原因是利益,正如鄂維南所說:“資料孤島的痛不是技術問題,而是利益問題,背後隱藏的利益導致了資料孤島的產生。”

二、增強資料可信度

資料發展存在3個階段:

在第一階段,資料並沒有經過充分檢驗,而且是無序的;

在第二階段,大資料正式興起,可以在人工智慧演算法的助力下進行質量排序;

在第三階段,採用區塊鏈機制以後,資料獲得了在網際網路全域性基礎上的可信質量。

正是因為有了區塊鏈,資料才會進入第三階段。可以說,在人類目前獲得的所有資料中,區塊鏈上的大資料是可信度最高的一種,而且還具有很高的精確度和良好的資料質量。

1、用區塊鏈驗證資料出處和精確性

2016年,IDC Government Insights 釋出了一篇報告,該報告深刻闡述了區塊鏈對政府資料許可權管理和精確性的巨大價值,同時還指出,對於政府的資料採集系統來說,使用區塊鏈共識機制獲取和驗證資訊的方式是非常合適的。此外,在未來的幾年內,政府會以此篇報告為依據,對區塊鏈進行技術測試,從而挖掘出區塊鏈的真正價值。

此前,政府資料許可權並不是特別完善,資訊精確性也沒有保障,而在區塊鏈的幫助下,政府長期控制資料、資訊精確性無法驗證的難題都可以被有效解決,正如 IDC Government Insights 報告所指出的那樣:“區塊鏈可能成為驗證資料出處和精確性的核心工具,可以追蹤資料升級,為不同資料領域建立真正的權威資料。”

對此,IDC Government Insights 研究主管肖恩·麥卡錫說道:“當前,政府已經對IT安全、資訊保安、可靠性提起了高度重視,而區塊鏈被認為是IT經理人的強大工具,不僅可以使欺詐得以大幅度減少,還可以最大限度地保證資料安全。更重要的是,區塊鏈也可以拉近政府和公民之間的距離,進而形成一種全新的關係。”

IDC Government Insights 報告顯示,在改善資料真實性和精確性方面,區塊鏈可以發揮出非常大的作用。這主要是因為區塊鏈可以對代表有價物品的不同實體進行轉移和監控,而且還可以保證審計跟蹤的穩定性。

在跟蹤實體活動的時候,區塊鏈採取的是共享記錄的方式,這樣就可以保證實體活動不會受到未授權更改及駭客攻擊的影響。如果在P2P網路的助力下建立了共享的權威版本,那麼眾多節點就會一起工作以確保資料的完整性。

區塊鏈的共識協議會對活動的有效性,以及是否可以新增到區塊鏈中進行檢查,透過檢查以後,區塊鏈會把這個權威記錄和其他資訊放在一起進行核對。

毋庸置疑,區塊鏈可以在土地登記、版權、智慧合約、病歷等多個方面發揮作用,但 IDC Government Insights 報告似乎將焦點放在以下3個方面。

1)資料精確性:對於任何型別的資料而言,精確性都是一個關鍵特性,這不僅可以表示任意物件的資料值記錄都是正確的,還可以表示形式、描述物件、內容都是一致的。

2)資料權威性:區塊鏈為資料賦予的權威性不僅詳細說明了資料出處,還對資料所有權及資料最終權威版本的位置進行了明確規定。

3)資料訪問控制:區塊鏈不僅可以跟蹤公共資訊,還可以跟蹤私人資訊,具體包括可以更新資料的人、資料對應的交易、資料本身的詳細資訊等。

從目前的情況來看,政府剛剛開始對區塊鏈解決方案的實際能力進行測試,測試重點放在了資料保護、許可權管理兩個方面。另外,根據IDC的預測,區塊鏈解決方案原型搭建的關鍵推動者應該是系統整合商。

針對區塊鏈解決方案,肖恩·麥卡錫總結道:“我們建議企業和政府機構把區塊鏈解決方案的機遇及價值研究納入第三平臺戰略,可以藉助內部戰略檔案的力量,確定區塊鏈的實際意義及應該遵循什麼樣的實施路徑。”

可以看到,在政府資料方面,區塊鏈可以發揮比較大的作用,一方面,有利於解決資料許可權問題;另一方面,有利於保證資料的精確性。

2、區塊鏈與大資料共建未來信用

區塊鏈改變了人與人之間的信任方式,這一點是毋庸置疑的。在當今世界上,信用可謂是一個既稀缺又昂貴的資源,而人類也曾為此付出過非常大的代價。另外,為了最大限度地規避道德風險,擺脫信任困境,一筆交易必須被拆分成多個環節,形成多個交易主體。

區塊鏈不僅是一項技術,也是一種資料庫,更重要的是,它還可以建立信任,從而實現價值的轉移和傳遞。而大資料也可以透過分析和處理相關資料,建立起資料的一種智慧。那麼,二者既然有如此多的相似之處,是不是可以很好地融合在一起,從而推動整個網際網路經濟的發展呢?答案是肯定的。

在商品經濟的發展過程中,信用是一項必不可少的資源,而在交易支付領域,以點對點網路和開源系統為基礎的區塊鏈則掌握著去中心化、加密安全、不可篡改、去信任機制等諸多優勢。這樣看來,在區塊鏈的助力下,基於信任需要的交易環節可以有所減少,從而大幅度降低了交易成本。

一些專家學者認為,信用需求的不斷擴大是區塊鏈出現的一個重要歷史原因。在商品經濟時代,商業模式是物物交換,但這種商業模式需要非常高的運輸成本。鑑於此,降低交易成本成為市場經濟的首要考慮因素。於是,商業模式開始轉變為利用信用建立交易。

網際網路金融在市場上出現後,獲得了非常良好的發展。拿微信來說,其主要特徵是透過大資料來建立信用。可以說,對於網際網路金融而言,大資料金融是一個非常重要的基礎,既降低了信用建立的成本,又加快了信用建立的速度,還提高了信用建立的質量。

不過,信用建立也不能一直依靠某個(些)“中心”,因為如果中心化程度過高,很可能引發資訊不對稱的問題,從而對參與方及其他人的利益造成損害。而區塊鏈則利用自身所具有的去中心化特徵,有效地解決了這一問題。

在區塊鏈大資料時代,全網公證是建立信用的一種絕佳手段。對於傳統信用體系而言,這是極具顛覆性意義的。另外,區塊鏈上的大資料可以將信用賦予每一個人,而區塊鏈也會成為全球金融的基礎架構。

三、解決大資料風控弊端

區塊鏈也可以有效解決大資料風控的很多弊端,例如,資料質量低下、資料孤島、資料洩露等,本節將對此進行詳細說明。

1、改善資料質量

眾所周知,區塊鏈中的每一個節點都可以記錄和儲存交易資訊,不僅如此,為了驗證交易資料的真實“身份”,這些節點也可以對交易資料進行檢查。在這種情況下,資料的真實性和有效性就有了很大的保障。另外,由於區塊鏈具有去中心化的特徵,因此,無論是誰都不可以對區塊鏈上的資料進行篡改,這樣資料篡改的可能性就被降到了最低。

可見,在區塊鏈的助力下,資料的公開性、安全性都有了大幅度提升,而這也帶來了資料質量的提高,以及資料檢驗能力的增強。

OKLink分析師曾說過:“區塊鏈技術擁有高可靠性、簡化流程、交易可追蹤及改善資料質量等特質,使得其具備重構金融業基礎架構的潛力。”

2、解決資料孤島問題

大資料存在非常嚴重的資料孤島問題,而區塊鏈則有望解決這一問題。之所以會這樣說,主要是因為區塊鏈不僅是一個分散式賬本,而且還具有去中心化、開放性等特徵。

在區塊鏈的助力下,資訊傳遞到金融市場參與者的過程會變得越來越公開透明。不僅如此,作為金融市場中的秩序維護者,監管機構還可以透過區塊鏈中的資料鏈條來預測和分析可能出現的風險問題,並制定出相應的規避措施,以此來保證金融市場的正常執行。

可以看到,區塊鏈的去中心化的特徵,不僅能夠解決大資料中的資料孤島問題,還可以實現不同主體間的資訊共享,從而進一步完善現有的風控模式。

另外,在區塊鏈的巨大影響下,區塊鏈創業公司像雨後春筍般不斷湧現。不過,對於區塊鏈創業公司來說,提供完善的區塊鏈解決方案是可以的,但這些解決方案能否順利落地還是一個未知數。

可以說,區塊鏈目前的發展狀況與20世紀90年代網際網路的發展情形非常相似,其對行業、政府、企業的改變是一定會發生的。到2020年,不僅區塊鏈創業公司的數量可能會大幅度增加,區塊鏈聯盟的數量也可能會有所增加。

在維護一個可靠資料庫時,區塊鏈採取了去中心化和去信任的方式,這也註定了區塊鏈與大資料融合在一起是必然的。甚至可以說,區塊鏈的誕生是對大資料的重構。

3、解決資料洩露問題

從本質上來講,區塊鏈其實是一個去中心化的資料庫,因此,如果區塊鏈中的某個節點對資料“動了手腳”的話,那麼其他節點會在第一時間發現,這樣資料洩露的可能性會大幅度降低。

只有透過私鑰的形式,區塊鏈中各個節點的身份資訊才可以被成功獲取,而且私鑰還是資料擁有者才可以知道的。即使資料已經洩露出去,但如果私鑰沒有被洩露的話,那些已經被洩露的資料也沒有辦法與節點身份進行匹配,因此,它們並沒有任何使用價值。

另外,區塊鏈只能被那些計算力超過50%的駭客攻破,不僅如此,隨著區塊鏈節點的不斷增多,所需的節點力也會越來越大。當節點增多到一定數量時,發動一次攻擊的成本就會變得非常高,對於駭客而言,這其實是得不償失的。由此來看,透過區塊鏈對資料儲存技術進行加密,可以最大限度地確保資料安全,從而把資料洩露的風險降到最低。

可以說,“區塊鏈+大資料”是解決大資料風控弊端的最佳模式,同時,該模式還可以大幅度提升金融業務風控能力,從而推動金融行業的不斷髮展。

四、用區塊鏈解決大資料交易問題

區塊鏈可以從根本上解決大資料的交易問題。一方面,區塊鏈可以實現對資料的追根溯源;另一方面,區塊鏈可以實現對靜態資料的隔離驗證。

1、追溯資料的源頭

在資料交易的過程中,資料提供方會有這樣的顧慮:資料被髮送出去以後,很可能會透過其他渠道流入二級市場,並且被轉賣的次數越多,資料價值越小。另外,在現有技術的基礎上,資料的可複製性和二次傳播還沒有辦法完全避免,再加上資料價值會隨著傳播次數的增多而不斷減小,所以資料提供方根本不願意,也害怕將資料提供出來進行交易。

簡言之,資料提供方不想進行資料交易的原因主要包括以下兩點:

1)二次傳播導致資料價值的不斷減小。

2)為了獲取原始資料全集,資料接收方會進行多次購買。

眾所周知,馬太效應會在資料本身的量級上展示出來,如果不能有效解決資料溯源問題的話,資料接收方必然會分次獲取資料全集,從而對資料提供方的資料交易價值產生嚴重影響。從目前的情況來看,在商業協議的保護下,資料雖然可以不被二次轉賣,但由於舉證困難,如果資料接收方違約,資料提供方根本無法追責。

俗話說:“羅馬不是一天建成的。”在現有技術不能避免資料被二次複製和轉賣的情況下,讓資料具備可溯源性特徵也是一種非常不錯的過渡手段。當出現資料接收方蓄意違約的現象時,資料提供方如果具備舉證手段,可以在很大程度上消除其進行資料交易的顧慮。

一個非常有效的實現方法是透過區塊鏈的不對稱加密技術,對需要交易的資料進行簽名,具體包括以下幾個環節:

1)資料交易雙方針對簽名演算法進行協商,例如,使用AES128。

2)資料接收方生成自己的公鑰和私鑰。

3)資料接收方將自己的公鑰和私鑰同時提供給資料提供方。

4)資料提供方使用私鑰對資料關鍵欄位進行簽名。資料關鍵欄位包括列舉型別、ID型別等。值得一提的是,數值型別應該保留明文,然後將已經簽過名的資料出售給資料接收方,原始資料則由資料提供方保留。

5)資料接收方購買到加密資料以後,把自己系統內的關鍵資料用私鑰簽名進行轉換,以便供資料銜接使用。

6)如果市場上出現相關出售資料,那麼資料接收方可以透過公鑰對資料進行驗證,根據公鑰和私鑰的驗證結果,瞭解資料究竟出自哪一個資料提供者。

這種方法雖然可以對具體的資料提供方進行驗證,但也存在一個問題:如果資料接收方充滿惡意,妄圖同時掌握私鑰和公鑰的話,那麼資料提供方很有可能遭到陷害。這也表示,要想真正實現資料的追根溯源,除了需要區塊鏈的助力,還需要監管機構的公證。

2、靜態資料的隔離驗證

比特幣的隔離驗證BIP是隔離驗證一詞的來源,很多專家學者都認為,隔離驗證可以引入到靜態資料交易中。

從目前的情況來看,對靜態資料進行交易是特別困難的。因為靜態資料涉及了太多的使用者隱私,所以使資料提供方和資料接收方承擔大量的監管風險。另外,從法律層面來看,很多靜態資料都處於灰色地帶,而且其中大部分都產生於政府職能部門。

在這種情況下,如果我們可以使用隔離驗證技術,將那些合法且可以出售的資料進行隔離驗證處理,那麼就可以在保護使用者隱私的同時,為資料接收方的合法使用提供保障。

這方面我們可以使用靜態資料雜湊,將不能被洩露的使用者隱私資料進行雜湊,使資料接收方只有在擁有某些資料的情況下,才可以藉助雜湊比對獲取一條資料記錄的其他欄位,從而實現與隔離驗證相類似的功能。

可以看到,在解決大資料交易問題方面,區塊鏈確實有著得天獨厚的優勢,而且也可以發揮真正的作用。一方面,區塊鏈可以追溯資料的源頭,從而保證資料提供方和資料接收方的利益;另一方面,區塊鏈可以實現靜態資料的隔離驗證,從而降低資料交易中的風險。

區塊鏈+大資料何時應聲落地、遍地開花?我們拭目以待。

文章來源:BB財經(www.bbcaijing.cn),轉載請註明出處!

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;