區塊鏈或成大資料風控助推器

買賣虛擬貨幣

引言:風險控制是金融領域必不可少的一環。近些年,為了實現更精準、更高效的風控,金融機構紛紛引進了大資料技術。然而,大資料風控並非十全十美,其尚存資料孤島、資料低質和資料洩露等有效性不足問題,由此引發的風險事件層出不窮。區塊鏈技術的橫空出世,為大資料風控帶來了些許曙光。那麼,大資料+區塊鏈,是否真的能在風險控制領域擦出不一樣的火花?

金融業的核心在於風險控制(以下簡稱風控)。隨著金融業的快速發展,其風險問題也愈發嚴峻。用個人經驗預判風險的傳統風控模式,已經不能完全滿足新時代的風險管理需求。伴隨著大資料技術的日益普及和風險管理中對資料資產的重視,大資料風控應運而生。然而,大資料風控真的有效嗎?

大資料風控美中不足

眾所周知,大資料風控是指利用大資料技術對交易過程中的海量資料進行量化分析,進而更好地進行風險識別和風險管理。大資料風控的核心原則是小額和分散,即預防資金相關者過度集中。小額的設計原則主要是針對海量資料構成的統計樣本,儘量避免出現統計學中的“小樣本偏差”。分散的設計原則主要是透過分析借款主體的人口屬性、商業屬性、行為屬性和社交屬性等資料來建立大資料風控模型。

基於大資料的風險控制,突破了傳統風險控制模式的侷限,在利用更充分的資料的同時降低了人為偏差,是金融機構創新傳統金融風控模式的變革利器。應用大資料技術不僅可以提高風險控制的效率,還能節約風控過程中的管理成本。然而,大資料風控並不完美,首先,大資料風控技術無法解決資料孤島問題,即資料的開放和共享問題。目前,政府、銀行、券商、網際網路企業和第三方徵信公司掌握的資訊難以在短時間內互聯互通,從而形成一個個資訊孤島。當交易在不同金融機構之間進行時,資料孤島導致了資訊的不對稱、不透明,帶來了大量的多頭債務風險和欺詐風險。金融信貸行業若想利用大資料風控技術提升風控水平,就必須打破資料孤島,解決資訊不對稱和資訊獲取不及時的問題。

其次,資料低質的問題也從一定程度上影響了大資料風控的質量,特別是來源於網際網路的半結構化和非結構化資料,其真實性和利用價值很低。舉例來說,在美國,Lending club和Facebook曾經合作獲取並利用社交資料;在中國,宜信也曾大費周章地採集借款人的社交資料,以期實現對借款人信用的全面評定。但是兩者得出的結論如出一轍,由於社交網路中的資料主觀隨意性很強,這些在網上提取的社交資料根本不具有利用價值或者利用價值十分低,錯誤率高達50%。電商平臺上的交易資料也由於一些刷單現象而失真。這些資訊的收集與利用就如同垃圾的運進運出,幾乎沒有任何意義。基於這些低質資料的風控效果也會大打折扣。

最後,大資料風控過程中存在資料洩漏問題。近年來,資料洩漏風險事件屢見報端。2015年2月12日,匯豐銀行大量秘密銀行賬戶檔案被曝光,顯示其瑞士分支幫助富有客戶逃稅,隱瞞數百萬美元資產,提取難以追蹤的現金,並向客戶提供如何在本國避稅的建議等。這些檔案覆蓋的時間為2005年至2007年,涉及約3萬個賬戶,這些賬戶總計持有約1200億美元資產,堪稱史上最大規模銀行洩密。Verizon釋出的全球調研報告《Data Breach Investigations Report 2015》顯示,2015年網路安全事件共有79790起,確認的資料洩露事件超過2千個(2122個)。這些都降低了大資料風控的有效性和應用價值。

區塊鏈能否解救大資料風控?

2008年11月,一位名叫中本聰(Satoshi Nakamoto)的加密愛好者首次提出了區塊鏈概念。區塊鏈本質是一個去中心化的分散式資料庫,這種去中心化、開放自治、匿名不可篡改的資料結構特性使其一出現就迅速取得大量關注。區塊鏈的出現,也在一定程度上解決了大資料風控有效性不足的問題。

區塊鏈誕生於比特幣體系中,比特幣是一種數字貨幣,而區塊鏈是記錄這種貨幣發行與交易的“賬本”。為了不涉及被信任的第三方,這個“賬本”需要保證交易雙方能夠相互信任,且保證全部交易資訊公開透明,自動傳達給交易雙方。因此,這個“賬本”必須是共享、自治和不可隨意更改的。用專業的說法就是,要有去中心化、開放自治和匿名不可篡改的特性。區塊鏈的四大核心技術實現了這些特性:(1)分散式記賬、分散式傳播、分散式儲存,保證了系統內的資料儲存、交易驗證、資訊傳輸全部都是去中心化的;(2)透過時間戳(區塊(完整歷史)+鏈(完全驗證)=時間戳)來記賬,形成了一個不可篡改、不可偽造的資料庫;(3)所有權的信任是“演算法式信任”,非對稱加密演算法保障交易資料的可信;(4)實現了可程式設計的智慧合約,使系統可能去處理一些無法預見到的交易模式。

區塊鏈去中心化、開放自治、匿名不可篡改的特性使其應用場景迅速擴張,從最初的數字貨幣,到證券交易結算、會計審計等涉及合約稽覈的金融領域,再到政府、醫療等公共領域,區塊鏈技術解決了現實世界中存在的諸多技術壁壘。具體來說,京東白條近兩年構建了稱之為“四大發明”的大資料模型體系:司南-風險管理模型系統、火藥-量化運營模型體系、活字-使用者畫像模型體系、造紙-大資料徵信模型體系。毋庸置疑,與傳統風控體系比較,依託於大資料技術的“四大發明”的風控體系能夠更加精準識別及遏制套現行為,目前為止已經為1億使用者完成了信用評估。然而,大資料風控體系仍然無法解決其資料來源上存在的問題。無獨有偶,將區塊鏈技術應用於大資料風控體系,可以有效解決大資料風控資料孤島、資料低質和資料洩露等資料來源問題。

影響大資料風控有效性的關鍵因素,是資料庫的維護成本和資訊傳遞效率。而單從資料的角度來看,區塊鏈是一個由所有參與者共同記錄(而不是中心化機構單獨記錄)資訊、由所有參與記錄的節點共同儲存(而不是儲存在中心化機構中)並且不可隨意篡改的資料庫。在這個區塊鏈資料庫中,每個使用者節點都擁有整個資料庫的完整複製,並且當某個使用者節點要對資料庫寫入資料時,它需要向區塊鏈網路廣播這些資料,以便其餘使用者節點對這些資料進行驗證稽覈操作。只有全網共同驗證和認可後,資料才能寫入區塊鏈,並且一旦資料寫入區塊鏈後,就不能隨意修改或刪除。這樣一個用區塊鏈技術構建的資料庫,對於大資料風控有效性的提高有重要意義。

首先,區塊鏈去中心化、開放自治的特徵可有效解決大資料風控的資料孤島問題,使得資訊公開透明地傳遞給所有金融市場參與者。設想以下情況:一位客戶同時向A銀行和B銀行各申請一百萬的房屋抵押貸款,但其房屋價值只有一百萬。如果兩家銀行加入了同一區塊鏈,就能即時辨別出客戶的交易行為和風險,避免放貸總額超過抵押值。除了交易主體外,監管部門也可以作為一個使用者節點加入區塊鏈,實時監控其他使用者節點的交易資訊,防範風險事件的發生,無需再等到事後申報。利用區塊鏈中全部資料鏈條進行預測和分析,監管部門可以及時發現和預防可能存在的系統性風險,從而更好地維護金融市場秩序和提高金融市場效率。可見,區塊鏈去中心化的特徵,可以消除大資料風控中的資訊孤島,透過資訊共享完善風險控制。

其次,區塊鏈的分散式資料庫可改善大資料風控資料質量不佳的問題。使得資料格式多樣化、資料形式碎片化、有效資料缺失和資料內容不完整等問題得到解決。在區塊鏈中,資料由每個交易節點共同記錄和儲存,每個節點都可以參與資料檢查並共同為資料作證,這提高了資料的真實性。而由於沒有中心機構,單個節點不能隨意進行資料增減或更改,從而降低了單一節點製造錯誤資料的可能性。舉例來說,在銀行或交易平臺內部建立私有鏈,一位客戶構成一個節點,一方面可以避免大量資料由單一資訊中心集中錄入和儲存,降低操作風險;另一方面,賣方單方面的刷單行為可以透過買方的驗證得到遏制,從而保證資料的真實有效。偽造的資料若想透過區塊鏈網路的驗證,必須掌握該私有鏈中超過50%的計算能力,當節點足夠多的時候,該私有鏈的控制成本急劇上升。另外,區塊鏈中每個節點都有完整的資料副本,只有當整個區塊鏈系統發生宕機時資料才會丟失,並且資料記錄一旦寫入就不能修改。因此,區塊鏈具備公開、透明和安全的特點,可以從源頭上提高資料質量,增強資料的檢驗能力。

最後,區塊鏈可以防範資料洩漏問題。由於區塊鏈資料庫是一個去中心化的資料庫,任何節點對資料的操作都會被其他節點發現,,從而加強了對資料洩漏的監控。另外,區塊鏈中節點的關鍵身份資訊以私鑰形式存在,用於交易過程中的簽名確認。私鑰只有資訊擁有者才知道,就算其他資訊被洩漏出去,只要私鑰沒有洩漏,這些被洩漏的資訊就無法與節點身份進行匹配,從而失去利用價值。對於來自資料庫外部的攻擊,駭客必須要掌握50%以上的算力才能確保攻破區塊鏈,節點數量越多,所需的算力也就越大,當節點數達到一定規模時,進行一次這樣的攻擊所花費的成本是巨大的。因此,透過區塊鏈對資訊儲存進行加密,保證資料安全,防範大資料風控中可能出現的資料洩露問題,是區塊鏈的重要應用之一。 大資料風控+區塊鏈,未來在哪裡?

BI Intelligence在最近剛釋出的一份Fintech行業報告中預測,區塊鏈的應用和普及將成為2016年金融業的最大趨勢。那麼,區塊鏈會成為大資料風控的助推器嗎?筆者認為,“區塊鏈+大資料風控”的發展前景是廣闊的,但不是一蹴而就的。隨著金融科技的發展以及資金和人力的持續投入,區塊鏈會與大資料技術跨界融合,對風控領域現存問題提出更合理更高效的解決方案。

區塊鏈的身份驗證和加密技術也將在大資料風控中發揮作用。區塊鏈採用非對稱加密,在資訊傳遞過程中,用公鑰(公開全網可見)對交易資訊加密,被加密過的資訊只有擁有相應私鑰(只有交易發起者才知道)的人才能夠解密;在身份驗證時,用私鑰對資訊簽名,用公鑰驗證簽名者的身份(公鑰不能解出私鑰,但能驗證私鑰)。與此同時,利用大資料技術從資料端對引流的客戶進行身份驗證、特徵篩選等,以此提高反套現、反欺詐和反作弊的準確度。

過去幾年,在金融活動的合約審查及執行過程中,人為的操作風險和道德風險一直是大資料風控難以解決的問題之一。大資料風控主要針對客戶端,對於金融機構的員工操作風險和道德風險層面,大資料風控技術顯得捉襟見肘。2009年初,區塊鏈技術的出現,使智慧合約系統成為可能。基於區塊鏈可程式設計的特點,可將合約指令嵌入到區塊鏈中,有效弱化中心繫統在資料監控和驗證中的作用,並消除人為操作因素可能引發的風險。金融機構逐漸開始佈局構建區塊鏈技術的智慧合約系統,使合約的合規檢查自動化。

區塊鏈技術作為一種特定的資料庫技術,將與大資料風控技術實現優勢互補,進而構建全新的資料組織方式。筆者相信,在不久的將來,兩項技術的跨界融合將會上升到公司級和國家層的治理層面,從而帶領我們進入強信任背書的大資料時代。(文/楊望 毛可若 曲強 )

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;