“區塊鏈+大資料”跨界合作 風控現創新機遇

買賣虛擬貨幣
來源:當代金融家

作者:楊望 曲雙石 毛可若

摘要:為了實現更精準、更高效的風控,金融機構紛紛引進了大資料技術。然而,大資料風控存在資料孤島、資料低質和資料洩露等問題。對此,區塊鏈技術應時而生。兩種技術的結合,有助於風控領域的進一步發展。

風險控制是金融必不可少的環節。近年以來,為了實現更精準、更高效的風控,金融機構紛紛引進了大資料技術。然而,大資料風控並非十全十美,其尚存資料孤島、資料低質和資料洩露等有效性不足的問題,由此引發的風險事件層出不窮。區塊鏈技術的應時而生,為兩種技術在風控領域的跨界融合帶來了創新性的機遇。那麼,“區塊鏈+大資料”,能否在金融風險控制領域擦出不一樣的火花?

我國的金融體系是信貸主導型,信貸市場規模全球第一。《巴塞爾協議iii》的出臺,對商業銀行等傳統金融機構的影響是巨大的。商業銀行的業務定位有了全新的變化,不再是簡單的金融服務和信用中介,風險控制在商業銀行中扮演著更為重要的角色。為了更加直接地防範系統性風險的出現,提高政府在經濟活動中的控制力,大資料技術誕生以前,以商業銀行為代表的傳統風控模式成為最符合國情的風控模式。

大資料風控初步探索在傳統風控模式中,大部分商業銀行沿用的都是以程控交換為主的風險管理系統,雖然穩定性較強,但是客戶容納體量有限、交易通訊指令複雜等不足讓商業銀行難以滿足現代投融資需求,特別是全國7000萬中小微企業的存貸款需求,早已突破了傳統風控模式的壓力測試、欺詐檢測和風險監管的系統容量上限。需求促進創新,2008年開始,伴隨著資料處理需求的增加和大資料技術的發展,商業銀行等傳統金融機構日漸意識到資料資產的重要性,並逐步將程控交換系統轉換成ip網路為主的大資料風險控制系統。由此,大資料風控逐漸成為金融機構創新傳統金融風控模式的變革利器。

另外,日均2eb級別的海量資料的產生,讓螞蟻金服為代表的網際網路金融企業和中誠信為代表的徵信機構開始在大資料風控領域嶄露頭角,圍繞自身網際網路平臺和業務系統,打造了諸如“螞蟻大腦”、“京東天機”的大資料風控系統。然而,2013年以來,隨著網際網路金融的快速發展,以p2p為代表的網際網路金融企業如雨後春筍般湧現。具體而言,自2007年我國誕生第一家p2p平臺起,p2p平臺在快速發展的同時頻頻暴露出跑路、停業、提現困難和經偵介入等問題。大部分p2p平臺均宣稱,自家平臺是採用先進的大資料風控技術,嚴進嚴出,基本能保障不良貸款率在p2p行業較低的水平。然而,p2p行業的風控現狀卻總是事與願違。根據網貸之家釋出的《2015年p2p網貸行業年報》顯示,2015年全國正常運營的p2p平臺總數2595家,累積停業及問題平臺數量高達896家,佔比34.53%。問題平臺總數高達2014年的3.26倍。因此,p2p風控之殤從一個側面反映出大資料風險控制存在有效性不足等問題。大資料風控美中不足眾所周知,大資料風控是指利用大資料技術對交易過程中的海量資料進行量化分析,進而更好地進行風險識別和風險管理。大資料風控的核心原則是小額和分散,即預防資金相關者過度集中。小額的設計原則主要是針對海量資料構成的統計樣本,儘量避免出現統計學中的“小樣本偏差”。分散的設計原則主要是透過分析借款主體的人口屬性、商業屬性、行為屬性和社交屬性等資料來建立大資料風控模型。

基於大資料的風險控制,突破了傳統風險控制模式的侷限,在利用更充分的資料的同時降低了人為偏差,是金融機構創新傳統金融風控模式的變革利器。應用大資料技術不僅可以提高風險控制的效率,還能節約風控過程中的管理成本。然而,大資料風控並不完美。

首先,大資料風控技術無法解決資料孤島問題,即資料的開放和共享問題。目前,政府、銀行、券商、網際網路企業和第三方徵信公司掌握的資訊難以在短時間內互聯互通,從而形成一個個資訊孤島。當交易在不同金融機構之間進行時,資料孤島導致了資訊的不對稱、不透明,帶來了大量的多頭債務風險和欺詐風險。金融信貸行業若想利用大資料風控技術提升風控水平,就必須打破資料孤島,解決資訊不對稱和資訊獲取不及時的問題。

其次,資料低質的問題也從一定程度上影響了大資料風控的質量。特別是來源於網際網路的半結構化和非結構化資料,其真實性和利用價值很低。舉例來說,在美國,lendingclub和facebook曾經合作獲取並利用社交資料;在中國,宜信也曾大費周章地採集借款人的社交資料,以期實現對借款人信用的全面評定。但是兩者得出的結論如出一轍,由於社交網路中的資料主觀隨意性很強,這些在網上提取的社交資料根本不具有利用價值或者利用價值十分低,錯誤率高達50%。電商平臺上的交易資料也由於一些刷單現象而失真。這些資訊的收集與利用就如同垃圾的運進運出,幾乎沒有任何意義。基於這些低質資料的風控效果也會大打折扣。

最後,大資料風控過程中存在資料洩漏問題。近年來,資料洩漏風險事件屢見報端。2015年2月12日,匯豐銀行大量秘密銀行賬戶檔案被曝光,顯示其瑞士分支幫助富有客戶逃稅,隱瞞數百萬美元資產,提取難以追蹤的現金,並向客戶提供如何在本國避稅的建議等。這些檔案覆蓋的時間為2005年至2007年,涉及約3萬個賬戶,這些賬戶總計持有約1200億美元資產,堪稱史上最大規模銀行洩密。verizon釋出的全球調研報告《databreachinvestigationsreport2015》顯示,2015年網路安全事件共有79790起,確認的資料洩露事件超過2000個(2122個)。這些都大大降低了大資料風控的有效性和應用價值。

2008年11月,一位名叫中本聰的技術極客首次提出了區塊鏈概念。區塊鏈本質是一個去中心化的分散式資料庫,這種去中心化、開放自治、匿名不可篡改的資料結構特性使其一出現就迅速取得大量關注。區塊鏈的出現,也在一定程度上解決了大資料風控有效性不足的問題。

區塊鏈可解決現實中諸多技術壁壘

區塊鏈誕生於比特幣體系中,比特幣是一種數字貨幣,而區塊鏈是記錄這種貨幣發行與交易的“賬本”。為了不涉及被信任的第三方,這個“賬本”需要保證交易雙方能夠相互信任,且保證全部交易資訊公開透明,自動傳達給交易雙方。因此,這個“賬本”必須是共享、自治和不可隨意更改的,要有去中心化、開放自治和匿名、不可篡改的特性。區塊鏈的四大核心技術主要實現了以下特性:分散式記賬、分散式傳播、分散式儲存,保證了系統內的資料儲存、交易驗證、資訊傳輸全部都是去中心化的;透過“時間戳”〔(區塊(完整歷史)+鏈(完全驗證)=時間戳”〕來記賬,形成了一個不可篡改、不可偽造的資料庫;所有權的信任是“演算法式信任”,非對稱加密演算法保障交易資料的可信;實現了可程式設計的智慧合約,使系統可能去處理一些無法預見到的交易模式。

區塊鏈去中心化、開放自治、匿名不可篡改的特性使其應用場景迅速擴張,從最初的數字貨幣,到證券交易結算、會計審計等涉及合約稽覈的金融領域,再到政府、醫療等公共領域,區塊鏈技術解決了現實世界中存在的諸多技術壁壘。具體來說,京東白條近兩年構建了被稱為“四大發明”的大資料模型體系:司南-風險管理模型系統、火藥-量化運營模型體系、活字-使用者畫像模型體系、造紙-大資料徵信模型體系。毋庸置疑,與傳統風控體系比較,依託於大資料技術的“四大發明”的風控體系能夠更加精準地識別及遏制套現行為,目前為止已經為1億使用者完成了信用評估。然而,大資料風控體系仍然無法解決其資料來源上存在的問題。無獨有偶,將區塊鏈技術應用於大資料風控體系,可以有效解決大資料風控資料孤島、資料低質和資料洩露等資料來源問題。

區塊鏈資料庫可提高大資料風控的有效性

影響大資料風控有效性的關鍵因素是資料庫的維護成本和資訊傳遞效率。而單從資料的角度來看,區塊鏈是一個由所有參與者共同記錄(而不是中心化機構單獨記錄)資訊、由所有參與記錄的節點共同儲存(而不是儲存在中心化機構中)並且不可隨意篡改的資料庫。在這個區塊鏈資料庫中,每個使用者節點都擁有整個資料庫的完整複製,並且當某個使用者節點要對資料庫寫入資料時,它需要向區塊鏈網路廣播這些資料,以便其餘使用者節點對這些資料進行驗證稽覈操作。只有全網共同驗證和認可後,資料才能寫入區塊鏈,並且一旦資料寫入區塊鏈後,就不能隨意修改或刪除。這樣一個用區塊鏈技術構建的資料庫,對於大資料風控有效性的提高有重要意義。

首先,區塊鏈去中心化、開放自治的特徵可有效解決大資料風控的資料孤島問題,使得資訊公開透明地傳遞給所有金融市場參與者。設想以下情況:一位客戶同時向a銀行和b銀行各申請100萬元的房屋抵押貸款,但其房屋價值只有100萬元。如果兩家銀行加入了同一區塊鏈,就能即時辨別出客戶的交易行為和風險,避免放貸總額超過抵押值。除了交易主體外,監管部門也可以作為一個使用者節點加入區塊鏈,實時監控其他使用者節點的交易資訊,防範風險事件的發生,無須再等到事後申報。利用區塊鏈中全部資料鏈條進行預測和分析,監管部門可以及時發現和預防可能存在的系統性風險,從而更好地維護金融市場秩序和提高金融市場效率。可見,區塊鏈去中心化的特徵,可以消除大資料風控中的資訊孤島,透過資訊共享完善風險控制。

其次,區塊鏈的分散式資料庫可改善大資料風控資料質量不佳的問題,使得資料格式多樣化、資料形式碎片化、有效資料缺失和資料內容不完整等問題得到解決。在區塊鏈中,資料由每個交易節點共同記錄和儲存,每個節點都可以參與資料檢查並共同為資料做證,這提高了資料的真實性。而由於沒有中心機構,單個節點不能隨意進行資料增減或更改,從而降低了單一節點製造錯誤資料的可能性。舉例來說,在銀行或交易平臺內部建立私有鏈,一位客戶構成一個節點,一方面可以避免大量資料由單一資訊中心集中錄入和儲存,降低操作風險;另一方面,賣方單方面的刷單行為可以透過買方的驗證得到遏制,從而保證資料的真實有效。偽造的資料若想透過區塊鏈網路的驗證,必須掌握該私有鏈中超過50%的計算能力,當節點足夠多的時候,該私有鏈的控制成本急劇上升。另外,區塊鏈中每個節點都有完整的資料副本,只有當整個區塊鏈系統發生宕機時資料才會丟失,並且資料記錄一旦寫入就不能修改。因此,區塊鏈具備公開、透明和安全的特點,可以從源頭上提高資料質量,增強資料的檢驗能力。

最後,區塊鏈可以防範資料洩露問題。由於區塊鏈資料庫是一個去中心化的資料庫,任何節點對資料的操作都會被其他節點發現,從而加強了對資料洩露的監控。另外,區塊鏈中節點的關鍵身份資訊以私鑰形式存在,用於交易過程中的簽名確認。私鑰只有資訊擁有者才知道,就算其他資訊被洩露出去,只要私鑰沒有洩露,這些被洩露的資訊就無法與節點身份進行匹配,從而失去利用價值。對於來自資料庫外部的攻擊,駭客必須掌握50%以上的算力才能攻破區塊鏈,節點數量越多,所需的算力也就越大,當節點數達到一定規模時,進行一次這樣的攻擊所花費的成本是巨大的。因此,透過區塊鏈對資訊儲存進行加密,保證資料安全,防範大資料風控中可能出現的資料洩露問題,是區塊鏈的重要應用之一。“區塊鏈+大資料”風控,未來在哪裡?根據biintelligence的《fintech行業報告》預測,區塊鏈的應用和普及將成為2016年金融業的最大趨勢。那麼,“區塊鏈+大資料”能否成為風控的創新機遇?

毋庸置疑,“區塊鏈+大資料”風控的發展前景是廣闊的,但也不是一蹴而就的。隨著金融科技的發展以及資金和人力的持續投入,區塊鏈會與大資料技術跨界融合,對風控領域現存問題提出更合理更高效的解決方案。

在身份驗證應用層面,由於合規合法制度要求,客戶身份認證一直是金融等中介機構無法逾越的基礎設施建設工作之一。過去,親面親籤的認證方式既讓客戶體驗度降低,又讓中介機構為此投入大量人力和物力資源。目前,以onename、bitid等為代表的第三方身份驗證服務提供商開始利用區塊鏈去中心化、公正公開的特性,在比特幣平臺上為金融等中介機構提供去中心的第三方客戶身份認證的服務。簡而言之,可以用“+warren”實現身份認證或比特幣交易。與此同時,利用大資料技術從資料端對引流的客戶進行身份驗證、特徵篩選等,以此提高反套現、反欺詐和反作弊的準確度。

在金融合約應用層面,人為的操作風險和道德風險一直是大資料風控難以解決的問題之一。大資料風控主要針對消費者,對於金融機構的員工操作風險和道德風險層面,就顯得有些捉襟見肘。區塊鏈2.0技術的出現,使智慧合約系統成為可能。基於區塊鏈可程式設計的特點,可將合約指令嵌入到區塊鏈中,有效弱化中心繫統在資料監控和驗證中的作用,並消除人為操作因素可能引發的風險。金融機構逐漸開始佈局構建區塊鏈技術的智慧合約系統,使合約的合規檢查自動化。

毋庸置疑,對於大資料+區塊鏈的金融風控技術來說,區塊鏈本身或許存在亟待完善的風險漏洞,比如thedao被盜事件說明區塊鏈的智慧合約協議程式碼存在漏洞。與此同時,國內外區塊鏈行業專家也正在嘗試全新的解決方案。首先,在信用風險方面,區塊鏈企業或可與保險機構跨界合作,開發區塊鏈信用保證保險和履約保證保險來獲得更強的公信力;其次,在操作風險和道德風險方面,區塊鏈或將在原有開放原始碼基礎上迭代自動投票恢復交易和資金凍結的功能模組,以此來防範類似於thedao事件中成員所引發的操作風險和道德風險;最後,在市場風險方面,基於區塊鏈技術的數字貨幣或可錨定全球最具代表性的法定貨幣,比如美元、人民幣和歐元等。

區塊鏈技術作為一種特定的資料庫技術,將與大資料、風控技術實現優勢互補,進而構建全新的資料組織方式。筆者相信,在不久的將來,兩項技術在風險控制領域的跨界融合將會上升到公司級和國家層的治理層面,從而帶領我們進入強信任背書時代。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;