用演算法定義邊界,安全多方計算重構金融大資料風控模式

買賣虛擬貨幣
在金融科技的發展道路上,大資料金融與隱私保護看來相悖,但是若不能適配逐漸升級的隱私保護,金融科技就無法走的更遠。2019年下半年,監管部門密集出臺了《資料安全管理辦法》、《App違法違規收集使用個人資訊行為認定方法》、《個人金融資訊(資料)保護試行辦法》等多項徵求意見稿及草案。在業內人士看來,從法律層面加強金融資料的保護,是保證使用者資訊保安、維護使用者權益和金融穩定的重要課題,也是金融行業治理整頓的重要一環。涉及國內多家銀行數百萬條客戶資料資料,在暗網被標“白菜價”兜售的訊息廣為流傳。引起監管及業內高度重視的同時,也再次拉緊金融消費者敏感的神經。在去年的突擊拉網行動中,一個近幾年最為暴利的行業走向了滅亡,這就是現金貸。信貸本沒有錯,錯在這個發展過程中變味了,變得像過街老鼠。信貸的核心是風控與催收,風控的命門是資料。信貸行業如何給自己洗心革面,這需要從信貸風控說起。

風控的本質是資料 

支撐風控的大資料市場發生了變化,這個變化似乎是不可逆的,所謂風雨之後見彩虹。過去很長時間,放貸的場景是這樣子的(這也是美國流入中國的所謂的Fintech模式、零售模式、小貸模式、發薪貸模式……)。

某放貸機構在新聞瀏覽器投放一支廣告——“……只要身份證就能領取8000元急用金……”,小明因為急用錢點選進入,註冊領取,這個過程非常簡易,包括註冊、下載APP、填寫資訊與綁卡、申請等待、授信透過領款等幾個線上操作。

機構是如何對借款使用者進行風控呢?上一輩人肯定無法理解,因為他們獲得貸款都需要抵押或者擔保。網際網路金融強調零售業務的效率,這個風控過程被完全搬到了網際網路這個虛擬空間。風控的命門變成了資料,從小明註冊開始,這一系列的動作,都被放貸機構掌握了他的資料。

放貸機構獲得了小明的姓名、身份證、手機號等要素,獲得了手機APP底層的行為資料,獲得了銀行卡資訊資料,透過使用者ID資訊,風控引擎會自動去第三方資料查詢更多的標籤,比如是否在其他借貸平臺有過借款、有過逾期,是否是信貸黑名單,是否經常瀏覽博彩類網站,填寫的家庭地址是否是一個偽造的地址,甚至是小明的通訊錄和聯絡人是否有老賴或者貸款中介……

打一個比喻,一旦申請網貸,借款人相當於被脫光了放在櫥窗裡,供人審閱!

缺乏技術理論的金融科技走不遠

不傻的人都能看明白,這個所謂的“科技賦能”在過去的網際網路信貸模式一定是罪孽的幫兇。心地善良的我們,本應該享受這種快捷的方式借到自己急需的錢,享受科技帶來的普惠,卻變成了被完全監控、騷擾。你的資訊變成暴利商的無成本交易品,你的手機號被無數次倒賣,你一天可能接到十個營銷電話、二十條營銷簡訊。這一切都會讓本來安安靜靜的生活變得無序、變得可怕。

金融無奸不商,股市吸血、貸款要命。互金這些年,因為缺乏完整的監管體系,所有的傳統金融都試圖加持所謂金融科技,大張旗鼓。在科技賦能的過程,脫離了社會人文字質,更嚴重的是脫離了道德與倫理。這話並不嚴重,可能是古代的人太笨,不懂得說你脫了拍點裸照就可以得到貸款,這已經是上升到社會道德層面的問題了。

我很想說,缺人文道德的金融科技走不遠,也必須不可以走遠。缺人文道德,我們美麗文明的國度會失去原本的美好,人心惶惶、膽戰心驚,那種生活在新科技時代的不安,會讓我們看身邊所有事物都感覺是一個陷阱。

金融科技要健康,首先解決隱私問題

過去大多數金融科技案件,都因使用者隱私問題引發。非法採集資料、非法販賣資料的歸因其實還是資料行業生態的不完善性,讓一大部分奸商有機可乘。金融科技從業者都有這樣的感覺,自去年開始,似乎所有的業務都停滯了。迫於法律法規的約束與要求,風控變得一數難求。

金融科技絕對依賴使用者資料。

精準營銷要達到精準,必須使用個人使用者資料,比如一個做信用卡推廣的銀行,如果閉著眼睛去投放資訊流或者發簡訊,roi如果能達到0.3已是萬幸。一般的渠道都會進行使用者刻畫,比如採購消費標籤等,甚至是運營商的DPI資料(近期是否瀏覽過辦信用卡的頁面),這樣的經驗標籤或者瀏覽日誌可能可以讓roi提高到1以上。

風控評分要達到效果,更須依賴於個人使用者資料,比如一個銀行做個人貸款,如果只用央行徵信資料,很有可能借款人不在其中,即使在其中但是資料維度單一。高效的方式是採購第三方的信用資料進行評估,比如某嘛分(當然今天已經不直接輸出)、運營商的話費資訊、手機裝置SDK廠商的APP安裝和使用資訊、地圖廠商的LBS位置資料等等,透過多維度的資料進行聯合建模,最終得到借款人的信用評估值。

這些金融業務本質上不是想“買賣”使用者資料,作為業務甲乙方本質上只期望得到資料背後的知識和價值。所以,金融科技本沒有錯,錯的是金融科技過程留下的禍根很深。金融科技要正名自己,必須解決賦能過程中對使用者資料隱私的絕對保護和安全。

資料應用正規化必須重構

解決使用者隱私問題,我們曾經熟悉的API呼叫與建模方式存在著千瘡百孔的漏洞——保險公司去查資料來源,保險客戶ID就被快取、被惡意再營銷、被迫流失;銀行要對信用卡建模,就必須把Y樣本(信用卡逾期表現)給到資料來源,或者資料來源把標籤庫完整地放到銀行端,使用者資料的大批次遷移出庫往往引起惡劣後果。

風控是支撐金融業務的核心,要持續健康地運轉,必須重構資料應用的正規化——資料廠商與金融機構用安全計算的方式合作資料,用人工智慧保證資料的絕對安全。一個簡單的安全計算(舉例聯邦學習)為例:

Role A表示銀行端,Role B表示資料來源,用聯邦學習的方式使用資料進行聯合建模,整個過程資料本身只在本地私域進行計算,過程中互動的是加密的模型引數,最終得到加密的分散式模型。

安全計算既保護資料,又提效

· 多個模型交叉

有過風控經驗的工程師都經歷過,假設現在有2個資料來源,運營商資料和SDK資料,如果對方都不直接輸出標籤的情況下,智慧帶著Y樣本分別去運營商和SDK伺服器上建模,分別訓練出模型。實際應用過程中,相當於分別呼叫模型,得到各自的評分,最後做交叉評估。

· 多方聯合建模

(多方)安全計算可以實現統一建模,在一個平臺上,同時用運營商和SDK的標籤,進行多方訓練,得到一個更完整的綜合評分模型。

多方安全計算聯合建模優勢:

1)保證使用者隱私安全,資料不出本地私域;
2)避免單資料來源聯合建模的特徵

大資料風控未來,演算法定義邊界

資料業務能做多少大,不應該只取決於業務的市場容量有多大,業務做到哪兒應該停止,這個問題將會被演算法重新定義。為什麼如此說道?因為資料業務的敏感性,迫使一旦遇到資料安全帶,就必須停止,這就是所謂的邊界。這個邊界可以有法律來制定,但是往往很難,因為資料業務的錯綜複雜導致沒有一個條例可以講清楚你這樣用資料是不是合法合規。

先定義模式,在模式之內,你能夠到的地方,都允許你去觸碰,這就清晰了!資料業務迴歸業務本質,不需要去擔心和考慮是不是觸碰到法律。這就好比足球場上的球員只要關注自己的球技,不要將球踢出邊界即可,球場上盡情發揮、淋漓盡致,踢出精彩的比賽。

安全計算,定義好了這個足球場和球場規則,資料來源和金融機構作為參與方,在這個球場上,不存在資料出界的機會:資料不出庫、可用不可見、模型滿地跑。

尊重人文,才是人工智慧

人工智慧是一個很寬的詞彙,本意上是讓人們的生活更快捷、更美好,多看十年二十年,人工智慧才處於一個早期,人工智慧賦予金融業務顯得過於急躁,過程中的“不愉快”可以成為一個經驗或者教訓,往後發展之路,必須步步“經”心,必須迴歸到本意,那就得尊重人文。否則一切都會弄巧成拙、畸形怪出。目前包括富數科技在內的做安全計算的幾家公司,都試圖用新的技術來詮釋安全的定義,最終讓人工智慧更貼近人文,更擁有社會責任感。

網際網路與科技發展之快,如飛奔的高鐵,適當的時候放緩腳步,回過頭看看存在的問題,這是企業和行業的責任!遊戲行業如何引導孩子的健康?直播與社交如何抵制涉黃?金融如何防犯使用者隱私問題……產能巨大的話題行業與人工智慧結合顯得極為重要,警惕網際網路大躍進過程中的人文迷失。

作者

黃奉孝(郭嘉)

自詡從技術走向業務的小學生。近十年網際網路大資料行業經驗,先後就職於上海大智慧、平安、挖財,任職大資料架構師、資深分析師等職位,對金融科技有深入研究。

目前任職富數科技高階總監,負責隱私計算的解決方案與業務落地。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;