區塊鏈與分散式機器學習（DML）關係淺談

分散式協作是未來的方向，其基礎是分散式業務共識。分散式業務共識實質上是，在共識演算法的支配下藉助分散式智慧系統來完成每個節點特定的任務。虛擬機器（VM）就是一個典型的分散式智慧系統，或...

分散式協作是未來的方向，其基礎是分散式業務共識。分散式業務共識實質上是，在共識演算法的支配下藉助分散式智慧系統來完成每個節點特定的任務。虛擬機器（VM）就是一個典型的分散式智慧系統，或者說是分散式AI的低階形式。分佈在全網上的各個節點透過與VM的直接互動，來達到交易的目的。VM執行交易的機制是預先得到全網共識的智慧合約（程式碼庫），這是在一個行業生態中較為簡單的業務共識。VM執行的方式是透過執行一套對應的演算法，完成具體的鏈上交易任務。但是，EVM（以太坊虛擬機器）目前還不能做到專家系統，如不能夠給出股票投資策略專家級建議，只能夠完成股票交易操作指令的執行，因此是不具備智慧形態的。目前區塊鏈所起的作用是透過業務共識來達成自動交易，並同步交易資訊，節約交易者時間，資料不可篡改，具有抗抵賴性和方便追責，同時降低資本市場穿透式監管的成本。但是區塊鏈有以下缺陷：（1）資料來源的真實性依然要藉助於中心化的平臺進行背書，例如股票交易資料的真實性依然要藉助中心化的傳統證交所，所以並不能徹底解決節點間的信任問題；（2）僅僅能夠做資料留痕，不能利用資料進行系統訓練，以更好地改進業務質量。有鑑於此我們認為區塊鏈未來的技術方向是跟AI技術相結合，其中最典型的是區塊鏈+分散式機器學習的綜合技術模式。訓練專家系統是機器學習（ML）的任務，簡單來說，ML工作所需資料是真實訓練資料和最新預測資料，透過這些資料的對比不斷調整權值向量和學習引數，以提高ML預測的精度。這些訓練資料並不是全都有用，AI需要從中挖掘出有價值的資料，並發現這些資料之間的關聯性，因此資料探勘技術和ML是一體兩翼。進入到金融大資料時代，每秒鐘產生的資料量在傳統基礎上暴增，並且所構建的模型需求也相對傳統有了質的提升，比如微軟公司在2015年訓練出的AI模型LightLDV，擁有多達200億個引數。資料的量越來越大，關係越來越複雜，也對模型的複雜度提出了超高要求，這使得單機進行ML訓練的效率無法跟上，因此未來分散式機器學習（DML）就成為了趨勢。DML需要藉助雲端計算、大資料探勘、機器學習等技術作為支撐，同時區塊鏈技術在其中也扮演著重要角色。舉例：股票市場的投資者的基本訴求是在控制風險的基礎上，儘可能多地增加收益。那麼如果有這麼一個專家系統，經過訓練，可以對未來的收益和風險進行較準確的預測，股民就可以根據專家系統的建議，靈活選擇不同的投資品種進行組合。而訓練專家系統的資料來自股民自己的歷史資料，和真實的預測資料。因為可以對AI進行訓練，因此這些資料都是有價值的。可以設計一套機制，股民貢獻自己的資料上鍊，可根據資料的價值給與股民節點相應的token獎勵。分散式專家系統（或者AI投顧系統）的初衷是幫助大部分節點獲益，因此token可以與系統總的盈利能力的改進相繫結。DML在每個節點處都有最新的備份，且永久存在鏈上。只有區塊鏈能夠實現這一套激勵機制，這就大大加快了AI專家系統學習的步伐跟效率。有兩點機制可以確保原始資料是真實的：（1）從利益角度出發，每個節點都想減少風險和提高系統預測能力，因此會貢獻出真實資料以幫助DML能力的快速提升；（2）真實資料是完全隨機性的，而造假的資料或多或少有一些非隨機的痕跡，這一點可以核實出來，系統自動捨棄掉非隨機的成分，因此使得造假的部分不能作為訓練資料。

區塊鏈創立的初衷是節點間的民主、共責、共識、信任，其實還應該在這些基礎上加上“激勵”。激勵必然跟錢掛鉤，而區塊鏈的特性已經解決了雙花問題，這使得去中心化的激勵機制是可行的。區塊鏈網路共同維護的是一個虛擬的分散式機器，是信任的機器。區塊鏈+DML的模式在資本市場上的成功也必然延伸到其他場景，代表了區塊鏈的真正價值——即“實現高效有序的大規模分散式協作”。

區塊鏈與分散式機器學習（DML）關係淺談

推荐阅读

近期文章

新手教程

1什麼是區塊鏈？區塊鏈能做什麼？

2區塊鏈是如何運作的？

3區塊鏈和比特幣的關係？

4比特幣有什麼價值？

5如何購買比特幣？