萬向區塊鏈肖風：資料要素市場與分散式AI平臺

2020年7月10日，世界人工智慧大會首個區塊鏈主題論壇圍繞“區塊鏈與AI的融合發展”、“區塊鏈與AI如何改變金融”、“國際區塊鏈的發展路徑”、“區塊鏈如何改變我們的生活”4大議題展開了討論，意在探討區塊鏈技術與人工智慧技術融合創新的可能性及其能夠帶來的價值。萬向區塊鏈董事長兼CEO肖風博士受邀出席論壇，並發表了題為《資料要素市場與分散式AI平臺》的演講。在演講中，他分析了人類社會當前面臨的技術性遷徙，以及區塊鏈和人工智慧在資料要素市場中的作用。

全文內容整理如下：

非常高興有機會參加世界人工智慧大會的區塊鏈論壇，這是一場跨界論壇。所以我今天的話題，也試圖從“跨界”的角度來談談我個人的一些思考。

海量資料是所有人工智慧演算法高效執行的前提。中小企業、中小科研機構可能沒有能力蒐集到海量資料。前段時間國家提出要建立“資料要素市場”，我想，其本意就是希望能夠透過建立資料要素市場，使資料流動起來，讓中小企業能夠擁有、交易符合需求的資料，從而使自己擁有人工智慧的智慧化能力。

這場世紀疫情突然把我們拋到了陌生的境地——一個數字化的世界裡。突然所有東西一夜之間線上化了。如果沒有線上化，你會感覺到非常不方便，甚至工作生活都無法正常進行。

基於我的個人觀察，我總結出了“數字化遷徙”的三個步驟：線上化—數字化—智慧化。

線上化就是用ICT技術把工業的研發、生產、銷售、產品全流程及個人生活過程都搬到網際網路上。完成線上化之後，我們才可能透過網際網路、物聯網低成本地收集到海量的資料，而這些資料是人工智慧演算法必要的生產要素。數字化即透過物聯網、網際網路收集、儲存、分析資料。在足夠數字化之後，我們才可能走向智慧化，即有效運作人工智慧演算法。

完成這三個步驟之後，我們才能開始談人工智慧的應用。

我們都知道人工智慧已經由高潮到低潮，起起落落三個來回了，為什麼到今天才這麼普及、這麼深度地影響到所有人的生活、所有制造，甚至城市的治理？現在我們能夠透過網際網路和物聯網，低成本地擁有海量的資料是非常重要的一個前提。

資料要素的特點

資料作為生產要素具有其自身的特點，這些特點與以往其他生產要素完全不同。我總結出了以下四個特點：

第一，資料確權。產權保護非常不容易，因為資料虛幻飄渺，有高度的可流動性。按下計算機上的傳送按鍵，資料可能就傳送出去了。另外，資料又非常容易被複制，不像用影印機影印書，一本書可能有兩三百頁，影印成本很高。而資料的複製是零成本的，這對資料作為生產要素是非常不利的。

第二，資料的所有權不可分離。舉個例子，我的基因資料不可能因為被你買斷了就不再屬於我。由此可見，資料所有權和主體是無法分離的。不像股票，它所代表的所有權，從A轉向B時是一種買斷行為，即當買入者從賣出者手中購入股票時，就擁有了該公司的一部分權利，賣出者則喪失了這部分權利。

第三，資料越分享價值越大。一條資料如果只有一個人用，它的價值非常小；如果有一萬個人用，才能真正發揮它的價值。所以資料具有很廣泛的社會性，我們需要讓它在更廣闊的範圍裡得到分享。

第四，資料的使用邊際成本為零。資料一旦產生之後，無論是一個人用、一萬個人用還是一億個人用，它的邊際成本都是零。

資料要素市場的特點

正因為資料要素的以上特點，我們要建立的資料要素市場，和我們熟悉的股票市場、債券市場、土地市場又有很大的不同。

第一，資料要素市場交易的是資料的使用權，不是所有權。剛剛講過資料所有權不能與主體分離，不能被買斷。

第二，所有資料交易的需求，都是跟特定用途和場景有關係的。任何標準化的交易和購買資料都不會是為了升值，而是為了滿足需求。

第三，資料交易是點對點的交易組織形式，有特定的交易物件。一方持有特定資料，另一方則有特定的需求，於是雙方點對點地完成這一筆交易。實際操作中，很難用集中的大資料交易所方式來組織所有的資料交易。

第四，資料交易是需要經過多方許可、多次許可的。一個資料的使用權可以賣給一萬個使用者，一個科學家可能要向一萬個人徵集資料，才能具有某種統計學上的意義或者得出普遍適用的結論。所以資料交易是一個需要多方許可、多次許可的市場。

第五，資料要素市場是非標準化的，不能像股票、債券那樣按照固定標準進行交易。

區塊鏈對於資料要素市場的價值

我一直認為，大資料交易所這一組織形式並不適合資料要素市場，點對點的分散OTC市場（注：Over the Counter場外交易市場）更合適資料要素的交易。要建立這樣的資料要素市場，我個人認為離不開區塊鏈和隱私計算等技術。

1、資料可信：作為點對點的資料要素市場，如何確保資料的可信度？這需要使用區塊鏈分散式賬本的特點，大家共同記賬、不可刪除、不可篡改，只有在區塊鏈技術的加持之下，資料的可信度才能得到保證。

2、資料確權：如果資料產權得不到很好的確認，又如何能用於交易？區塊鏈可以以很低的成本對資料進行確權，主要依靠區塊鏈可存證、可追溯、可溯源、可審計等特點。這些分散式賬本的標誌性特點，可以很好地幫助我們進行資料確權。

3、資料保護：區塊鏈用到的很多加密演算法，比如雜湊函式、非對稱加密、零知識證明等密碼學演算法，給分散式資料要素市場提供了非常好的資料保護。如果資料不能得到保護，就一定會被盜用。

4、資料交換：資料得到保護之後還需要進行交換，如果不交換，就無法發揮出資料的價值。交換加密後的資料也需要用到很多密碼學演算法，如可驗證計算、同態加密、安全多方計算等，這些密碼學演算法能夠幫助資料在加密之後參與協同計算，從而得出我們需要的某些結論。

5、降本增效：資料交換過程中，點對點的分散式資料市場如何幫助大家低成本、方便、快捷地完成這場價值交換？區塊鏈上的智慧合約顯然是最合適的方法、工具。

6、價值分配：我們試想一下，一個科學家向一萬個資料擁有者徵集到了足夠多的樣本資料，計算出來一個他所需要的目標函式。此時他需要向一萬個陌生人支付資料的對價，最方便的方法就是使用可程式設計的數字貨幣，讓大家都完全相信它一定會得到對價。這種清算結算方式同時也是最省錢、最高效的。

在這六個方面，區塊鏈和隱私計算都可以非常好地適配點對點資料要素市場。

我們可以看到，區塊鏈技術和隱私計算技術會給人工智慧插上“飛翔的翅膀”，使得資料隱私得到保護、資料資產得到確權、資料共享得到激勵、資料計算得以開放、資料治理得以有序進行。人工智慧資料要素市場離不開區塊鏈和隱私計算技術。

綜上所述，鑑於資料的所有權非常分散，資料的使用權往往可以被多方多次地許可、交易，資料交易的市場是點對點的分散式市場。基於區塊鏈和隱私計算技術基礎建立分散式AI平臺將大有可為。

分散式AI平臺除了對應著前面所討論到的資料要素市場特點之外，更重要的是能賦能中小企業。到目前為止，真正能將AI使用得非常好非常有效的是網際網路巨頭們。這是因為他們有很好的網際網路平臺可以蒐集到海量的資料，同時他們也有很強大的財力利用資料最佳化人工智慧演算法。但是大量沒有雄厚財力獲取海量資料的中小企業也需要人工智慧的賦能，因為個人和中小企業也掌握了很多資料。

我們一方面需要用分散式AI平臺更好地蒐集散落在市場和民間的資料，另一方面要賦能中小企業，讓他們獲得人工智慧的加持。分散式AI平臺是接下來人工智慧界、區塊鏈界應該共同嚴肅討論的話題。

以上就是我今天的分享，謝謝大家！

問答環節

主持人：現在區塊鏈和AI這兩個技術都處於相對初期的發展階段，兩個技術要相互結合在一起，在這個階段是否有可能實現嗎？還是要等兩個技術都成熟以後才會有更好的互動？

肖風：第一，人工智慧技術和區塊鏈技術是不是處於發展初期，這點值得商榷。從上世紀60年代開始，人工智慧已經經歷過三波高低潮的交替，我認為它已經處於成熟期。

第二，我們必須在技術處於初期的時候加入到“戰場”中。1999年、2000年的時候網際網路也處於發展初期，因為TCP/IP模型在90年代中期（1993年、1994年）才初步定型。在今天看來，所有偉大的網際網路公司幾乎都誕生在那個時候，所以千萬不能等。如果等到技術成熟了再入場，那麼基本上就沒戲了，這個市場不屬於你。

第三，這兩項技術都在逐漸發展成熟。人工智慧技術和區塊鏈技術的不斷融合是它們走向成熟的必要條件。它們在融合當中會變得更加成熟。如果永遠不融合，它們各自的發展成熟速度可能都會放慢，所以推動這兩項技術的融合是當務之急。

萬向區塊鏈肖風：資料要素市場與分散式AI平臺

推荐阅读

近期文章

新手教程

1什麼是區塊鏈？區塊鏈能做什麼？

2區塊鏈是如何運作的？

3區塊鏈和比特幣的關係？

4比特幣有什麼價值？

5如何購買比特幣？