區塊鏈與機器學習如何創造出最給力的人工智慧?

買賣虛擬貨幣

透過基於區塊鏈市場的資料訓練獲得機器學習模型,能夠有潛力來創造世界上最具影響力的人工智慧。他們將兩個部分組合起來:私有機器學習,這可以進行在私密資訊上進行訓練,而且不用洩露資訊,同時基於區塊鏈給予激勵,這樣做可以讓這些系統吸引最好的資料和模型,讓它們更加聰明。最後的結果會組成一個開放式的市場,任何人可以售出他們的資料並且保留私密資料,同時開發人員也可以透過激勵為他們的演算法吸引最好的資料。

建造這些系統是非常具有挑戰性的,所需要的建造基石也正在建立,但是從現在的簡單初始版本看起來,這是有可能的。我相信這些市場會將我們從現在的Web 2.0時代轉移到程式碼和演算法開放競爭的Web3.0時代,並且這些演算法和資料都可以直接獲得收益。

起源

這個想法來自於2015年和來自Numerai基金的Richard之間的討論。Numerai是一個對沖基金,它會把加密貨幣市場的資料傳送給任何想要和做股票市場模型的資料專家。Numerai將最好的模型提交到一個“元模型“,交易這個元模型,並且支付給建立這些模型平臺的資料科學家費用。

讓資料科學家進行競爭看起來是個非常好的主意。所以這就帶來了更多思考:我們能夠建立一個完全去中心化版本的系統,能夠應用任何場景?我認識這個答案是肯定的。

建立

舉例來說,我們嘗試在去中心化交易所上建立完全去中心化的系統來交易數字貨幣。這是眾多潛在的建立方法之一。

資料 資料提供者以資料為權益並且給模型建立者使用。

模型建立建模人員選擇需要使用甚麼資料並且建立模型。培訓使用安全的計算方式進行,這也允許模型可以在不需要洩露底層資料的情況下進行訓練。模型需要有不同權重。

建立元模型元模型是基於考慮到每個模型權重的演算法上而建立的。

建立元模型是可選的—你可以想像很多模型沒有和元模型結合使用。

使用元模型智慧合約使用元模型並且透過去中心化交易機制在鏈上進行交易。

分發收益/損失 在一段時間後,交易會產生收益或者損失。這部分利潤或者損失就會基於貢獻多少分發給這個元模型的貢獻者。那些做出負貢獻的模型會被拿走部分或者全部的抵押資金。

驗證計算對每步的計算是中心化的,但是驗證和挑戰會使用像Truebit或者使用安全多重計算的去中心化系統。

儲存 資料和模型會儲存在類似IPFS或者在多重角色計算網路的節點上,因為鏈上的儲存會太昂貴。

是甚麼驅動了這樣的系統?

吸引全球最好資料的激勵 吸引資料的激勵模式是這個系統最重要的部分,因為資料是機器學習的限制因素。同樣,比特幣透過開放的激勵建立了世界上最強大的算力網路,合適的資料激勵架構也會吸引世界上最好的資料來為你應用。並且幾乎不可能禁止來源於幾千或者百萬處的資料。

程式碼間的競爭 在模型/程式碼間建立公開的競爭,這之前從未出現過。在去中心化的Facebook上釋出幾千個競爭性的新聞傳送演算法。

獎勵透明 資料和模型的提供者可以看到他們獲得了和提交任務相關的公平收益,因為所有計算都是可驗證的,這會使得人們更加願意參加這類專案。

自動化 透過鏈上操作,並且直接從token上獲得價值,建立了自動化和無需信任的閉環迴路。

網路效果 多面網路會受到使用者,資料提供者和資料專家的影響,這也使得系統自我強化。系統能夠表現的更好,就會吸引更多的資本,這也意味著更有潛力的回報,會吸引更多的資料提供者和資料專家,他們會讓系統更加智慧,從而吸引更多資本,形成良性迴圈。

隱私

除了以上所說的點,一個主要的功能就是隱私性。它可以讓1)使用者提交太隱私並且不能分享的資料 2)防止資料的經濟價值和模型被破壞。如果讓非加密資料公開,資料和模型就可以免費復製並且被別人使用,但是那些人卻沒有作任何貢獻(“搭便車”問題)

解決這個問題的部分方案是將資料銷售隱私化。儘管買家選擇重新銷售或者釋放資料,它的價值也會隨時間減少。但是,這種方法限制了短期使用案例,並且也還是存在典型的隱私問題。因此,更為複雜但是有效的解決方案就是使用某種安全計算方法。

安全計算

安全計算方法讓模型可以在不洩露資料本身的基礎上進行訓練。現在使用和研究的安全計算方法有3種方式:同態加密(HE), 多方安全計算(MPC)和零知識證明(ZKPs)。多方計算目前是私人機器學習使用最廣泛的演算法,因為同態加密太慢,而且對於如何將零知識證明加入到機器學習中也不是很明顯。安全計算方法是電腦科學研究的前沿。他們通常會比普通的計算慢到指數級,體現了這個系統的瓶頸,但是這些年提高了很多。

終極推薦系統

為了描述私人機器學習的潛力,假設有一個叫做“終極推薦系統”的app。它可以透過你的裝置看到你在做的任何事情:你的瀏覽歷史,你在app上做的任何事情,手機裡面的圖片,定位資料,消費記錄,可穿戴感測器,資訊內容,你家裡的攝像頭,AR眼睛上的攝像頭等等。然後它會給你建議:你應該訪問的下個網站,需要閱讀的文章,要聽的音樂或者是要買的產品。

這個推薦系統會非常有用。谷歌,Facebook或者其他現有的資料庫可能都不會有這樣的系統因為它對於你有最大的縱向檢視,並且這個系統可以從你的私密不可洩漏的資訊中學習。和之前說到的數字貨幣交易系統的案例類似,它會透過關注不同領域的模型(例如:網站推薦,音樂)來運作,進行競爭來獲得使用者加密資料的准入以及像使用者進行推薦,也許甚至是因為使用者貢獻了資料以及對推薦的東西進行專注而像他們付費。谷歌的聯合學習和蘋果的差分隱私是這個私人機器學習方向的一個步驟,但是仍然需要信任,不會允許使用者直接檢驗安全性,並且讓資料保持隱秘。

甚麼樣的方案可能會首先實行?

我無法非常精確地說明甚麼樣的構造是最好的,但是我有一些想法。我用來評估區塊鏈方案的一個準則是:從物理原生,到數字原生再到區塊鏈原生的一系列研究,越區塊鏈原生,那麼就越好。越不那麼區塊鏈原生,那麼就需要更多的第三方介入,使得增加複雜性和減少使用與其他系統作為構建塊的易用性。

在這兒,我認為如果系統中價值創造是合格的,那麼這意味著系統更可能會成功執行—直接來說就是以法幣的方式,更好的選擇就是代幣。這樣就會完成一個純粹,閉環的系統。可以將之前的加密貨幣交易系統和X光線腫瘤識別系統相比較。對後者來說,你需要說服保險公司X光線模型是由價值的,並且去協商多麼有價值,然後相信一小部分現在的人從而嚴重模型的成功/失敗。

這並不是說社會使用數字原生系統的正和情況不會發生。就像之前提到的推薦系統也會非常有用。如果和數字市場聯絡,有另一種使用案例是模型可以在鏈上進行程式碼執行,並且系統的獎勵是代(對於數字市場案例而言),這樣會會創造一個純粹的閉環。現在看起來可能還不是很明朗,但是我期待基於區塊鏈的原生任務會隨著時間而逐漸擴大。

影響

首先,去中心化機器學習市場可以去除現有技術巨頭對資料的壟斷。他們在過去20年標準化以及商品化了網際網路價值創造的主要資源:專有的資料網路和他們周邊的強大網路效應。因此,價值創造從資料往演算法層面開始轉移。

技術上的標準化和商業化迴圈,我們現在正處在網際網路時代價值壟斷的末尾。換句話說,他們為AI創造了一個直觀的商業模式。

其次,去中心化機器學習市場創造了世界上最具力量的AI系統,透過直接的經濟激勵吸引了世界上最好的資料和模型。他們的強處隨著多方網路的效率而增強。由於網際網路2.0時代資料網路壟斷成為商業化,他們看起來像是下個重新聚合點的候選人。可能我們還需要幾年時間,但是這個方向是正確的。

第三,就像推薦系統展示的那樣,搜尋發生了倒置。人們不會去搜尋產品,而是產品進行搜尋同時競爭為人們服務。每個人也許都有自己喜愛的市場,推薦系統就可以將最相關的內容展示,並且這些內容和個人定義的很相關。

第四,去中心化機器學習市場可以讓我們獲得和Google和Facebook同樣的收益,並且還不需要給出我們的資料。

第五,機器學習可以更快速地發展,因為任何工程師都可以進入到開放的市場獲取資料,而不是隻有在Web2.0時代的那幾所大公司的小群體工程師。

挑戰

首先,安全計算模型現在執行速度很慢並且機器學習在計算方面已經很昂貴了。另一方面,安全計算的效能也在逐漸提升。我也看到一些方案可以在過去6個月內完成HE,MPC和ZKP的重大效能提升。計算出特定的資料或者模型值並提供給元模型是很困難的。清理和格式化擁擠的資料是具有挑戰性的。我們希望看到工具,標準化和小型企業能夠聯合解決這個問題。最後,建立這種系統的廣義構造的業務模型比建立一個單獨的例項更不明朗。這對於很多新的加密事物都是正確的,包括精選市場。

結論

私人機器學習和區塊鏈激勵的組合可以在廣泛不同的應用中創造最強的機器智慧。但是仍然有幾個非常嚴重的技術挑戰。他們的長期潛力是巨大的,並且會改變現有大型網際網路公司擁有資料的現狀。這其實也有點恐怖,因為這類系統可以存在,自我增強,消費私密資料,並且幾乎不可能被關閉,讓我在想是否創造他們會召喚個更加強大的摩洛克。不論如何,這是加密貨幣如何緩慢發展,然後突然進入任何行業的另一個案例。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;