DxChain:用區塊鏈驅動人工智慧

買賣虛擬貨幣

(去往卡哈斯孔的畫家,梵高)


人工智慧需要算力、演算法和資料。三者缺一不可。即使有頂尖高手有頂尖演算法,資料和算力也無法繞過。

對於大多數的公司來說,高質量的資料很難獲得。大多數的資料都集中在巨頭手中。資料是未來最核心的資源。巨頭們不會輕易把它們共享給中小公司。比如谷歌地圖擁有使用者導航資料、facebook擁有使用者畫像和行為資料、亞馬遜擁有使用者購物行為資料等,這些都是它們商業模式賴於存在的基礎,都是它們數十年的積累,只會加強它們的勢能。中小公司,只能望洋興嘆。

不僅如此,人工智慧還需要大量的算力和儲存,對於初創企業來說,這個開支也是非常大的。

在網際網路的時代,初創企業和專案在人工智慧領域確實看不到任何勝算的機會,要資料沒資料,要算力沒算力,要資金沒資金。但區塊鏈時代的到來,給中小企業開啟了一扇窗。這也是藍狐筆記非常關注區塊鏈和人工智慧結合專案的原因。

近期藍狐筆記關注到DxChain,它可以構建去中心化的資料交易市場,也可以提供去中心化的算力和儲存基礎服務。這對於人工智慧企業或希望用大資料分析來改善業務的企業來說,可以降低獲取資料、算力及儲存的成本,能夠獲得與大企業同臺競技的機會。

DxChain與人工智慧

對於創業公司或專案來說,要想獲得高質量資料,在目前的網際網路情境下,幾乎不可能。但區塊鏈給了一個機會。

區塊鏈首先可以讓資料迴歸個人所有。使用者掌控自己的資料,同時透過零知識證明、差別隱私、密碼學等方式實現使用者的隱私保護,免去了使用者貢獻資料的後顧之憂。同時,這些資料使用者透過售賣還能獲得收益,這也激勵使用者更主動分享和貢獻自己的高質量資料。

可以說,區塊鏈會帶來高質量資料的爆發。這是中小專案和公司的機會。

DxChain透過區塊鏈技術可以為資料需求的雙方搭建資料交易市場,讓對高質量資料有需求的企業可以以更低成本更高效地獲得資料,而使用者也無需擔心自己的隱私洩漏,還可以獲得價值回饋,這是一個雙贏。而在傳統的網際網路平臺,資料往往被大平臺所壟斷,使用者也無法獲得資料貢獻的獎勵。

除了資料,還需要算力和儲存。對於財力不雄厚的中小公司來說,這也是一個很高的門檻。有沒有可能降低算力和儲存成本,給中小企業一個可能的競爭機會?這是DxChain要解決的一個重要問題。

DxChain試圖透過區塊鏈技術讓算力和儲存共享成為現實。這會降低算力和儲存成本,讓大資料和機器學習等更專注於演算法的完善,模型的迭代,加速人工智慧的發展。

總言之,人工智慧和區塊鏈的結合是絕配。兩者都是科技的未來趨勢,兩者的結合,可以給彼此帶來更快的進化速度。區塊鏈有機會讓人工智慧加速。

DxChain試圖順應這個趨勢,透過區塊鏈給大資料分析和機器學習提供計算和儲存服務,也透過資料交易,幫助中小企業以更低成本更高效率獲得資料。這對於人工智慧的發展來說,會是如虎添翼。

DxChain的關鍵詞

1.為我所用

DxChain讓藍狐筆記印象深刻的一點是它善於利用“他人”之優點,構建出自己的區塊鏈技術,發展出自己的創新,最終服務於大資料分析和機器學習的發展。

這個說起來簡單,其實很難。首先要融會貫通,才能為我所用。DxChain架構借鑑了IPFS、HadoopHDFS、GFS、IoTeX、IOTA、Plasma、TrueBit、morpheo、Golem等,揚其長避其短,這個思路貫穿了它的整個架構設計之中。比如鏈上鍊的分層,也部分參考了IoTex的鏈中鏈設計,讓主鏈和側鏈擔負不同的任務。

又比如DxChain引入了Hadoop,在進行去中心化的設計後, 讓它成為DxChain的計算引擎,同時還有自己的共識創新,比如驗證博弈(verification game)和可證明資料計算(Provable Data Computation)。DxChain的時空證明(Proof of Spacetime)共識機制也是從“資料持有性證明”演化而而來,讓它更適合去中心化的網路。

2.鏈上鍊的架構

從架構上,DxChain採用了鏈上鍊的結構。它要在去中心化資料儲存的基礎之上,提供去中心化的大資料分析和機器學習計算,要求很高,為了達成這個目標,DxChain採用了鏈上鍊的結構來管理主鏈、儲存鏈以及計算側鏈。

透過這樣的架構設計,可以便於資訊、資料和資產的跨鏈操作,能夠滿足速度要求、並實現可擴充套件。

DxChain是兩層區塊鏈,包括鏈主鏈和側鏈。主鏈負責儲存賬本和資產資訊,包括狀態、交易、智慧合約等。它儲存較少資訊。側鏈承載資料儲存和計算任務。

DxChain主鏈使用基於賬戶的模型進行交易和資產資訊的儲存,包括賬戶狀態、跨賬戶交易和收據。它有常規賬戶和合約賬戶。DxChain相容以太坊的資料結構,由雜湊連結的區塊組成。資料儲存在網路全節點中。

資料側鏈(Data Side Chain)建立在P2P分散式檔案儲存系統上,儲存非資產類資訊。計算側鏈(Computing Side Chain)主要是為了完成計算任務,計算任務是基於真實業務需求的任務。計算單元可以讀取資料側鏈的資料,並把結果寫入資料側鏈。

當任務完成,最終的狀態會透過智慧合約儲存在主鏈上。中間狀態或任務級交易資訊儲存在側鏈中。資料側鏈和計算側鏈透過鏈上鍊微服務實現互操作,可以進行資料和訊息互通。側鏈則透過智慧合約跟主鏈進行溝通。

這樣,主鏈和側鏈執行不同任務,可以透過智慧合約或微服務實現通訊,同時還有各自的獨立性,還有一個好處是即使側鏈出問題,主鏈也不受影響。


鏈中鏈架構的設計有助於實現它為大資料和機器學習提供計算和儲存服務的目標,這跟比特幣主要用於實現金融交易的目的不同。設計側鏈架構的核心目的是為了高效、擴充套件性以及滿足具體的業務場景需求。

DxChain主鏈保持低成本,側鏈實現計算和資料儲存的高效,並透過智慧合約實現主鏈和側鏈溝通,最終形成一個整體的服務架構。因為要實現去中心化,儲存側鏈和計算側鏈都有自己的共識演算法。這在下面也會提到。

另外,透過把側鏈的有效交易寫入主鏈,可支援主鏈和側鏈之間的資產轉移,側鏈和主鏈使用相同token,側鏈也可以定義自己的token。

3.去中心化的算力服務

目前的人工智慧需要大量的算力來支援,但算力意味著大量的資金投入。透過中心化的方式來完成大規模的計算任務,先不說中小企業,就算是巨頭,也是有壓力的。

DxChain要為大資料和機器學習提供算力服務。它的方式透過去中心化的方式來解決這個問題。一是可以把空餘算力共享出來,二是算力也會因為基於特定任務而被高效利用。

DxChain的算力跟比特幣的算力不同,它不僅是為了網路安全,同時也解決實際業務需求。而DxChain不是要提供一種數字貨幣,而是提供一個去中心化的計算環境。

為了驗證計算的正確性,需要共識機制來確保。DxChain提出了兩個共識演算法。一是驗證博弈(Verification game),一是可證明資料計算(Provable Data Computation)。

驗證博弈用來驗證計算過程的正確性。可證明資料計算可以從一組不被信任的節點中找到一個小概率被攻擊的正確答案。

驗證博弈的核心角色是求解者、挑戰者以及法官。求解者是礦工,負責完成計算任務,提供解決方案。挑戰者則不同意求解者的解決方案。法官則提供正確的計算。

驗證博弈並不關心參與者的聲譽或系統中的任何受信方。它有一個懲罰機制,求解者和挑戰者執行任務都需要押金。任何犯錯的參與角色,都會失去押金。這樣會讓不受信任玩家被淘汰。

可證明資料計算中,一個計算任務透過網路進行廣播,N節點執行任務,生成同一答案的最先M個節點答案為有效答案。

DxChain還整合Hadoop實現去中心化的計算。Hadoop的核心元件是作業跟蹤器(job tracker)、任務跟蹤器(task tracker)、map-reduce中的工作節點。參考了Hadoop,DxChain設計了D-Jobtracker和D-Tasktracker的角色。在DxChain的去中心化系統中,角色需要押金,礦工誠實執行任務,可獲得報酬,否則失去押金。

Map-reduce是中心化的系統。它的作業跟蹤器負責管理叢集資源和任務排程。任務跟蹤器管理節點中的任務,同時跟作業跟蹤器通訊。而DxChain是去中心化的系統,在分散式網路中保持兩個節點的實時通訊很不容易。在DxChain中,不需要檢查任務節點的狀態,一個節點或幾個節點離線,不會對最終結果產生影響。而在Hadoop系統中,它會透過心跳來了解節點活躍度,如果節點出現問題,作業跟蹤器需要重新分配任務到新節點。

節點完成計算,作業跟蹤器將結果傳送到計算側鏈,驗證博弈或可證明資料計算會進行驗證。計算側鏈儲存工作分配資訊和結果。任何礦工節點都可以領取任務。

4.去中心化的資料儲存服務

DxChain提供了去中心化的計算環境,同時它也是去中心化的儲存網路。它把計算結果和計算中間狀態儲存為檔案。

資料側鏈會建立在p2p分散式儲存網路上,比如IPFS、Swarm等。資料側鏈是激勵層,它本身不用做資料儲存。資料和檔案被分成小塊,儲存進入p2p網路。

同時,小塊的元資訊和雜湊採用類似Merkle Patricia Tree結構儲存在側鏈中,表示檔案狀態。為了資料跨鏈互通,DxChain為檔案設計了跨鏈統一資源標示符。

在側鏈和P2P儲存網路之間,DxChain還有一個虛擬邏輯層,包括儲存任務釋出者、檔案匯入和匯出的礦工、驗證者。

因為是去中心化的方式,提供儲存的礦工需要有一個共識機制來進行激勵和確保網路安全。

DxChain儲存側鏈的共識機制是時空證明(Proof of Spacetime),用它來驗證儲存貢獻。資料側鏈管理儲存任務,連線到主鏈可以為儲存礦工給到獎勵,連線到計算側鏈可以儲存計算狀態。它具有交易費用低、交易速度快、更好隱私保護等特點。

時空證明改進了“資料持有性證明(Provable Data Possession)”,讓它更適合去中心化的環境。資料持有性證明主要是為了允許客戶在不可信伺服器上儲存資料,在不檢索資料的前提下,驗證伺服器是否儲存其原始資料。從客戶端持續傳送挑戰,驗證伺服器是否儲存某檔案,確保在一定的連續時間記憶體儲了某檔案。

時空證明則是適用於去中心化網路的,它透過演算法能夠預防女巫攻擊,確保系統的完備和安全。任何誠實的節點儲存了檔案,它能夠產生有效證明並說服驗證者,同時它也能阻止各種惡意攻擊行為。

時空證明共識也是可以公開驗證的。也為了保護隱私和防止其他惡意行為,時空證明還透過零知識證明等實現驗證,可以向驗證者證明自己,同時不揭示具體內容。

5.隱私保護

透過大資料的相關性分析可以識別出個人身份的資訊。DxChain對於隱私保護也重視。

DxChain透過如下幾個方面進行隱私保護。一是資料模型。DxChain支援結構化資料集的資料模型。客戶端可在提交到網路之前加密敏感資料的列。二是差分隱私。差分隱私可以降低一個使用者傾斜查詢結果的概率,也就是降低讓資訊可以追溯到某個使用者的概率。如果只是為統計分析提供資料,比如平均值,DxChain可以有工具方便使用者在提交檔案到網路之前執行差分隱私。

三是礦工儲存加密。每個本地節點使用儲存礦工的公鑰對資料塊進行加密。可以保護網路免遭入侵。四是把檔案進行切分。一個大檔案根據不同策略切分成小塊,只獲取其中一個部分不會洩漏整體資訊。最後是在檔案傳輸過程中加密。檔案複製到儲存礦工之前,使用礦工的公鑰加密。

當然,客戶希望資料被私密儲存,在提交到網路之前最好對資料進行加密。

6.AI的基礎設施

從以上的描述,我們可以看到DxChain是要成為大資料分析和機器學習的基礎設施。它支援不同行業,比如廣告、金融、遊戲、醫療、出行、能源、物流、供應鏈、教育等,這些行業都可以利用DxChain進行機器學習、資料探勘、資料儲存,在它基礎上開發出各種不同的去中心化應用。

對於AI的發展來說,DxChain如能落地,它就是一個基礎設施。對中小企業和專案尤其重要。很多中小公司缺乏高質量的資料。大多數高質量的資料都需要從其他大型公司購買,甚至花錢也無法獲得。

從資料共享和交換的角度,DxChain的資料模型對資料進行標準化,資料供應商可以開放API,實現資料的交易和共享。這對於有高質量資料需求的需求方來說,有很大的吸引力,尤其是人工智慧廠商。

DxChain也是一個資料交易平臺。使用者可以定義交易哪些資料,以及交易的價格等。這會讓資料需求方和供應方都收益。

不僅如此,計算和儲存的成本也很高。DxChain透過構建去中心化的大資料和機器學習網路,可以讓人工智慧廠商降低成本,可以利用DxChain建立自己的機器學習平臺和應用。它的資料儲存在儲存礦工的磁碟上,礦工共享頻寬,可以降低資料儲存和網路流量成本。

比如醫療保健行業,透過智慧裝置可以為使用者提供遠端的診斷,讓更多人受益。但這樣的系統依然很貴,醫療保險費用不低,很多低收入人群無法獲益;醫療智慧裝置碎片化,很難整合;使用者的資料很容易被濫用。

這個時候,DxChain有機會發揮自身的優勢。它本身是一個去中心化的大資料和機器學習網路。醫療行業的開發者可以利用它來構建自己的大資料和機器學習平臺和應用。

因為DxChain去中心化的方式,可以更高效利用計算和儲存資源,會降低自建人工智慧平臺的成本,也會帶來醫療費用的降低,讓更多人能夠獲益。醫療智慧裝置,比如身體狀況追蹤器、智慧手錶等上傳的資料會被加密,會安全儲存到區塊鏈上,不會被洩漏和濫用。這些資料的使用,要得到使用者的授權,如果使用者願意售賣自己的資料,還能獲得經濟收益。

最後,基於醫療裝置採集的資料,可以讓醫療保健供應商建立自己的人工智慧技術監測病人健康,提前作出預警。

總的來說,基於DxChain,各行業都可以構建自己的大資料和機器學習平臺和應用,可以極大降低人工智慧發展的成本,可以幫助不同行業的開發者以更低成本獲取更多高質量資料,同時還能以更低成本獲得算力和儲存。這對於促進人工智慧發展有很大的幫助。

結語

人工智慧的發展離不開資料的餵養,離不開算力和儲存,演算法再牛,也需要這些基礎設施的支援。

在區塊鏈之前,這些大多是巨頭們的領地。但隨著區塊鏈的到來,人們貢獻資料和獲取資料的方式會發生改變。使用者在保護個人隱私的情況下,可以把自己高質量資料售賣給資料的需求方,比如人工智慧廠商、廣告商等。而中小人工智慧廠商也有機會以更低成本獲得高質量的資料。這是破解傳統網際網路時代資料壟斷的最佳方式。

不僅如此,區塊鏈還帶來去中心化的算力和儲存共享服務,可以透過激勵算力和儲存礦工貢獻自己的服務,從而降低成本。這讓中小人工智慧企業,各個行業也有了以較低成本構建自己的大資料和機器學習平臺和應用的機會。

DxChain正是希望透過區塊鏈技術,融合其他專案的優點,設計出一種可以用於大資料和機器學習的架構,實現更高效率更安全可擴充套件的人工智慧基礎設施服務。

在這設計中,它提出了鏈上鍊的設計,有一個主鏈和兩個側鏈;設計了驗證博弈和可驗證計算的共識機制;把Hadoop整合到DxChain,方便大資料和機器學習等。這些設計都是從大資料和機器學習業務需求角度出發的。它的區塊鏈的不僅有去中心化的考慮,也有落地場景需求的考慮。

如DxChain能夠順利落地,對於希望用人工智慧進行最佳化和提升的行業來說,會是一個很大的利好,期待DxChain的早日落地!


------

風險警示:藍狐所有文章都不構成投資推薦,投資有風險,建議對專案進行深入考察,慎重做好自己的投資決策。


想要深入瞭解區塊鏈,長按下面二維碼關注“藍狐筆記”區塊鏈公眾號:lanhubiji 或加入知識星球:https://t.zsxq.com/iaQNnIq


免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;