政府大資料治理與區塊鏈技術應用探析

買賣虛擬貨幣
■ 中國科學院計算技術研究所範靈俊洪學海隨著網際網路和資訊科技的不斷髮展,人類已經進入大資料時代。資料已成為一個國家基礎型的戰略資源。在資訊化浪潮的不斷推動下,政府部門多年來積累了越來越多的與民生、經濟息息相關的資料,如醫療、交通、社保等,一般稱為“政府大資料”。與網際網路上產生的大資料低價值密度不同,政府大資料具有高價值密度的特點。如何更好地開放、共享,並利用和挖掘政府大資料的價值,是當今研究的熱點問題。在這樣的背景下,對於掌握了大量資料的政府部門,無異於掌握了大量的資源或資產。然而政府大資料的價值是潛在的,只有結合一定的應用需求和應用場景,由合適的物件用適當的方法加以開發和利用,才能發揮出來,否則就只能是一筆“沉睡”的資產。因此,政府部門如何盤活和管理這筆資料資產就顯得尤為重要,政府大資料治理就是要解決這一問題。政府大資料治理的關鍵政府大資料治理的目標是發揮出政府大資料的潛在價值。即實現多個部門資料的共享、開放和市場化利用。簡單來講就是,政府大資料治理的結果能更好地保證有需求的物件在需要的時間獲得合適的資料並在正確的場景下合理地使用。有需求的物件,是指具備創新能力和技術實力的部門、初創企業甚至個人;在需要的時間,是指有應用需求而資料恰好也能發揮作用的時候,例如具備一定時效性的資料;而所謂合適的資料,理論上可以是政府部門掌握的任何資料;正確的場景,是指對資料的開發應用應利國利民惠經濟;合理地使用,是不能違反相關法律法規。以上是在理想的情況下發生的,實際情況卻是,政府部門常常面臨三個方面的難題。一是安全擔憂,擔心部門的資料隱含了國家機密造成洩露,導致不敢共享和開放;二是資料本身是部門的命脈,資料被拿走意味著核心業務將丟失,而不願共享和開放;三是資料涉及市民隱私,沒有好的技術手段和能力,不知如何共享和開放。這三個方面的問題都限制了政府大資料的開發和利用。如果把政府大資料作為一個物件,要讓資料真正“活”起來,從一大堆雜亂無章的原始資料,變成面向市民或使用者的產品及服務,本質上來講,就是加強了資料的流通,以及增多了對資料的各種操作。這些操作包括,訪問、下載、修改、更新、複製及轉移、融合、清洗、分析、視覺化等等。為了保證政府多個部門、多個系統,來源廣泛、種類繁多的資料能夠更好地從採集、收集到變成產品或服務,需要政府部門建立一個有效的資料治理機制,治理機制涉及的問題包括,有多少個環節?誰來參與?由誰授權資料的這些操作?誰可以被允許對資料進行這些操作?誰對操作的結果負責?誰來監督?等等。這些問題貫穿整個政府大資料的全生命週期。
因此,政府大資料治理機制的建立,一方面,需要出臺相應的政策和行政管理手段予以配合;另一方面,政府大資料的開發利用亟需一種足夠安全、可靠的技術來保障資料資源、資產的共享、開放、流通和保護。區塊鏈技術應用於政府大資料治理是一種去中心化的分散式賬本技術,整個賬本由資料區塊連結形成,由所有參與者共同維護,每個參與者都存有一份複製,單個參與者對資料的修改不起作用。非對稱加密技術確保了資料不可篡改。圍繞某項資產,每一筆交易或者操作生成一個新區塊,所有的參與者或見證人由約定的規則達成共識,進行新增上鍊,從而來記錄和追溯整個過程。由以上特點不難看出,區塊鏈技術適合應用於去中心化的、多方參與、共同維護以增強信任的應用場景。政府大資料治理是一個需要多方參與的過程。涉及資料的產生者、採集者、管理者、使用者等等。政府大資料的開發利用恰是一個多元主體、多方參與、許可權不一、環節眾多的應用場景。區塊鏈的技術特點可以在諸多方面發揮作用,應用到政府大資料的治理中來。如圖1所示。

首先,區塊鏈具有可追溯性和不可篡改性,資料塊一旦生成就表示得到過所有參與者的認同,無法篡改,且帶有時間戳。這個好處應用到政府大資料治理當中可以幫助資料確權(包括原始來源、管理權、訪問權、使用權等),促進資料流通,準確記錄資料的產生、交換、轉移、更新、開發利用整個過程。把資料作為核心命脈,擔心資料因為共享或開放出去之後核心業務就丟失的部門可以因此而消除顧慮。

其次,在區塊鏈上,資料包的雜湊值是唯一的,能驗證資料包的真實性。雜湊加密演算法對資料可能涉密或隱私部分進行加密,能在流通環節將資料進行一定程度的脫敏。同時,在涉及資料各方之間採用非對稱加密技術,可以更好地劃分角色,更加精細化對資料的操作許可權,保障資料隱私安全。從而降低政府部門對資料的安全隱私擔憂。

再次,應用區塊鏈技術,每個區塊的生成都得到了所有參與者的共識,在區塊鏈上,資料交換記錄是所有參與者認可的、透明的、可追溯的,資料的來源和流通路徑是可以被記錄和追溯,對資料的每一次更新和修改都“有跡可循”,同時,採用雜湊演算法可以對資料的完整性進行驗證,從而保障和提升了資料在流通中的質量。

最後,應用基於區塊鏈的智慧合約技術,可以自動管理和執行政府部門之間約定好的資料共享開放利用規則,在實際操作過程中減少人為的干預,營造可信任的資料共享開放環境。

技術實現與應用侷限性探討

區塊鏈技術應用於政府大資料治理,可以將資料所有權、資料傳播過程、交易鏈條等相關資訊完整全面地記錄在分佈的資料塊中,並在所有參與方之間達成共識,共同維護。本節我們舉例探討在實際操作層面,區塊鏈應用於政府大資料治理在技術實現上有哪些需要考慮的問題,以及可能存在哪些侷限。區塊鏈技術應用於政府大資料治理,從實操層面,有以下幾個環節是必不可少的。

1.建鏈。區塊鏈根據開放程度不同,可分為公有鏈、聯盟鏈和私有鏈。公有鏈對所有人開放,任何人都可以參與;聯盟鏈對特定的一些組織開放,私有鏈只對某個組織或個人開放。根據政府大資料的開放程度不同,可以採用不同的區塊鏈。例如,對於國家級或省市級建的基礎大資料中心,可以採用公有鏈,全民所有,全民共享;對於地方政府部門之間共享資料,可以採用聯盟鏈;而針對某個部門某種資料的管理,可以採用私有鏈。基本規則:每一類資料建一條鏈。資料區塊記錄資料來源、所有權,資料操作方,當前的時間戳,對資料的操作型別,當前版本號,上一區塊的雜湊值等等。對資料的任何操作(更新、複製、下載等)→觸發生成一個區塊→接入區塊鏈。對資料進行全生命週期記錄。

2.共識機制的設計。共識機制的基本要求是多方參與、各司其責、各得其所,從而能夠對資料的全生命週期進行管理和監督。一個好的共識機制還需要帶有激勵機制,以激勵各方積極參與到管理資料的活動中來。例如,誰獲得了記錄權,誰就贏得積分,請求使用資料則消耗積分。同樣,作為資料提供方,分享出的資料如被請求和使用了,可獲得積分獎勵。至於誰可以加入鏈,公有鏈不存在這個問題,私有鏈由中心節點批准,對於聯盟鏈,可以集體批准接入,或者達到一定比例者同意即可;所有加入的鏈都可以自由退出。

3.基於智慧合約的許可權管理和交易規則。基於智慧合約,資料許可權管理和交易規則可透過鏈上編碼實現,在交易過程中自動執行,不需要人為干涉,實時線上地保證資料操作的合法、合理、合規性。例如:在多個部門共享資料模型中,每個部門都透過共享出自己的資料(資料型別、資料量、更新頻率等)獲得積分(具體積分機制需要商定),我們可以簡單地定義為,積分更高就能有更高的許可權請求和使用其他部門的資料,許可權值達到了,請求操作的資料區塊便可自動生成,協議生效,不需要人工干預,從而提升了效率。如圖2所示。

應用侷限性探討。由於政府部門較多,資訊化程度不一,導致資料型別多樣、標準各異,因此,需要建立的區塊鏈也必然數量繁多、多種多樣,從而針對區塊鏈本身的治理也將會是問題。同時,由於區塊鏈上的資料所有參與方都要存一份複製,而某些型別的政府資料量太大,沒有辦法完全生成區塊上鍊,例如影片監控資料。這種情況下,從傳輸效率和節省儲存空間消耗的角度出發,區塊鏈技術只應用到治理機制層面,對政府大資料的治理起到一定的輔助作用。我們可以把這種模式稱為“基於區塊鏈的輕治理機制”。而把所有資料都放到區塊鏈上的模式稱為“基於區塊鏈的強治理機制”。

結束語

在當今大資料時代,政府大資料是一筆寶貴的資產,政府大資料治理的目的就是要盤活這筆資產,挖掘和利用資料的潛在價值,取得社會化利用。政府大資料治理是一項涉及政策、管理、技術,甚至法律、制度的系統工程。政府部門在推動資料共享、開放、市場化利用的過程中面臨不敢共享開放、不願共享開放、不知如何共享開放等諸多難題。破解這些難題需要一種足夠安全、可靠、靈活的技術來支撐。

是一種去中心化、分散式的賬本技術,具有去信任、不可篡改、可追溯等優點,非常適合應用於多元主體參與、多個流程和環節的治理過程,能夠在政府大資料治理過程中重塑機制、改造流程、增強信任、提高效率等。本文探討了區塊鏈技術應用於政府大資料治理的多個方面的優勢,以及初探了技術實現上的可能性和侷限性。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;