華大區塊鏈BaaS平臺數字化生命的價值交換

買賣虛擬貨幣

本文的核心章節,我們將從業務目標、技術架構、優勢特色及應用場景四個方面重點介紹華大區塊鏈。

1. 華大區塊鏈的業務目標

華大區塊鏈的目標是透過融合區塊鏈和密碼學等技術,打造具有自主核心技術的組學資料共享基礎設施,促進數字化生命的價值流動。在保護個人隱私的同時,最大化資料的應用價值。包括兩方面的內容:

(1) 從個人層面而言,實現人人、實時、終身的生命 4D 資料隱私保護,為個人資料確權;透過積分激勵將資料價值還於個人,同時促進科研及產業應用;

(2) 從組織層面而言,為行業夥伴提供企業級的區塊鏈基礎設施與解決方案,形成組學資料與其他健康醫療大資料的共享互動生態體系,最終實現個人(資料所有者)、機構(科研、醫療等)、政府、企業在生命時代共有、共享、共為的多方協作和互惠共贏體系。

1.1 華大區塊鏈技術展望

按照涉及到的技術點與提供的服務方式不同,區塊鏈的技術架構主要分BaaS、PaaS 和 IaaS 三個層次)。

在社會資源有限的約束下,傳統網際網路以資訊傳遞效率優先,中心化架構的IT 服務大大降低了單使用者的資訊溝通成本。然而,隨著 IT 技術的發展和成本下降,使用者的關注點將逐漸從效率轉為質量,即關注隱私保護、規則透明平等。由於區塊鏈本身的系統成本高,尤其適合於健康醫療領域這樣的高價值行業應用。在華大區塊鏈建設初期,我們以 PaaS 平臺為使用者提供服務,使用者可以自主在平臺上實現資料的安全共享。將來隨著雲端計算、雲端儲存等技術的不斷深化成熟,華大區塊鏈將構建自有的開源 BaaS 服務架構,以開源區塊鏈的形式在健康醫療行業形成規模化應用。

區塊鏈技術仍處在早期,目前主要面臨以下幾點問題:

(1) 多節點共識帶來了高信任度,但分散式系統的共識效率效能在企業級的應用有待進一步提升;
(2) 多節點記錄儲存提高了資料透明度,但對資料安全加密和隱私保護提出更高要求,同時還要保證可用性和監管性;
(3) 智慧合約定義了自動執行的邏輯規則,其安全問題有待更加成熟的驗證和解決方案;
(4) 區塊鏈技術各成一派,需要跨鏈技術的進步來增強鏈與鏈之間的互操作性。

華大區塊鏈將透過架構最佳化、技術升級等方式,並和區塊鏈技術生態圈的開發者、標準制定者交流合作,不斷提升區塊鏈適用範圍與應用價值。同時,華大區塊鏈也將重點關注以下特色技術點的突破:

(1) 基因數字 ID:透過個人基因 ID 技術,解決現有區塊鏈技術中的數字身份無法安全關聯個人實體身份,規避網路應用中的數字權利與現實社會中實體權利難以合法關聯的問題;
(2) 後量子加密:解決現有區塊鏈產品的非對稱加密體制無法防止將來量子計算的破解問題;
(3) 安全多方計算:透過提供安全多方計算解決方案,實現多方資料所有者在不透露資料細節的前提下進行資料協同計算;
(4) 匿名應用:節點可匿名提供暫時資料給區塊鏈上的第三方應用進行處理,透過瞬時加密機制確保使用者隱私;
(5) 亂序儲存:節點可以對資料亂序加擾後分布儲存到多個其他節點(包括雲平臺),資料所有者是恢復原始資料所必須的亂序引索(Index)的唯一擁有者。

1.2 華大區塊鏈用來解決什麼問題

華大區塊鏈用來解決健康醫療及生命大資料應用的三類矛盾:

(1) 資料應用與隱私保護的矛盾
(2) 資料確權與互動共享的矛盾
(3) 資料安全與加密成本的矛盾

1.3 設計原則

華大區塊鏈在設計上遵循以下幾個原則:

(1) 2B4D 大資料:作為全球跨組學資料生產的引領機構,華大創新性地提出了大人群生命組學大資料(2B4D)的概念。2B4D 資料所具有的的人群覆蓋度廣、資料量大、敏感性高、完整性需求強等特點對區塊鏈的架構與效能提出了極高的要求。因此,從區塊鏈協議、資料結構和功能特性等方面滿足 2B4D 大資料的互動共享是華大區塊鏈的第一設計原則。

(2) 自主創新:華大注重自主創新,目前已在碎片分散式資料儲存、基因ID 等關鍵領域擁有多項自主智慧財產權的核心技術與專利,並透過融合差分隱私、非對稱數字簽名等技術,實現個人生命大資料的可靠儲存與安全共享。

(3) 標準化:華大區塊鏈透過搭建區塊鏈行業應用的標準化體系,實現資料的安全互動與高效共享。包括區塊鏈底層架構標準化與資料共享互動標準化兩個層次:安全高效:華大區塊鏈在協議設計、架構規劃、介面設定、服務部署等方面都遵循這一原則,確保區塊鏈系統執行的可靠與高效。開放共享: 華大區塊鏈構建自主可控的 BaaS 區塊鏈平臺,發揮運營國家基因庫的經驗優勢,搭建 IT 基礎設施,開放區塊鏈服務能力,與行業夥伴共同打造合作共贏生態圈。

2. 華大區塊鏈技術架構

華大區塊鏈在基於 BaaS、PaaS、IaaS 分層基礎上,結合生命健康行業資料應用場景,針對共識演算法和密碼學演算法兩個核心技術點進行最佳化,有效提升系統安全性和業務處理效率。

2.1 共識機制

華大區塊鏈使用的共識演算法基於 PBFT 基礎上做了調整最佳化,可以稱為“PBFT+”共識演算法,其核心思想就是針對不同的交易型別實行不同的共識機制。我們把需要上鍊儲存的交易型別分為兩大類:事務性交易和非事務性交易。針對不同型別的區塊鏈交易採用不同的共識演算法。所謂事務性交易是指需要進行嚴格排序和所有節點達成共識的區塊鏈交易,維持同樣的狀態變更,因此需要使用嚴格的共識演算法確保其執行狀態在區塊鏈上保持一致;事務性交易之外的其他交易都稱為非事務性交易。

針對事務性交易,華大區塊鏈採用 PBFT 演算法,具體演算法流程圖如下所示。

其中 C 為傳送共識請求的客戶端節點,0123 為接受並處理共識請求的服務端節點,3 為故障的服務端節點,共識步驟如下:

(1) Request: C 傳送請求到任意一個服務端節點,這裡是 0;
(2) Pre-Prepare:節點 0 收到 C 的請求後廣播至節點 123;
(3) Prepare:節點 123 收到後記錄請求,然後再次廣播至所有其他節點,1->023,2->013,3->012;
(4) Commit:0123 節點在 Prepare 階段,若收到超過一定數量的相同請求,則進入 Commit 階段,廣播 Commit 請求;
(5) Reply:0123 節點在 Commit 階段,若收到超過一定數量的相同請求,則對 C 進行反饋。

能夠達成共識的計算公式為 N ≥ 3F + 1, N 為參與共識的服務端節點總數,F 為有問題的服務端節點總數。

針對非事務性交易,我們採用簡單的排序驗證,即傳送交易到任一個共識節點上進行交易合法性驗證,確認是非事務性交易型別後,透過 Kafka 協議在多個共識節點之間進行統一排序,然後將排序結果廣播至鏈上所有節點。

2.2 密碼學演算法

第一章提到的 HASH 摘要、非對稱加密等演算法在傳統計算機環境中是安全的,在實現 128 位安全級別的情況下可以滿足當前區塊鏈應用的加解密速度和儲存空間要求。但是考慮到當前量子計算技術的高速發展,目前已知的量子計算Shor 演算法已經能夠在較短時間內破解一些常用的傳統加解密演算法。

由上述模 n 位數和安全等級 b 的關係可知,量子計算環境下,傳統的 RSA加密體制在現有的模 n 位數下已經無法保證安全性,如果要在量子計算環境下實現和傳統計算機環境下同等安全性,則需要大為增加 n 值,這意味著公私鑰的長度和加解密速度都急劇增長,這就導致加解密演算法失去了應用價值。實際上,基於量子計算環境的 Shor 演算法,傳統的 RSA、ECDSA 演算法都不再安全。

另一方面,後量子密碼學時代,已經有許多研究證明了量子計算技術的發展並不意味著所有密碼學演算法都不再安全,目前已知的抗量子演算法有基於 HASH 函式的密碼演算法、基於糾錯碼的密碼演算法、多變數二次方程組的密碼演算法和基於格理論的密碼演算法。我們在區塊鏈應用中綜合考慮演算法穩定性、加解密效能和未來相容性,選擇了格密碼演算法來進行數字簽名,確保區塊鏈交易安全性。

同時,華大鏈支援中國官方制定的 SM2、SM3 演算法,SM2 是國家密碼管理局於 2010 年 12 月 17 日釋出的橢圓曲線公鑰密碼演算法,SM3 密碼摘要演算法是國家密碼管理局 2010 年公佈的中國商用密碼雜湊演算法標準。SM3 演算法適用於商用密碼應用中的數字簽名和驗證,是在 SHA-256 基礎上改進實現的一種演算法。華大鏈基於 SM2\SM3 密碼演算法的全面相容性可以更好的滿足國內不同行業的資訊保安准入要求。

2.3 基因數字 ID

在公有區塊鏈應用中,使用者所使用的線上數字身份一般都沒有和實體身份對應起來,這樣純粹的虛擬數字身份不具有生物實體的可追溯性,導致線上數字身份的權利義務無法和現實世界中的個人權利義務對應起來,一個典型的問題是比特幣使用者因為丟失地址私鑰後沒有任何挽救途徑可以找回線上資產。因此,我們認為區塊鏈的應用中需要提供能夠同時對應線上數字身份和線下實體身份的技術解決方案。

華大利用自身在基因測序方面的優勢,開發出一套基於個人基因序列多型性的新型加密方式。基因序列對應個人的唯一身份,具有最高特異性。同時,基因序列可以產生大量的公私鑰對,可實現一次一密的動態加密機制,充分保證了身份認證安全。目前,我們撰寫的國家級專利《一種基於個人全基因組資料的數字身份生成方法》正在受理。未來,基因數字 ID 技術將作為華大區塊鏈的核心元件,確保每一次資料互動都安全可靠。

目前線下實體身份通常採用個人臉部識別技術作為身份驗證方式(銀行系統基於身份證的身份鑑別),但同時基於臉部特徵識別技術也存在較多問題,例如臉部生物特徵唯一性無法保證 100%不重複(雙胞胎撞臉等)、可複製性較高(整容易容)、人工或機器的臉部識別準確率都無法達到 100%。

我們結合基因技術為區塊鏈的身份鑑別提供高可靠性、高精度的基因 ID 數字身份解決方案。在個人基因組中,存在多個短串聯重複序列(short tandem repeat, STR),STR 是核心序列為 2-6 個鹼基的短串聯重複結構,其中每個 STR 中重複序列的重複次數範圍在 2-100 之間,對於任何特定個體的全基因組資料,染色體上某個特定位置的 STR 中重複序列的重複次數是固定的,但在不同的個體在相同 STR 的重複序列的重複次數可能不同,這就構成了人群中這些 STR 重複序列的多型性。由於人類基因組中 STR 非常多,透過對這種多型性的檢測,就可以明確區分個體與個體的不同。

個人基因數字 ID 庫的應用,可以實現區塊鏈上的每次交易使用不同 ID,這樣可以有效保護使用者的交易隱私,同時,結合第三方應用,可以對 ID 採取合法性驗證,提供匿名資料服務,應用框架如下圖所示。

2.4 碎片分散式儲存

傳統的雲端儲存模式中,使用者把完整的資料資訊存放到雲端資料中心,這種中心化的雲端儲存模式相對高效和低成本而廣為流行,但在安全性和隱私洩漏等方面存在風險。我們認為,基於區塊鏈的隱私資料保護需要採取一種全新的分散式雲端儲存方案,這裡稱為碎片分散式儲存,基本思想是將使用者的某一完整的隱私資料進行分片操作,然後將不同碎片進行加密擾序後,儲存到不同的網路節點上。使用者本地保留恢復原始資料所必須的碎片重組索引檔案。

碎片化分散式儲存可以把資料分佈到多個網路節點,各網路節點基於區塊鏈智慧合約來提供資料儲存服務,在合約有效期內需要定期證明它們能繼續提供儲存服務的能力。使用者需要訪問資料或者授權他人獲取資料時,需要將訪問憑證訊息進行數字簽名後上鏈儲存,對應網路節點獲取到該授權憑證後才提供資料訪問服務。這些憑證在區塊鏈上是公開、透明、可審計的,網路節點自動保證儲存合約的一致性。

這種去中心化的碎片化分散式儲存方案和區塊鏈技術的結合,可以有效保護使用者的資料隱私。資料被分割成小塊,經過加密擾序後才會分散儲存在眾多節點上,能夠避免中心化儲存的集中式風險,即使某一塊資料被洩露,也只是部分而非全部資料。另外,每個資料分片都有多個備份節點,一旦出現某個儲存空間提供者長期離線的情況,客戶會自動將切片備份到新的提供者中,避免了中心化儲存因網路或者物理等原因導致資料丟失的風險。結合上一節提到的基因 ID 技術,我們示意了一種基於個人基因組資料的碎片分散式儲存方式,將有效保證個人身份的最大特異性與資料的最高安全性。

2.5 安全多方計算

資料流通安全一直是大資料時代難以解決的難題。如何在保護本地資料隱私安全的情況下,促進不同地區、不同機構間的資料共享與協同計算,正引起研究者們的廣泛關注。

安全多方計算(SMC)最初由圖靈獎得主姚期智院士在 1982 年針對“百萬富翁問題”提出,是一種在無可信第三方的條件下,多方之間在互不公開資料的前提下實現協同計算的技術。兩方計算框架主要實現原理是基於混淆電路(GC,Garbled Circuit)和不經意傳輸協議(OT,Oblivious Transfer)的密碼學技術,將計算邏輯轉化為布林電路,並加密傳輸電路及標籤資料,最後各方解密獲取計算結果。30 年來,也陸續出現了基於秘密分享協議的多方安全計算框架,如 GMW、SPDZ。目前,安全多方計算技術的進步已使其在金融、徵信等領域展開應用,但大規模普及商用仍面臨特定計算場景的效能瓶頸和可擴充套件性等問題。

華大透過搭建安全多方計算平臺,允許擁有基因資料的各機構在不洩漏原始資料的情況下完成協同計算,將極大促進跨機構開展大人群大佇列的組學資料聯合研究,也可用於大型基因資料庫的安全查詢。同時,我們將與區塊鏈技術進行結合,制定一個標準化的組學資料共享協議,將每一次計算與互動的日誌進行區塊鏈存證,確保計算過程的公開透明,實現多方共贏。

安全多方計算和區塊鏈的應用框架如下圖所示,使用者資料儲存在不同網路節點中,發起計算流程後,透過區塊鏈憑證實現資料的授權。各節點在區塊鏈上接收到授權憑證並確認有效後,由安全多方計算節點進行聯合計算。

2.6 BaaS 介面

為了更好的支援上層業務對區塊鏈模組的整合應用,我們在華大區塊鏈設計之初就明確以 BaaS 為建設目標,透過豐富的 API 介面為上層業務及產品提供靈活方便的功能整合、運維部署服務(圖 3-2-6)。提供的 BaaS 服務介面包括:

(1) 節點許可權認證控制:基於聯盟鏈的應用場景,各個節點的鏈上許可權及角色配置都可以透過運維軟體的 WEB 介面進行配置。每個節點的模組ID、IP 地址、角色資訊(Order 節點、Peer 節點、Endorse 節點等)、組織資訊及鏈通道資訊都嚴格對應,防止越權訪問。

(2) 共識演算法可插拔: 預設情況下支援“PBFT+”共識演算法,同時支援透過API 介面呼叫包括 PBFT、PAXOS 等其他共識演算法,實現共識演算法的靈活配置。目前華大區塊鏈已實現單節點的平均共識效能在 2000TPS 以上,單節點的平均交易效能在 500TPS 以上。

(3) 加密演算法自定義配置:可以透過 API 介面配置選擇不同的數字簽名演算法 ( ECDSA\SM2\ 後 量 子 籤 名 算 法 ) 、 HASH 摘 要 算 法(SHA256\SHA384\SM3)。

(4) 一鍵式運維部署: 我們提供基於 WEB 介面的運維軟體實現區塊鏈部署的節點配置,包括節點 IP、節點 ID、節點資料庫配置、共識演算法及加密演算法配置,運維軟體根據配置資訊自動生成部署指令碼,然後執行指令碼即可啟動區塊鏈服務; 此外,運維軟體還提供區塊鏈節點資訊查詢、區塊資訊查詢功能。

(5) 智慧合約動態生成:基於已開展的應用場景,我們提供線上生成智慧合約功能。透過運維軟體的 WEB 介面輸入交易條件和引數(例如交易價格、交易物件、生效時間、例外條件)後,即可自動生成基於 Go 語言的智慧合約程式碼。

3. 華大區塊鏈優勢特色

華大區塊鏈在開發與應用過程中,始終從隱私保護、安全共享、價值互動三方面關注區塊鏈系統架構的搭建與最佳化,適用於行業內眾多應用場景,滿足企業級需求,提供安全高效的開放服務平臺。

3.1 隱私保護

華大區塊鏈參照 GDPR 和國標 GBT 35273-2017 對個人資料的規定,為資料主體確權,實現個人資料的細顆粒度授權控制,確保所有資料交換都如實、不可篡改地記錄在區塊鏈上,防止隱私洩露。

(1) 支援對資料資訊進行多重加密簽名後的鏈上儲存;
(2) 支援憑證撤回功能;
(3) 支援碎片分散式儲存與簽名驗證。

3.2 安全共享

華大區塊鏈旨在構建組學資料的共享生態體系,確保資料共享全程可監管,並透過制定資料互動的協議規則,促進資料流通,建立行業標準。

(1) 支援安全多方計算平臺;
(2) 支援在雲端進行密文分析,實現資料零接觸應用;
(3) 支援基於基因數字 ID 的獨特生物特徵身份認證系統。

3.3 價值互動

華大區塊鏈的終極目標是透過個人組學資料的價值互動促進“健康長壽”的人類終極追求實現。基於華大區塊鏈底層架構開發的健康積分激勵系統,個人不僅可以授權資料使用掙取積分報酬,也可透過達成健康提升目標(如每日步數達到 10000、體脂率降低至 15%、主動上傳每日健康飲食情況等)掙取。所有互動日誌都登記在區塊鏈上,積分可用於消費健康促進服務(精準運動、精準營養,健康諮詢)等。

(1) 相容不同機構的資料庫與 APP 端介面;
(2) 從資料生產到應用的全貫穿,促進資料價值流動;
(3) 支援積分任務、社群互動等功能,提升使用者體驗。

4 華大區塊鏈應用場景

全球範圍內,區塊鏈正加速從數字貨幣領域演進為與各類實體經濟應用場景進行創新融合。自 2018 年開始佈局區塊鏈以來,華大積極探索基於“區塊鏈+”的應用場景構建,目前已上線和正在部署包括個人資料確權與價值互動、罕見病公益、HPV 保障計劃、區塊鏈與深度學習結合、農產品防偽溯源等方面的應用。未來我們將結合技術進步,不斷豐富和完善應用場景。

4.1 區塊鏈+跨組學資料:個人生命資料的價值流動

華大從 2015 年推出了國產自主可控的測序儀,核心工具的突破,使得高效低成本的基因技術應用於大人群的疾病防控成為可能。從政府主導的民生實事切入,將基因技術惠及民生的同時,彙集寶貴的大人群大樣本資源,必將形成“大資料驅動”的引領性大科學突破,催生新型的大健康產業。華大已在深圳、長沙、阜陽等城市開展全市範圍的孕婦無創產前檢測等民生專案,目前華大累計完成超過三百萬例的孕婦基因檢測。將來將擴充套件到更多省市,同時也將升級測序資料量,增加疾病防控種類。面對如此海量的基因資料,如何在確保資料安全和隱私保護的前提下進行大資料的挖掘利用,為大人群提供全方位全週期的服務,是華大面臨的核心要務。

此外,華大已經用測序、質譜和影像等技術方法對數千名員工進行了連續三年的貫穿組學監測、研究,初步證明了跨組學“4D 大資料”模式是解讀、監測健康與疾病狀態的最佳途徑。華大區塊鏈從自身實踐做起,為員工搭建了一套基於區塊鏈的跨組學資料安全共享系統,支撐個人生命資料的價值實現。這是華大區塊鏈的首個應用場景,後續也將推廣、升級到華大對外與政府、醫院在跨組學資料的科研、臨床和產業應用等方面的合作。

以下介紹華大區塊鏈在跨組學資料的應用場景:

(1) 透過生命組學工具(測序儀、質譜儀、影像裝置、可穿戴裝置等)收集全方位全週期的生命大資料,形成人人、實時、終身的生命健康檔案,形成數字化生命;
(2) 所有資料將加密處理,於國家基因庫進行統一儲存,確保資料硬體安全、物理安全和訪問安全;
(3) 使用者可透過前端 APP 授權個人資料被內部科研團隊、合作醫院、健康管理團隊等使用,所有的使用日誌將以區塊鍊形式記錄,使用者可實時查詢、授權個人資料使用情況,實現使用者對個人資料的控制權,將資料價值還於個人;
(4) 對於授權資料使用或主動提供組學資料的使用者,華大以健康積分作為激勵;健康積分可用於各類健康促進服務(精準運動、精準營養等),實現個人生命資料價值的正向反饋。

基於區塊鏈技術的資料互動模式現已應用於對內的跨組學資料員工健康計劃以及對外的腫瘤關愛計劃,已實現近萬人的組學資料安全共享與價值實現。隨著華大業務覆蓋更多人群,該模式將重構個人組學資料的生產互動模式,真正實現“我的資料我掌控、我的健康我做主”。

4.2 區塊鏈+註冊申報:醫療器械申報全流程管理

華大智造是華大基因集團旗下定位於生產國產自主可控的生命數字化工具生產商。臨床註冊審批是國家食品藥品監督管理總局(CFDA)准予醫療器械與藥品入市許可的必要步驟。在傳統申報流程下,由於需要提交的材料較多,易出現報送資訊不全、不準、不真。此外,由於審批、檢查流程環節眾多,資訊洩漏的風險點不少,易導致商業核心機密洩漏。華大每年需要報送 CFDA 審批的國產儀器與試劑盒眾多,為加強華大內部裝置試劑生產、臨床試驗資料、註冊申請材料等全流程追蹤管理,實現全程可溯源、資訊可追蹤、過程可監管,我們正在搭建基於華大區塊鏈的臨床註冊申報管理平臺。未來所有註冊申報的資料及資訊均將透過此平臺登記,防止出現報送資訊不全、失真等問題,並減少資料洩漏風險。同時,華大將與 CFDA 探討建立合作關係,以區塊鏈模式及時共享資料,聯合實施審計監管,從而提高申報效率。

4.3 區塊鏈+罕見病公益:許一個沒有罕見病的未來

罕見病是指發病率極低的疾病,根據世界衛生組織(WHO)的定義,罕見病為患病人數佔總人口的 0.65‰~1‰的疾病。華大基因於 2016 年成立了“華大基因罕見病公益基金”,為罕見病患者提供免費基因檢測及遺傳諮詢,幫助罕見病患者查詢病因並促進相關科學研究。2017 年又與合作伙伴聯合成立了為全球重症地貧血患兒永久免費進行 HLA 配型的“華基金”及為全球 14 歲以下的萊伯氏先天性黑蒙症患者提供基因檢測的“光基金”。華大區塊鏈為罕見病相關的公益基金建立基於區塊鏈的管理平臺,確保資金用途、捐贈記錄、受捐人資訊等都將透過區塊鏈進行存證,實現全程公開透明。同時由於罕見病例稀少,相關資料極其分散,對罕見病的診斷、醫療離不開包括患者、病友會、醫生、檢測機構、科研機構、製藥機構、公益基金會、媒體等多方互助才能把資源最最佳化,最大可能地應對罕見病。華大區塊鏈也將探索透過分散式架構促進罕見病相關方多方協作,同時確保資料隱私、促進資料共享、定義資料價值。

4.4 區塊鏈+互助保險:HPV 檢測保障計劃

宮頸癌是女性最常見的惡性腫瘤之一。近年來,我國宮頸癌發病呈現年輕化的趨勢,每年因宮頸癌死亡的女性約 3 萬人。早在上個世紀的 90 年代,科學家們就已經發現宮頸癌與 HPV(人乳頭瘤病毒)的感染密切相關,宮頸癌是目前唯一病因明確、可早發現、早預防的惡性腫瘤。為應對 HPV 感染現狀,降低宮頸癌發病率,呵護女性健康,華大基因近期研發出自取樣的 HPV 分型基因篩查檢測產品,啟動大規模的網際網路宮頸癌防控計劃,同時首期在員工內部試點 HPV 互助保障計劃,將基因科技與網際網路保險結合,所有購買 HPV 檢測試劑盒的費用都將作為互助基金,用於日後互助理賠。購買記錄、檢測結果、理賠金額等都將透過區塊鏈進行不可篡改地存證,並接受相關機構的監管,保障使用者權益。

4.5 區塊鏈+深度學習:從技術融合到生物智慧

隨著基因資料的爆發性增長,深度學習等演算法在基因組分析中的應用逐漸增多。將區塊鏈技術與深度學習等智慧演算法融合,預先明確算力提供者、演算法提供者和資料提供者三方的權責並做好利益分配,才能有效促進基因大資料的挖掘。在區塊鏈上進行待訓練資料的身份與權屬認證,並透過智慧合約釋出訓練需求,激勵演算法提供者貢獻智慧。演算法提供者既可以在本地可信環境中訓練模型,還可透過區塊連結入第三方算力平臺。智慧模型訓練完成後,其科研與產業應用價值可透過預先定義好的規則回饋給各方。華大區塊鏈創新性將區塊鏈技術用於匹配資料供需方,為資料探勘引入廣泛的市場參與者,從而形成一個多方協作的演算法市場與智慧計算系統,既可為資料確權,又可最大化發揮資料價值,為最終實現生物智慧奠定基礎。

4.6 區塊鏈+供應鏈:農產品智慧防偽溯源平臺

2017 年,國務院釋出《關於積極推進供應鏈創新與應用的指導意見》,提到建立基於供應鏈的重要食品質量安全追溯機制。由於我國食品供應鏈的成熟度較低,物流等基礎設施仍薄弱,傳統的管理方法和溯源平臺無法在短時間內滿足民眾對食品安全和品質溯源的訴求。

為了解決這一問題,華大區塊鏈攜手華大農業,整合物聯網和基因檢測技術,打造農產品的智慧防偽溯源平臺。利用區塊鏈去中心化、資料不可篡改、公開透明、時間戳等特點,將農場、農戶、檢驗檢疫、加工貿易、銷售、物流倉儲等機構加入到聯盟鏈上,形成一個資金流、資訊流、產品流的共享鏈條,做到來源可查,去向可追,責任可究。各個環節參與方以全節點形式參與到流程中,所有資料產生與互動都加密簽名後上鏈存證,充分解決供應鏈中由於資訊不對稱導致的交易摩擦,監控管理缺失、資料欺詐導致的質量安全或假冒問題,為消費者提供透明可追溯的全流程資訊,形成全新的農業生產管理方式。

擁抱生命大資料時代

區塊鏈技術的快速演進,並與實體經濟不斷融合創新,正在推動可信社會的建立,促進資料價值的流轉。人類基因組計劃完成已近 20 年,隨著組學工具的不斷成熟,海量的生命大資料正在不斷地被數字化和分析挖掘,也為生命時代的價值度量和交換提供了資料基礎。作為全球最大的基因組研發機構,華大基因已與全球 60 多個國家、4000 多家機構、13000 多名合作伙伴建立了廣泛的合作關係,共同向著“生優病少、健康長壽、溫飽不愁、環境友好“的大目標邁進。華大區塊鏈也緊密圍繞集團戰略,推動生命大資料共享交換的生態體系建設。

與任何新技術剛興起時一樣,區塊鏈在生命健康行業的落地應用依賴於技術進步、行業認同、政策法規等支援。為推動區塊鏈應用發展,現建議如下:

1. 推動區塊鏈與其他技術的融合
區塊鏈技術不是萬能的,也不是孤立存在的。區塊鏈技術廣泛應用於生命大資料領域,需要與雲端計算、資料庫、資訊保安、密碼學等技術在硬體和軟體層面上不斷融合創新。

2. 依託聯盟,行業內廣泛合作
以基因資料為基礎的生命組學大資料,全球目前仍缺乏統一的共享標準和隱私保護準則。依託國家基因庫合作與聯盟體系的建設,積極推廣區塊鏈技術的應用,在實踐中積累經驗,形成示範效應。

3. 推進區塊鏈技術標準制定,並與產業標準並進
加快推進區塊鏈關鍵技術標準的制定,參與國際標準研製工作,並積極與生命健康行業的相關應用標準互動,推動產業應用標準落地。

4. 出臺扶持區塊鏈應用發展的政策
借鑑發達國家和地區的先進做法,區塊鏈的規模化應用得益於良好的發展環境與行業政策支援。及時出臺相關扶持政策,重點支援平臺建設與技術攻關,建立行業監管標準,促進技術長遠發展。

數化萬物,智在融合。生命因多樣而美麗,系統因協作而強大。華大以“造福自己、造福人類”的大目標為指引,用開放的心態擁抱未來,希望與合作伙伴共同探索出一條區塊鏈在生命健康行業的落地應用之路,攜手打造生命大資料安全共享和價值互動的全新生態。


網址:http://chain.genomics.cn/

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;