這是區塊鏈分類賬的惟一附加性質。所有交易都建立一個新記錄,而以前的資訊保持不變。區塊鏈結構還擴充套件了這個儲存設施,以構建一個“不可信”的系統。區塊鏈將前一個區塊內容的加密貨幣雜湊與現在的區塊鏈雜湊連結起來,使得未經授權的資料操作立即可偵測到。這提供了可信交易操作的時間順序記錄。
對於區塊鏈應用程式最有前途的行業是那些需要資料交換和遵從性的行業。許多行業都符合這一標準,但主要的候選行業包括保險、醫療保健和供應鏈。我選擇了醫療保健行業作為本文的重點討論物件——在這裡交換和修改個人資料,而病人健康資料的完整性和這些資料的管理是至關重要的(並且受到高度監管)。
醫療行業的機遇與挑戰
我們只能想象,世界上每天發生的醫療資料交換量有多大。有許多利益相關者參與了這種交換——提供者、合作伙伴、患者和付款人。這種數量的參與者構成了一個複雜的資料管理生態系統。在美國,這些資料受到1996年《健康保險可攜性和問責法》(HIPAA)的保護。HIPAA要求強制遵守,以保護患者資料不被披露和濫用。
在歐盟,《一般資料保護條例》(GDPR)也對歐盟公民的資料提供了同樣的保護。GDPR的保護遠遠超出了醫療保健的保護,但個人健康資料仍然是一項關鍵的保護措施。目前使用的大多數遺留系統都是關聯式資料庫——可重寫的可變資料來源。缺乏歷史記錄可能導致錯誤的資訊和對資料的錯誤解釋——不僅導致遵從性問題,還會導致互操作性問題。
因此,醫療行業為區塊鏈技術的採用提供了巨大的機會。隨著不可變資料結構的部署,人們將認識到增加個人醫療資料的參與和所有權的好處。此外,臨床醫生將能夠更好地提供適當的護理基於完整和可信的病人資訊的歷史。所有健康事件的不可變分類賬將提供:
· 歷史/當前藥物
· 歷史評價
· 歷史診斷
· 歷史的治療方法
有了這些資料,患者可以完全信任地跟蹤自己的健康狀況,臨床醫生可以高效地治療患者。此外,透過儲存完整的資料倉儲,人工智慧(AI)和機器學習技術所需的未來學習和應用程式將更加高效。最後,可以從未確定的歷史資料集(用於研究和公共衛生分析)中收集到更好和更高質量的分析見解。
不可改變的難題
這太棒了,對吧?嗯,新出現的“個人資料”合規規定的更新是一個挑戰。最重要的是,歐盟GPR第17條包括“被遺忘的權利”。第十七條規定,“資料當事人有權要求刪除與其有關的個人資料。”這條規則適用於任何處理歐盟公民個人資料的第三方——適用於世界任何地方。這給不可變資料儲存帶來了一個問題,因為按照設計,完整的事交易歷史是存在的,因此“忘記”資料是不可能的。
那麼,在一個需要不可變資料,但必須允許資料修改和刪除的世界中,行業如何才能蓬勃發展呢?
一種解決方案是破解密碼
在不可變資料儲存中管理個人資料的一個流行選項是密碼分解。金鑰管理系統(KMS)用於管理惟一金鑰的加密、控制和安全保管。在該系統中,在個人資料儲存中構造一個加密金鑰列表。此鍵也存在於非標識的不可變資料儲存中。然後,在兩個資料儲存之間傳遞請求的重擔就落在了應用程式層上。一旦實現,基於應用程式提供的公開資訊的完整資訊就可以做出決策。
當請求“忘記”資料時,將覆蓋加密金鑰。這中斷了對關聯底層不可變資料的連結——不可變資料儲存中的交易資料完整性得到維護,但是對資料所屬的個體的引用被刪除。這符合gpr的要求,因為不再有記錄與歐盟公民的個人資料掛鉤。
可以在特定的資料級別實現金鑰加密。例如,如果僅為一個人的名字或ID建立一個金鑰,那麼分解金鑰將消除與該人相關的所有資料。在更高的級別上,可以鍵入完整的“使用者配置檔案”,其中包括地址、性別和其他半私密資訊——因此,如果刪除了金鑰,仍然會有關於主題的一些相關細節的記錄。這將有助於提供基於身份不明的真實患者的綜合資料用於研究工作。此外,這種級別可以應用於網路中的不同資料來源,這些系統中的相同特定資料可以具有不同的鍵。最後,不管實現如何,一個系統中的相同資料可以分配給一個連結系統中的另一個金鑰。這有助於在隔離的情況下分解更具體的資料。
Apple的iOS系統的“可刪除儲存”就是一個在實踐中破解密碼的例子。當你“刪除所有內容和設定”時,iOS裝置就會使用這項技術。蘋果公司透過預留一個專門的NAND儲存區域來儲存加密金鑰來達到這一目的,加密金鑰會被刪除,讓裝置上的所有個人資訊都無法訪問。
在最近的Fluree播客中,強調了儲存個人資料的挑戰。重點是,這實際上是一個應用程式架構的鬥爭,而不是區塊鏈的鬥爭。資料需要在後端分開,並且只在應用層查詢(而不是管理)。該應用程式只是根據所需的特定資料從可變或不可變資料庫中提取資料。資料系統架構師不應將個人資料儲存在不可變的資料儲存中。
要將可能需要更改、修改或刪除的資料與不可變資料分開儲存,這個建議選項涉及為個人資料部署一個單獨的可變資料庫。這種多源方法允許區塊鏈結構保持完整的歷史完整性,同時將個人資料維護放在可變的位置。實際上,要在規模上有效地完成此配置,需要分配一個匿名的交叉連線識別符號來繫結兩個源。在可變資料庫中使用這個公共金鑰作為關聯個人資料的錨,將允許銷燬對個人資料(金鑰和個人資料)的所有引用。這對不可變資料庫沒有影響,在不可變資料庫中,鍵仍然是對已發生的歷史交易的繫結。使用這種方法,可以使每個資料庫具有適當的預期功能,並根據GDPR規則,具體保護“被遺忘權”。
透過有意的設計,Fluree資料棧透過包含語義web和跨資料集查詢完全支援這種方法。Fluree利用W3C資源描述框架(RDF)的主題整合了對SPARQL(一種協議和RDF查詢語言)的支援。使用SPARQL,可以在後端對多個資料來源無縫地發出查詢,同時將統一的結果集呈現給中間層進行處理。在下面的圖中,這個結構概述如下:(1)跨資料集查詢,(2)透過SPARQL使用資料的應用層,(3)無縫的使用者輸出,就像從單個源中提取資料一樣。
Fluree使用W3C RDF格式並支援SPARQL查詢語言。這有助於部署語義web感知的應用程式體系結構,以及使用連線多個資料來源(無論是可變的還是不可變的)的查詢。Fluree Community edition是免費的——既可以作為雲託管的DBaaS,也可以作為本地部署的可下載Java可執行檔案。