Fluree:使用具有遵從性的可變和不可變資料儲存

買賣虛擬貨幣
在一個需要不可變資料,但必須允許資料可以修改和刪除的世界中,行業如何才能蓬勃發展?將資料儲存在適當的位置本文是對使用適當的資料儲存來獲取可變和不可變資料的呼叫。在我們目前的合規和監管環境中,臨時或私有資料可能需要更改或刪除,而這又需要一個允許突變的位置。示例包括:名稱更改、地址更改或刪除以前的客戶資料。此功能通常在傳統的關聯式資料庫中進行管理。在當今以資料為中心的世界中,為資料選擇合適的儲存空間至關重要。傳統資料庫使用傳統的可變資料庫結構,資料更改將替換以前的記錄資料。為了維護資料庫歷史,需要部署詳細的特定於業務的備份策略。該計劃可能包括每週進行一次完整備份,每天進行一次差異備份,以及每30分鐘進行一次交易日誌備份。這就對這些潛在的冗餘過程造成管理負擔和儲存挑戰。此外,回顧歷史資料時還需要與當前狀態協調一致。
有許多不同的“傳統”資料庫,但最流行的是關聯式資料庫。關聯式資料庫依賴於將主鍵繫結到外來鍵關係的模式。這些關係透過結構化查詢語言(SQL)使用連線促進資料查詢。關聯式資料庫在當今的大多數行業中都很流行。關聯式資料庫自20世紀70年代以來就一直存在。最近,基於NoSQL(“Not only SQL”)資料庫的資料儲存得到了廣泛的應用。這些資料庫不需要關聯式資料庫的正式結構。NoSQL資料庫包括:鍵值、圖形、寬列和文件資料庫。在大多數情況下,這些都是可變資料庫。基於區塊鏈的資料儲存區塊鏈技術提供了所有歷史交易的完整、可信和可跟蹤的歷史。這段不朽的歷史包括:· 新交易,· 更新現有條目,以及
·“刪除”現有條目。

這是區塊鏈分類賬的惟一附加性質。所有交易都建立一個新記錄,而以前的資訊保持不變。區塊鏈結構還擴充套件了這個儲存設施,以構建一個“不可信”的系統。區塊鏈將前一個區塊內容的加密貨幣雜湊與現在的區塊鏈雜湊連結起來,使得未經授權的資料操作立即可偵測到。這提供了可信交易操作的時間順序記錄。

對於區塊鏈應用程式最有前途的行業是那些需要資料交換和遵從性的行業。許多行業都符合這一標準,但主要的候選行業包括保險、醫療保健和供應鏈。我選擇了醫療保健行業作為本文的重點討論物件——在這裡交換和修改個人資料,而病人健康資料的完整性和這些資料的管理是至關重要的(並且受到高度監管)。

醫療行業的機遇與挑戰

我們只能想象,世界上每天發生的醫療資料交換量有多大。有許多利益相關者參與了這種交換——提供者、合作伙伴、患者和付款人。這種數量的參與者構成了一個複雜的資料管理生態系統。在美國,這些資料受到1996年《健康保險可攜性和問責法》(HIPAA)的保護。HIPAA要求強制遵守,以保護患者資料不被披露和濫用。

在歐盟,《一般資料保護條例》(GDPR)也對歐盟公民的資料提供了同樣的保護。GDPR的保護遠遠超出了醫療保健的保護,但個人健康資料仍然是一項關鍵的保護措施。目前使用的大多數遺留系統都是關聯式資料庫——可重寫的可變資料來源。缺乏歷史記錄可能導致錯誤的資訊和對資料的錯誤解釋——不僅導致遵從性問題,還會導致互操作性問題。

因此,醫療行業為區塊鏈技術的採用提供了巨大的機會。隨著不可變資料結構的部署,人們將認識到增加個人醫療資料的參與和所有權的好處。此外,臨床醫生將能夠更好地提供適當的護理基於完整和可信的病人資訊的歷史。所有健康事件的不可變分類賬將提供:

· 歷史/當前藥物
· 歷史評價
· 歷史診斷
· 歷史的治療方法

有了這些資料,患者可以完全信任地跟蹤自己的健康狀況,臨床醫生可以高效地治療患者。此外,透過儲存完整的資料倉儲,人工智慧(AI)和機器學習技術所需的未來學習和應用程式將更加高效。最後,可以從未確定的歷史資料集(用於研究和公共衛生分析)中收集到更好和更高質量的分析見解。

不可改變的難題

這太棒了,對吧?嗯,新出現的“個人資料”合規規定的更新是一個挑戰。最重要的是,歐盟GPR第17條包括“被遺忘的權利”。第十七條規定,“資料當事人有權要求刪除與其有關的個人資料。”這條規則適用於任何處理歐盟公民個人資料的第三方——適用於世界任何地方。這給不可變資料儲存帶來了一個問題,因為按照設計,完整的事交易歷史是存在的,因此“忘記”資料是不可能的。

那麼,在一個需要不可變資料,但必須允許資料修改和刪除的世界中,行業如何才能蓬勃發展呢?

一種解決方案是破解密碼

在不可變資料儲存中管理個人資料的一個流行選項是密碼分解。金鑰管理系統(KMS)用於管理惟一金鑰的加密、控制和安全保管。在該系統中,在個人資料儲存中構造一個加密金鑰列表。此鍵也存在於非標識的不可變資料儲存中。然後,在兩個資料儲存之間傳遞請求的重擔就落在了應用程式層上。一旦實現,基於應用程式提供的公開資訊的完整資訊就可以做出決策。

當請求“忘記”資料時,將覆蓋加密金鑰。這中斷了對關聯底層不可變資料的連結——不可變資料儲存中的交易資料完整性得到維護,但是對資料所屬的個體的引用被刪除。這符合gpr的要求,因為不再有記錄與歐盟公民的個人資料掛鉤。

可以在特定的資料級別實現金鑰加密。例如,如果僅為一個人的名字或ID建立一個金鑰,那麼分解金鑰將消除與該人相關的所有資料。在更高的級別上,可以鍵入完整的“使用者配置檔案”,其中包括地址、性別和其他半私密資訊——因此,如果刪除了金鑰,仍然會有關於主題的一些相關細節的記錄。這將有助於提供基於身份不明的真實患者的綜合資料用於研究工作。此外,這種級別可以應用於網路中的不同資料來源,這些系統中的相同特定資料可以具有不同的鍵。最後,不管實現如何,一個系統中的相同資料可以分配給一個連結系統中的另一個金鑰。這有助於在隔離的情況下分解更具體的資料。

Apple的iOS系統的“可刪除儲存”就是一個在實踐中破解密碼的例子。當你“刪除所有內容和設定”時,iOS裝置就會使用這項技術。蘋果公司透過預留一個專門的NAND儲存區域來儲存加密金鑰來達到這一目的,加密金鑰會被刪除,讓裝置上的所有個人資訊都無法訪問。

Crypto-shredding模型
更好的解決方案是:分離、連結資料來源

在最近的Fluree播客中,強調了儲存個人資料的挑戰。重點是,這實際上是一個應用程式架構的鬥爭,而不是區塊鏈的鬥爭。資料需要在後端分開,並且只在應用層查詢(而不是管理)。該應用程式只是根據所需的特定資料從可變或不可變資料庫中提取資料。資料系統架構師不應將個人資料儲存在不可變的資料儲存中。

要將可能需要更改、修改或刪除的資料與不可變資料分開儲存,這個建議選項涉及為個人資料部署一個單獨的可變資料庫。這種多源方法允許區塊鏈結構保持完整的歷史完整性,同時將個人資料維護放在可變的位置。實際上,要在規模上有效地完成此配置,需要分配一個匿名的交叉連線識別符號來繫結兩個源。在可變資料庫中使用這個公共金鑰作為關聯個人資料的錨,將允許銷燬對個人資料(金鑰和個人資料)的所有引用。這對不可變資料庫沒有影響,在不可變資料庫中,鍵仍然是對已發生的歷史交易的繫結。使用這種方法,可以使每個資料庫具有適當的預期功能,並根據GDPR規則,具體保護“被遺忘權”。

透過有意的設計,Fluree資料棧透過包含語義web和跨資料集查詢完全支援這種方法。Fluree利用W3C資源描述框架(RDF)的主題整合了對SPARQL(一種協議和RDF查詢語言)的支援。使用SPARQL,可以在後端對多個資料來源無縫地發出查詢,同時將統一的結果集呈現給中間層進行處理。在下面的圖中,這個結構概述如下:(1)跨資料集查詢,(2)透過SPARQL使用資料的應用層,(3)無縫的使用者輸出,就像從單個源中提取資料一樣。

獨立的資料可以從應用程式層查詢
申請機會作為醫療行業的一個例子,讓我們從一個在多個不同醫療機構接受治療的患者開始。· 阿爾瑪今年72歲,身體狀況相對較好。然而,她最近開始出現輕微的痴呆症症狀。· 她的主治醫生給她開了阿立西普(多奈哌齊)來改善她的病情。阿立西普屬於乙醯膽鹼酯酶抑制劑(AChEI)一類藥物。這些藥物透過抑制膽鹼酯酶(一種分解乙醯膽鹼的酶)來提高乙醯膽鹼的水平。· 幾個月後,阿爾瑪向家人表達了對膀胱失禁的擔憂。因此,阿爾瑪的家人安排她去看該地區一位著名的泌尿科醫生。泌尿科醫生無法進入阿爾瑪的藥物清單——因為這位醫生在該地區與競爭的衛生系統打交道。阿爾瑪的家人也沒有帶來她的藥物清單,因為他們認為“所有藥物都在電腦裡”。· 根據現有的阿爾瑪患者資料,泌尿科醫生建議阿爾瑪試驗一種流行的尿失禁藥物,地羅酮(羥丁寧),然後再進行任何可能的侵入性研究。然而,如果泌尿科醫生知道阿爾瑪正在積極地服用阿立西普治療老年痴呆症,這位醫生很可能永遠不會開地羅酮。
· 地羅酮的作用機制在本質上是抗膽鹼能的-它將有效地抵消阿立西普的大部分好處。不幸的是,這種情況在我們當前的醫療體系中相當普遍。最近發表在《老年臨床干預》(Clinical Interventions in Aging)雜誌上的一篇文章討論了在病人資料被忽視或處方醫生無法獲得的情況下,使用能夠相互作用/抵消其他藥物影響的藥物。作者的總結強調了發揮作用的藥物和條件的廣泛範圍:“基於其相反的作用機制,最重要的藥效學相互作用之一是同時使用阿切斯和抗膽鹼能藥物,從而導致藥理拮抗。抗膽鹼能作用是抗精神病藥、抗抑鬱藥、抗組胺藥、支氣管擴張劑和尿失禁藥等藥物,這些藥物常被開給老年痴呆症患者,尤其是那些有行為和精神症狀的患者。“此外,許多活性成分都是美國各地都能買到的非處方藥的成分。很可怕,是吧?如果阿爾瑪的全部病人病史可供審查,這就不會發生。完整的病史應該包括她所有的藥物、治療和評估。對於不可變區塊鏈支援的資料來源,這是一個完美的用例示例。顯然,這是危險的。在一個分裂的可變/不可變的情況下,女性的個人資料將與不可變的歷史保持離線狀態,而不可變的歷史將跟蹤她的所有情況和藥物,以便在充分了解情況的情況下對她進行適當的治療。這一點很重要,因為在這個案例中,歷史事件與她目前的治療有關。此外,如果需要使用歷史趨勢來治療她,這些資料就可以支援當前的情況。
結論· 在確定和實現功能性資料管理解決方案時,將適合於資料型別和資料分離是至關重要的· 個人資料不應儲存在不可變的資料儲存中· 區塊鏈分類帳支援的資料庫提供了完整和可信的歷史記錄,當這些資料對於相關性、趨勢或審計目的至關重要時· Fluree提供了一個滿足這一需求的產品——關於該產品的更多資訊列在下面。關於Fluree
Fluree是一個面向現代應用的以資料為中心的資料管理平臺。Fluree將資料視為一級標識,這些資料以各種形式存在,包括:資料庫模式構建歷史、資料庫訪問授權引擎,以及任何給定時間的所有事實陳述。Fluree有兩個元件:一個是不可變的分散式分類賬FlureeDL,另一個是最佳化後在FlureeDL上構建應用程式的圖形資料庫FlureeDB。在這兩個系統中,Fluree開發人員都使用複雜的邏輯(SmartFunctionsTM)來執行定製的讀/寫許可權和規則。

Fluree使用W3C RDF格式並支援SPARQL查詢語言。這有助於部署語義web感知的應用程式體系結構,以及使用連線多個資料來源(無論是可變的還是不可變的)的查詢。Fluree Community edition是免費的——既可以作為雲託管的DBaaS,也可以作為本地部署的可下載Java可執行檔案。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;