區塊鏈+基因檢測可行?不暴露個人資訊就能測序基因組!

買賣虛擬貨幣

來源 | Wired

編譯 | 火火醬

責編 | Carol

出品 | 區塊鏈大本營(blockchain_camp)

透過使用區塊鏈技術,Nebula Genomics公司為客戶設計了一種無需透露個人身份資料就能測序基因組的方法。

當生物學研究人員晚上入睡時,他們通常會夢到基因組。你的、我的、以及我們之間“六度分離理論”所涉及的所有人(六度分離理論指“你和任何一個陌生人之間所間隔的人不會超過五個,也就是說,最多透過五個人你就能夠認識任何一個陌生人。”)。

想想,所有包含在這60億個遺傳密碼字母中的基因資訊,正是這些基因資訊讓你成為了獨一無二的你。只要科學家能夠收集到足夠的資訊,那麼就能找到藏在DNA中的那些摧毀致命疾病的方法。

到目前為止,全球至少有2600萬人部分基因組已經被解碼了——大部分是由23andMe和Ancestry這樣的公司破解的,但其中很大部分是屬於部分解碼,只有一小部分被全部解碼。

在十年前的2009年,破解一個完整的基因組會花費10萬美元,如今,可能只要1000美元。業界有企業認為,到2021年,還將有可能低破100美元。那麼,所有的基因組都在哪裡呢?有一些聲音認為,未來的測序師已經被“個人資料隱私”這個因素給嚇跑了。

Nebula Genomics的技術長Kevin Quinn表示,在2018年Facebook/Cambridge Analytica 醜聞爆出後不久,隱私保護的大覺醒就開始了。“人們開始意識到,他們每天使用的服務並沒有按照預期的方式進行,”他說,“這對基因學領域造成了很大的衝擊。”

23andMe的CEO Anne Wojcicki也表示,對隱私的擔憂是DNA檢測銷量下滑的主要原因。包括Nebula在內的幾家新興企業試圖透過將人們的DNA放在區塊鏈上的方式來解決這些問題。

這家新興企業是由哈佛基因組學先驅George Church參與聯合創辦的,去年年初推出時,以99美元的價格提供低質量的基因組測序服務,並將資料訪問控制寫入公共賬本中。

今年夏天,他們增加了一個“贊助測序”模型,如果客戶讓Nebula與醫藥合作伙伴共享鑑定的DNA和其他資料,那麼該模型將為客戶提供免費的臨床級基因組檢測。之後,該公司推出了該領域的第一個“匿名測序”程式,該程式旨在實現個人資訊完全匿名化

當你從23andMe或Ancestry這樣的公司訂購唾液採集包時,必須使用信用卡付款並輸入地址。你需要用郵箱註冊賬號來檢視結果。所有這一切都是在網際網路瀏覽器上完成的。

並且,所有的資料都與唾液管內旋轉的DNA相關聯,很快就會變成一個由短字元As、Cs、Ts和Gs組成的資料檔案。在公司與想要挖掘這些基因資料的研究人員或製藥公司分享這些資料之前,他們必須剝離掉所有的這些個人標識。

Nebula已經做到了,但是Quinn說,顧客必須相信所有東西都能得到妥善地清理,並且不會有人把事情搞砸。匿名測序的理念從最一開始就是與個人資訊相分離的。

這就是為什麼匿名測序的第一步就是更為全面地清理你的電子商務習慣。Nebula建議使用加密電子郵件(由Enigmail、Mailvelope和Protonmai等公司提供的服務),並使用VPN掩蓋你的瀏覽行為。

而且,你必須要有一個與你的名字無關的地址,PO Box在這時就可以派上用場了。安全的加密錢包或者預載入的信用卡也是必不可少的。完成所有步驟後,你就可以匿名購買並收到Nebula唾液採集包了。該公司對你的基因組進行測序,然後將其放到他們的安全雲中,沒有人會知道這組基因屬於誰。

Quinn說:“我們這邊不需要去識別它屬於誰,因為它本質上已經是獨立的了。以前從來沒有人這麼做過。”該公司表示,雖然這個流程建立在“不信任Nebula”的基礎上,但它實際上是在建立信任。我知道這聽起來是有點反常理,但是,這畢竟是區塊鏈嘛。

只有一個很小的雙螺旋型問題。基因組本身就是一個獨一無二的識別符號(從美國錯綜複雜的基因隱私法來看或許會有不同的看法),但是,近年來,研究人員發現,使用公共資料庫(例如警察用來抓獲“金州殺手”的那些資料庫),僅透過DNA來識別個人身份的可能性越來越高。“如果你有60億對鹼基對,你還管別人叫什麼幹嘛?那本身就是一個更獨特的識別符號了啊,”生物資訊學家Mark Gerstein(耶魯大學生物醫學資料科學中心主任)說道。

為了防止駭客從DNA基因組儲存庫中竊取資料,並將其與其他資料結合以重新識別人的身份,應該對資料進行加密,但是這僅僅是資料安全的第一步。

Gerstein提到,問題在於讀取基因組需要將其與其他人的DNA進行比較,這也是瞭解其中字母含義的唯一方法。對基因組進行加密後,它也會對所有軟體保持加密狀態,而這些軟體本會告訴你“你的祖先來自哪裡”或者“你的APOE4版本是否會讓你更容易患上阿爾茨海默症”。

“這個過程是需要計算才能理解的,這意味著基因組需要在伺服器和資料庫之間移動。在不揭示基礎序列的情況下要這麼做是非常棘手的。”因為基因組資料非常龐大。銀行號碼、納稅申報單、醫療記錄等都是小檔案。

所以,提供 knowledge-less storage(無知識儲存)的公司可以對該資料進行加密,並提供唯一的金鑰。對整個基因組進行加密的計算成本要高得多,而在加密的基因組上執行計算的成本則會更高。

但這正是Nebula下一步要做的工作。在過去的一年中,Nebula一直在與研究人員合作以構建和測試安全的計算環境,相關的出版物目前正在接受稽覈。

該公司計劃從明年開始部署這項技術,首先使用該公司自己的基因組解釋服務,該服務將向客戶介紹他們的健康狀況和祖先血統,最終與學術和製藥研究合作伙伴合作。目前,這些計算在Nebula儲存基因組資料的分散式網路上進行。

合作伙伴可以提交查詢(例如,是否存在導致阿爾茨海默氏症的APOE變體),並且只能檢視查詢結果。只有Nebula和基因組所有者才可以訪問純文字資料。最終想要實現的功能是,即使是Nebula也將無權訪問,只有基因組所有者才能訪問。

儘管Gerstein是個愛吹毛求疵的人,但他面對這一進展仍感到十分激動。他說:“就開發真正的私有基因組測序和儲存的選擇而言,這一步意義重大。”因為他預計在不久的將來,測序將會像測血壓一樣成為醫生辦公室的家常便飯。現在將這些保護措施規範化或許有助於防止日後出現更強的反對和抵制。科學家們,祝你們好夢!

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;