資料隱私漸成AI“掣肘” 隱私計算+AI是否為破局之法？

人工智慧（Artificial Intelligence）風雲再起。從蒸汽時代到電氣和資訊化時代、再到未來的數字化時代，歷史變局的機遇期再一次徐徐展開，人工智慧作為新一輪科技革命與數字化革新的重要驅動引擎，已經成為各國家科技競爭主導權的核心領域。人工智慧正在深刻改變著政治、經濟、生活等模式軌跡，在不知不覺中影響著社會發展。1. 人工智慧的“掣肘”而在當下，人工智慧的發展也面臨著諸多問題。其中核心便是資料與人工智慧的關係。目前人工智慧在與資料相關的各種應用場景中獲得了廣泛的使用。其中機器學習、深度學習等技術透過收集大量的資料進行訓練獲得模型，之後在不同的場景下利用模型對單個使用者的資料進行處理。AI在模型訓練和推斷過程中，各類資料不斷被歸集，而AI的模型本身也是非常重要的一種資料，可以說，資料是承載AI不斷髮展的沃土。AI技術使用的基本模式是透過不斷收集資料進行訓練來最佳化AI模型。但當前這一模式已經遇到了極大的瓶頸——資料隱私問題。同時，資料作為一種極為特殊的資產，擁有資料的企業也不願意真正地彼此分享。資料的多樣性直接決定了模型的精度，進而決定了商業成本與風險。從 AI 演算法的角度來看，資料越多越好；從隱私保護的角度來看，資料暴露得越少越好。這種內在的“矛盾”已經成為 AI 技術進一步使用的最大障礙。

2. Rosetta：隱私AI的底層基石Rosetta正是由此而生。Rosetta名字取自古埃及的羅塞塔石碑（Rosetta Stone）。其上記載著古埃及象形文字，埃及草書和古希臘文三種文字。這裡Rosetta寓意著承載和結合隱私計算、區塊鏈和AI三種典型的技術。Rosetta開源框架透過隱私計算技術，可以在保證資料隱私的前提下進行 AI 模型的訓練與推斷。最大限度地利用資料的多樣性，也最大限度地保證資料隱私。從實用角度來說，Rosetta開源框架是面向 AI 開發者、AI 研究人員的工具。與此同時也需要了解、熟悉隱私計算技術的開發者與研究人員來支撐和完善Rosetta。Rosetta的目的和期望是可以相容各種主流的AI框架。當前版本的Rosetta是以TensorFlow作為首選，可以降低熟悉TensorFlow的AI工程師使用隱私計算的技術門檻。如果已經有了一個AI應用，那麼工程師只需要修改極少量的程式碼，就可以將原先的應用遷移到隱私計算的框架下。面向開發者，Rosetta開源框架具備以下特點及優勢：

高效性充分利用TensorFlow框架的工業級最佳化支援各類平臺Rosetta採用了密碼學演算法作為底層技術支撐。出於效能的考慮，密碼學演算法通常採用C/C++作為程式語言，而TensorFlow的底層實現也採用了C/C++。Rosetta在保持底層 C/C++ 實現密碼演算法高效能的同時，有機地結合TensorFlow框架中對於平行計算的工業級最佳化，在保持易用性的前提下，依然保證演算法的高效性。易用性匯入一行程式碼即可將TensorFlow程式碼轉換成隱私計算模式Rosetta的設計初衷之一就是要做到簡單好用。可以從隱私計算和AI兩個不同的角度來理解這個特性。

實現隱私計算的核心技術是密碼學，而這是一門較為複雜，學習曲線較高，涉及多類數學理論的學科。讓AI開發者去熟悉和掌握複雜的密碼學協議和演算法是十分不現實的。另一方面，AI演算法繁瑣複雜，如果用密碼學演算法來逐一進行定製，成本非常高，既不利於Rosetta後續的擴充套件，也不利於開發者使用。Rosetta的做法是透過隱私計算演算法將AI框架裡的各類基本操作（稱為“運算元”，operation）轉化為“隱私運算元”，即運算元的功能不發生改變，同時支援在隱私保護前提下的使用。因此，AI開發者可以很容易地用各種各樣的隱私運算元，透過組合，構建出開發者想要的AI模型，並且是在資料提供方支援以隱私保護的方式進行模型訓練和模型推斷。Rosetta完全保留了TensorFlow的介面 API。AI 開發者可以在明文狀態下利用TensorFlow來調整模型，一旦需要引入多方資料進行處理，只要簡單地引入下面的包即可自動轉化為隱私狀態下的計算：import latticex.rosetta靈活性支援多種隱私演算法並可自由組合AI演算法適配不同場景需求

Rosetta支援對同一個隱私運算元不同技術的實現方式，因此可以更好地去適配不同的業務場景。Rosetta支援各類隱私計算演算法，包括密碼學中的安全多方計算、零知識證明、同態加密以及聯邦學習和可信執行環境。比如實現一個邏輯迴歸訓練，從Rosetta的角度來看，其實運算元的表示式都是與Tensorflow一致的，僅需要在程式的頭部進行一些小小的改動，比如載入資料集的程式碼從原先的明文讀取資料檔案改為Rosetta的遠端連線介面的方式。同時，在訓練完畢後，模型的歸屬上，開發者也可以透過一些簡便的Rosetta函式呼叫，透過隱私演算法中的秘密分享技術，實現將密文狀態的模型進行拆分和分配。如果開發者需要將模型單獨分配給其中一方，也可以找到相應的Rosetta函式，透過秘密分享中的重構演算法還原出模型明文。

資料隱私漸成AI“掣肘” 隱私計算+AI是否為破局之法？

推荐阅读

近期文章

新手教程

1什麼是區塊鏈？區塊鏈能做什麼？

2區塊鏈是如何運作的？

3區塊鏈和比特幣的關係？

4比特幣有什麼價值？

5如何購買比特幣？