圖靈鏈(TuringChain)自然語言交流的公鏈

買賣虛擬貨幣
圖靈鏈,其目標是利用人工智慧及區塊鏈技術搭建實現圖靈測試的自然語言交流的公鏈, 開發者可以透過圖靈鏈快速搭建自己行業的圖靈應用, 應用可以表現為APP,AI電話系統、音箱或其他ABI硬體等(ABI=AI+BC+IOT), 使用者只需要對著AI系統提出問題,系統就會依據設定的機器性格給出如同真人的回答。人類知識的體量巨大,目前市場上的AI系統很難實現多輪對話的原因是缺乏大量的結構化知識(語料、資料)來訓練演算法框架。同時傳統的組織行為也很難調動大量的使用者來貢獻知識。而擁有知識的群體也很難進行知識變現。各方的痛點需要有一種新型的社會學經濟學的方式來解決。所以我們採用區塊鏈的去中心化、可追溯、共識機制、社群激勵的特點為知識共享平臺的搭建提供支援,讓大量使用者基於區塊鏈社群的共識,協同工作,共同創造,共同分享。我們將設計一套新型的工作量證明機制來激勵使用者協同貢獻知識,並且適配完備的資料生態體系、知識流通體系、社群體系及AI-SDK工具包,讓其他開發者可以快速搭建屬於自己智慧音箱或AI自然語言交流系統。同時圖靈鏈支援百萬級併發,可以讓更多的使用者同時使用圖靈裝置進行互動。設計去中心化的頻寬及儲存方案,讓每臺裝置可以當做分散式節點分項資料。提供各種ABI裝置的研發支援, 支援使用者快速進行產品釋出。教育、健康、商業、文化幾個方向擁有人類最廣泛的底層共識,也擁有最廣泛的受眾。這些領域沉澱了大量的知識需要變現及流通。圖靈鏈適合在上述領域建立智力啟發、醫療健康諮詢、法務商務諮詢、情感陪護等方向的自然語言交流系統。自然語言交流系統的最終目標是透過圖靈測試,我們將用上述技術集合人類最深邃最有價值的邏輯及各項領域的知識完成這一目標,讓機器從此可以和人自然交流。圖靈鏈上將會誕生人機互動歷史上最具顛覆式的產品,這將是人機對話及人類文明傳播領域的一次革命。TuringChain技術框架1. 名詞解釋
知識團體擁有某個領域的知識共識的團體,比如教育團體(包括教師和學生),商業及諮詢業團體,行業使用者(如金融體系中的銀行、保險公司;醫療體系),行業研究機構(學會,術語或者標準制定委員會),信仰團體(佈道者和信眾)。智慧知識體系 一個領域內的所有知識點以及知識點之間的相互關係構成了這個領域的知識體系。由於技術所限,之前的知識體系只能分散的停留在各種文件和資料上,相關從業者的大腦中。沒有辦法整合起來提供全面的,高水平的知識服務,導致人們需要大量的時間從現有資料和領域內的先行者(導師、教師)處構建自己的本領域的知識體系。智慧知識體系是希望透過在人工智慧技術的幫助下,像人學習知識一樣,整合領域內的知識,構建領域內各項知識點之間的聯絡,加上智慧化的推理能力,形成領域內的知識處理能力,比如教授知識,多輪對話答疑,自動化判斷操作等功能,提升整個領域的執行效率,減少人的重複勞動,釋放人的創造力。2. TuringChain和知識團體的合作關係說明服務平臺的獨立性
確保高效的服務能力,避免因自身認知侷限而導致的錯誤。對不同的知識團體會保持中立關係。知識團體對本領域知識的獨立評判TuringChain在整理知識團體的知識時, 不對知識團體提出的知識點做任何形式的評判。評判權利始終由知識團體本身掌握。每一個知識團體符合TuringChain的側鏈申請要求後,都可以申請一條側鏈用於本知識團體。TuringChain和知識團體的共同目標共同推動本團體知識的完善,共同推動本團體AI系統服務能力的提升,共同推動本領域知識的高效傳播。知識團體對線上知識的管理權
TuringChain不上線任何未經知識團體驗證和同意的知識點。如果知識團體發現已上線的知識點存在問題,TuringChain將按照知識團體的要求對知識點進行修改。TuringChain的主鏈和側鏈TuringChain根據知識團體的特點以及構建智慧知識體系的需要, 採用主鏈加側鏈的方式完成整個體系的搭建。主鏈承載系統核心資料,如身份認證資訊,資產資訊, 知識貢獻度等;側鏈承載各項任務統計資訊,交易資訊等。同時還記錄本知識領域的各項詳細操作資訊。使用者在側鏈的個性化資訊。TuringChain的主鏈的組織形式主鏈是系統的核心,設計以最小資料量、最小計算量及最小網路頻寬需求為目標, 主要提供使用者身份認證,基礎協議、賬本、價值體系,擁有最高裁決權,主鏈的信任合法性來源於被選舉出的核心節點。側鏈透過一條共同的主鏈進行相互之間的通訊和價值流動。核心節點
核心節點用於區塊生成。第一階段核心節點初步數量定為21個。後續根據運營情況調整。達不到服務要求的核心節點會被移除出核心節點群體。普通節點普通節點只有同步資料, 儲存資料的權利。參與主鏈的普通節點沒有使用者身份限制。社羣定期會對節點線上時長進行考核,達不到考核標準的節點將會被移除出普通節點群體。新型的共識機制主鏈採用類DPOS+POV(proof of vitality)共識機制。社羣定期進行投票選出核心節點。採用持有token和活躍度的投票制度對核心節點的支持者做出綜合評定。給擁有token較少,但是活躍度較高的知識團體更多的參與機會。核心節點之前採用PBFT演算法作為節點間的選舉機制。
根據時間片的流轉,輪流由核心節點定期生成區塊。當前時刻獲得擁有記賬權的核心節點會隨機引入半數以上的核心節點對交易進行驗證。拿到區塊生成權的核心節點如果不能正常生成區塊,則向後順延。如果核心節點在一定期限內不能正常生成區塊的數量達到一定限度,則將被踢出核心節點群。效能要求為了整體效能的提升,核心節點的硬體資源和網路資源都達到指定的效能指標方可上線。普通節點暫時不做限制,發生資源不足的情況時,會自動下線。TuringChain的側鏈的組織形式同一個領域知識團體有著極高的內聚性,參與者都有著類似的教育背景或者從業經驗,存在一個基礎的共識。他們需要一個相對獨立的社群空間來完成他們領域內的智慧知識體系構建工作,並期望其能高效的進行,不希望被缺乏本領域知識的人誤入其中, 在智慧知識體系構建工作中人為的引入錯誤,對構建工作造成不必要的干擾。專業人士的佔比越高, 團體成員的協作效率越高, 最終推進相關產品的發展和完善,實現良性迴圈。
由於整個知識體系本身的複雜性,不同的領域知識間存在天然的衝突,導致不同的知識團體對同一事物的理解和解釋有著很大的差別。為了不同的領域知識都能夠高效的發展和傳承,使用側鏈可以將不同的領域知識保持一定的隔離性,避免因為領域知識間的固有衝突成為阻礙智慧知識體系構建的因素。側鏈的組織形式,大大提升系統的安全性。只有得到授權的節點才能參與側鏈的運作。只有透過內部投票的節點才可以作為核心節點參與區塊的生產。核心節點透過知識團體內部推薦,導師團認證後,選出核心節點用於區塊生成。第一階段核心節點初步數量定為15個。後續根據運營情況調整。普通節點普通節點只有同步資料,儲存資料,向核心節點提交待驗證資訊的權利。參與側鏈的普通節點控制者首先必須是知識團體成員,然後需要得到至少一個知識團體成員的推薦方可加入,加入初期會對節點線上時長進行考核,達不到考核標準的節點將會被移除出側鏈。
共識機制針對知識團體內的側鏈,採用類Raft共識機制。首先在核心節點中選出一個記賬者記賬,隨機引入少量非本次記賬的核心節點對新區塊做驗證,如果驗證透過則新的區塊正式生效, 否則引發回滾同時剔除出錯的核心節點; 當它宕機時快速選取出新的記賬者。普通節點信任核心節點產生的區塊。強調可用性和最終一致性,效率很高,符合知識團隊對效率和安全性的預期。效能要求為了儘快完善知識體系,提升AI的服務能力,每一秒都會有大量的知識點被提出和驗證,對側鏈的效能提出了非常高的要求。核心節點的硬體資源和網路資源都達到指定的效能指標方可上線。普通節點的要求可以適當降低,但效能過低的節點暫不引入。導師團由(多個知識裁定者導師)組成導師團,對本領域的知識有管理權。同時負責對本知識團體的內部管理工作。
3. 更安全的公鏈策略為了保障整個系統的健壯性和安全性, 我們從多個維度對系統進行了設計上的最佳化:· 所有參與主鏈和側鏈的核心節點都必須實名登記註冊(繫結機構或者個人),確保能提供高效能的,可靠的服務,避免因為硬體和網路資源本身的問題帶來的整條鏈的服務能力的影響。· 主鏈和側鏈的核心節點叢集透過高可靠性的硬體網路打通VPN連線。確保核心節點之間的網路的高效執行。· 普通節點訪問核心節點時,需要經過硬體防火牆等安全裝置核查後,才能和核心節點產生資料連線。必要情況下也可以在獲取授權後,透過VPN訪問核心節點。4. TuringChain的外部AI服務接入
TuringChain可以作為AI智慧服務整合者, 透過智慧合約集整合多個外部的AI服務。動態協調各個外部的AI服務協作關係,支援多個AI 服務之間相互呼叫。經 過 廣 泛 認 可 的 外 部 AI 服 務 會 由 TuringChain 來 統 一 接 入 , 整 合 成 為TuringChain的AI服務介面之一。5. 更易用的智慧合約綜合執行效率和易用性的考慮,TuringChain採用Lua 作為智慧合約使用的預設程式語言,將定製化一套支援Lua 的指令碼直譯器與編譯器的虛擬機器。以完成Lua 的位元組碼的解釋執行。Lua 是一種輕量小巧的指令碼語言,滿足圖靈完備的要求,採用標準C 語言編寫並以原始碼形式開放。可以靈活的嵌入應用程式中, 為應用程式提供靈活的擴充套件和定製功能。Lua 的核心特點包括:
輕量級: 它用標準C 語言編寫並以原始碼形式開放,編譯後僅僅一百餘K,可以很方便的嵌入其它程式中。可擴充套件: Lua 提供了非常易於使用的擴充套件介面和機制。其它特性: 支援程序導向程式設計和函數語言程式設計; 自動記憶體管理;只提供了一種通用型別的表(table),用它可以實現陣列,雜湊表,集合,物件; 提供多執行緒(協同程序,並非作業系統所支援的執行緒)支援;智慧合約的應用場景示例:服務授權場景, AI服務的使用方可以透過向現有的智慧合約傳送交易資訊和token到指定的智慧合約地址。智慧合約會自動的執行設定好的操作,如果條件滿足則觸發後續動作,對發起者提供授權。服務計量場景,每當AI服務使用者使用服務時,會觸發對應的智慧合約。按照設定好的交易模式觸發交易,對消費和收入進行實時計量。
為了智慧合約的高效執行,智慧合約僅執行在核心節點上。6. 更豐富的生態系統為了繁榮社羣生態, 拓展系統的應用領域, 完善相關功能,TuringChain會根據運營情況陸續開放相關介面,引入第三方開發者,共同為使用者服務。在開發者平臺上, 開發者可以方便的使用平臺提供的各項服務,完成身份註冊,許可權申請,功能測試等多項功能。擬開放API簡介如下:數字資產查詢介面:用於查詢使用者地址上的數字資產資訊。
數字資產轉賬介面:用於操作使用者地址上的數字資產轉賬操作。智慧硬體音訊相關介面:用於操作智慧硬體上的音訊的搜尋,語音識別,播放,暫停等各類相關功能。智慧硬體影片相關介面:用於操作智慧硬體上的影片的搜尋,點播,直播、暫停,開啟、關閉攝像頭等各類相關功能。
智慧硬體周邊功能介面:控制,工作模式控制,周邊外設控制等。多輪對話服務配置介面:用於多輪問答的相關流程配置,使用者可根據自己的需求,在系統上設計多輪對話詳細內容。領域知識圖譜查詢介面:用於查詢已經稽覈透過的知識圖譜內容, 開發者可以根據已經稽覈透過的知識圖譜,來為自己的應用做判斷依據。
智慧合約匯入介面:用於匯入編寫好的智慧合約到主鏈或者側鏈上。一旦成功上傳,不可更改。邏輯路徑配置介面,使用者可以更改介面,配置使用知識圖譜推理的具體模式和流程。用於自有業務邏輯,後續會根據運營情況不斷增加。7. TuringChain的應用商店應用程式申請經過稽覈後,相關的資訊會登記在主鏈上,一旦上傳不可修改。使用者可以透過token購買應用商店中的應用程式,獲得相應服務。應用程式的開發者會根據使用者購買服務的數量獲得相應的token收入。8. TuringChain的地址管理和交易機制· 使用者地址的管理:
使用者在主鏈上可以生成多個主鏈地址。每一個主鏈地址生成的同時,必須繫結在確定的一個側鏈上。該繫結資訊會在地址初始化時寫入主鏈,驗證生效後不可更改。如果使用者想同時使用多個側鏈上的功能,需要申請生成多個主鏈地址。主鏈地址的合法性除符合地址生成的規則外,還必須保證該地址已經繫結了側鏈。沒有繫結側鏈的地址會被認定為非法地址。使用者可以透過DAPP和其他工具管理自己申請的地址。· 主鏈與側鏈的時間同步機制:為了保證整個區塊鏈系統的高效有序執行,TuringChain提供硬體的授時伺服器用於授時工作,最大限度的讓主鏈和側鏈的時鐘保持同步。· 智慧代理:
智慧代理是側鏈和主鏈直接資訊同步的橋樑,也是資訊保安的防火牆。定期將側鏈的最新區塊推送到主鏈,同時將其他側鏈傳送過來的交易同步到本地側鏈區塊。將側鏈的知識團體內部資訊和主鏈全體使用者資訊做隔離。某一條側鏈的故障不會影響其他側鏈。側鏈與主鏈資訊的同步機制:側鏈上已經被成功校驗打包的資訊,根據主鏈整體的執行情況,透過智慧代理按照時間視窗,同步到主鏈上。每條側鏈會有一主一備兩個智慧代理,確保服務的可用性。側鏈內部資產交易:由於知識團體的組織特性,大部分的交易都會發生在團體內部。當側鏈核心節點檢測到交易雙方地址都屬於側鏈內部時,可以進行下一步交易驗證工作,生效後會把交易結果寫入區塊。新的區塊會按照生成的順序,將雙方地址的最新資訊同步到主鏈。不同側鏈間的資產交易:
當不同側鏈的地址需要資產交易時, 需要透過智慧代理完成操作。為了提示安全性,在不同側鏈的跨鏈交易中做出以下約束:消費的發起方的交易申請只能透過該地址所在的側鏈發起,主連結收;被動的收入方的交易,只能透過主鏈發起,側連結收。具體流程如下:假設1號側鏈中的地址A,需要轉賬10個token到側鏈B中的地址B。1. 1號側鏈中的核心節點首先對由地址A發出的交易的目的地進行驗證,當發現這是一條跨鏈交易時,會將此資訊發給1號側鏈中的智慧代理。同時對A地址的支出操作進行鎖定。2. 1號側鏈中的智慧代理收到該交易後,首先會查詢主鏈驗證B地址的合法性。如果B地址無效則返回錯誤,同時解除對A地址的支出操作鎖定,此條交易作廢。
如果B地址有效,則1號側鏈的智慧代理會給1號側鏈的核心節點反饋資訊,核心節點將此交易驗證打包。如果驗證打包正確,A地址中的10個token轉賬生效。同時解鎖對A地址的支出操作的鎖定。A地址的資產狀況更新。如果驗證打包發生錯誤,則該交易取消,同時解除對A地址的支出操作鎖定。3. 1號側鏈的節點將該交易驗證打包完成後。等到下一個主鏈同步時間視窗,1號側鏈的智慧代理會將這個時間視窗的所有交易資料同步到主鏈,其中包含該跨鏈交易。4. 主鏈核心節點收到1號側鏈的同步資訊後,會對1號側鏈發來的同步資訊進行驗證,如果驗證發生錯誤,主鏈會發出回滾指令,1號側鏈的智慧代理收到資訊後,會轉發給1號側鏈的核心節點,通知核心節點進入異常處理流程。如果驗證正確,主鏈核心節點會將該交易打包進主鏈的區塊。形成最終結果。5. 2號側鏈定期透過智慧代理和主鏈交換資料,更新主鏈資訊時,收到該跨鏈交易後,將新增的交易發給2號側鏈的核心節點,由核心節點驗證後,打包進2號側鏈。然後B地址可以查到由A地址轉賬過來的10個token。由於此交易已經進行了兩次驗證,該跨鏈交易對於2號側鏈屬於接收方, 故不進行再次驗證, 直接打包進區塊。且做上標記,不再反向同步回主鏈。
9. TuringChain的角色構成(社群角色)服務消費者TuringChain的軟體和硬體產品使用者, 是最終的服務消費者。整個社群體系內的人數佔比最多。是整個社羣的基石。知識裁定者(別稱導師:指群體中有智慧的權威人士):在某個或者某幾個知識領域內的資深人士, 得到本知識團體內成員的認可。擁有TuringChain開放的相關知識裁定的權利(比如知識點的正確與否,是否上線,是否同意建立知識連線等)。為整個領域的知識正確性, 完整性貢獻自己的力量。必須得到知識團體內的成員一定數量的投票方可擔任,如果無法滿足知識團體成員的要求,也可以被投票罷免。知識校驗者
有相關知識背景的人士, 願意貢獻自己的時間和能力, 完成TuringChain釋出的各項知識相關的任務,用於完善知識體系。得到單個知識裁定者或者多個知識校驗者的推薦方可擔任。如果無法滿足知識校驗的任務需求,可以被罷免。知識貢獻者提供相關知識點結構化知識素材或者知識領域內多媒體內容的人,並對所提交的內容承擔責任,如版權責任。開發者基於TuringChain提供的軟硬體平臺, 結合自己需求, 開發相關產品的人。TuringChain會為開發者搭建專門的平臺,只要經過相關授權,開發者的服務就可以被服務消費者使用,並獲取相應的收益。一個使用者可以在社羣中承擔多種職責,擁有多種身份。
10. 海量的內容儲存和高效的分發海量的多媒體內容的如何安全儲存和高效使用一直是行業痛點,TuringChain根據使用者的使用場景, 融合現有區塊鏈, 分散式儲存,CDN, 密碼學等多項技術, 研發多媒體內容運營平臺,具有以下特點:內容資料分佈:非結構化多媒體內容和元資訊分開管理,在安全的前提下,兼顧服務效率。透過主鏈儲存內容的特徵資訊,確保特徵資訊不被篡改。只有經過知識團體稽覈過的內容的特徵資訊才能被上傳到主鏈,內容本身才會上傳到多媒體內容的線上平臺,沒有被稽覈透過的內容不會被使用者獲取到。分散式查詢索引和標籤:
為加快內容搜尋效能,依託鏈上節點建立分散式索引系統,提高資料吞吐量和併發數。採用多種演算法對內容進行特徵提取,減少特徵資訊發生碰撞的機率。多媒 體內 容按 照分佈 演算法 , 加密 後除 了保 存到普 通節 點之 外, 還會 儲存 到TuringChain提供的智慧硬體中(比如智慧音箱)。最大限度的利用社群的儲存和頻寬資源,提升產品的使用者體驗。同時保障了多媒體內容的安全,避免被濫用。支援多維度內容標籤標註,滿足不同使用者不同應用場景下的個性化需求。激勵機制-去中心化的頻寬方案:同時為了激勵頻寬和儲存資源的貢獻者,TuringChain將對每位貢獻者的頻寬和儲存資源貢獻量進行計量,包括持有計量,流通計量兩種基礎計量方式。持有計量會統計內容在節點上儲存的容量和時間,持有內容容量越多,時間越長, 獲得的獎勵越多;
流通計量會統計節點對內容的貢獻(內容上傳)和消費(內容下載)的情況,內容貢獻大於內容消費的部分計入節點的獎勵。分發加速機制-去中心化的下載方案:採用CDN+P2P融合技術對多媒體內容進行加速,一方面提升靜態多媒體內容的分發速度,當使用者點播內容時,會找到離使用者最近的節點群組獲取內容,能很快的完成資料載入;另一方面可以對實時流媒體內容進行加速, 將實時流媒體經過hash演算法分片處理,根據每個節點的儲存和頻寬情況,動態將分片透過不同的通道傳輸到使用者終端,能大大提升音訊直播,影片直播等實時流媒體應用場景的速度。10. TuringChain內容管理內容的貢獻和版權
所有知識團體成員都可以貢獻本領域相關的多媒體內容。版權相關問題由提交者負責 , TuringChain擁 有 該 內 容 的 使 用 權 , 如 果 該 多 媒 體 內 容 牽 涉 版 權 糾 紛 ,TuringChain會將該多媒體內容立即下線。直到版權糾紛解決。內容的稽覈多媒體內容必須經過至少一位導師團成員稽覈後方可上線, 作為臨時內容, 播放100次以後沒有投訴方可變成長期服務內容。如果播放過程中有投訴,但是超過三分之一的導師團成員支援的情況下,也可以變成長期服務內容。但是不會對提出投訴的知識團體成員開放。內容貢獻者的激勵貢獻多媒體內容可以獲得token的激勵,激勵額度與該內容被收聽,收藏,好評等互動行為的情況相關,被越多人消費,引起越多人好評的內容能獲得更多的收益,具體激勵政策在上線後公佈。並根據運營情況調整。11. TuringChain釋出機制
TuringChain的主鏈和側鏈是採用開源的Docker 容器的方式來發布程式,降低參與者的門檻。TuringChain會針對不同的知識團體釋出配置好個性化資訊的Docker IMG映象檔案,能夠使TuringChain的應用執行環境保持統一,且可以獨立升級。只要執行的主機上安裝有Docker的執行環境即可執行TuringChain的程式。TuringChain整合Docker 容器的方案能夠隨著Docker專案的發展而逐步完善。產品架構體系

1. 技術及產品框架

展現層

作為使用者人機互動的入口之一,包括手機端DAPP,使用者社羣;專業使用者和後臺管理的PC端入口。採用H5技術實現,選取跨平臺前端框架,提高開發效率。

硬體部分: 由上海、深圳、臺灣等多地硬體專家聯合傾力打造。採用麥克風陣列,結合專有語音處理晶片,實現高效的語音識別和降噪效果。專門設計的音腔系統, 結合高規格的揚聲器,給使用者創造優質的聽覺體驗。音箱為第一款硬體產品,後續會擴充套件到更多的可穿戴智慧硬體。 

介面及元件層

作為展現層和後端資料系統的橋樑,我們採用微服務的架構體系,為每項功能做充分最佳化。包括高效能RPC框架,高效能的RESTful服務框架等。

知識點查詢:泛指知識點相關的各類查詢,是系統知識圖譜對外的功能抽象。

多國語音合成:實現將AI系統準備回答的文字資訊到轉換成語音的功能,根據使用者發展情況逐步增加多國語言。針對知識團體的需求可以開發知名佈道者的專屬語音庫。身份認證:每一個系統的接入者都必須經過身份認證,不對未認證授權的使用者提供任何服務。

人機互動:系統定義的人機互動的基礎模式呼叫介面。

第三方開發者接入:非知識世界相關的常規智慧音箱的功能點,透過接入第三方資源解決,比如天氣查詢,訂票查詢,鬧鐘設定,路線查詢等通用服務。

資產管理:社羣使用者價值流動,資產管理相關的操作介面,每一次token操作都需要到底層區塊鏈上做相關驗證,確保安全性,合法性。 

2. 知識層(AI素材層)

實體-關係抽取:作為知識圖譜的基礎組成部分,是AI系統的基礎資料來源。我們利用多種人工智慧演算法對經典文件(該文件由合作的知識團體指定並授權提供)進行自動化詞條建模和抽取,包括但不限於以下方法:

按 需 抽 取 —Bootstrapping ; 知 識 監 督 抽 取 —Distant Supervision ; LSTM- CRF;

RDF框架簡介

時空關係抽取: 作為人類認識世界的重要維度, 時間-空間一直伴隨著人類的發展程序。透過時空關係抽取,進而構建AI系統的基礎的時空思維模式。是整個系統的重要組成部分。

透過時空關係抽取, 我們可以為知識世界的事件, 人物, 地理建立相關的資料脈絡,然後解構歷史資料,形成深層次的歷史洞察,最終形成多維時間-地理資訊索引, 構建知識領域的地理資訊的變遷記錄。同時將知識團體中的全部知識行為也關聯到到時空關係上。讓它們內容可呈現,過程可追溯,資料可比較。 

知識圖譜簡介

知識圖譜是一種語義網路,即一個具有圖結構的知識庫,這裡圖的節點可以是概念(比如說大學),可以是例項(比如說北京大學),可以是一個文字描述(比如說一個數字,一個日期,一個字串),而圖的邊就是一個關係(比如說林欣 就職於華東師範大學,這裡“就職於”就是一個關係)。

語義網路的表達能力非常強,很多的知識都可以用語義網路來表達。同時語義網路可以有邏輯推理能力,而推理可以透過規則來實現和父子節點的繼承實現。

知識抽取和標註

知識的抽取和標註會用到多種AI演算法,協同工作,不僅僅依靠深度神經網路技術可以大大提升知識的準確性,降低噪聲的影響,避免開放領域抽取資料帶來的問題。 知識抽取和標註(深度神經網路)

知識稽覈驗證:作為知識體系的核心知識框架的共識判斷機制,知識稽覈驗證功能非常重要。除了利用現有AI體系中的評估方法外,最重要的是加入了導師會共識判定機制。根據知識點的複雜程度,需要的做出相同判斷的導師數量要求不同,越複雜的知識點,需要達成做出相同判斷的導師數量要求越多。特別是針對知識體系中重要知識點, 必須同一知識團體的導師全部做出相同判斷方可透過。

知識世界中有爭議的問題,我們採取的個性化多個答案版本共存的模式,滿足不同知識團體的個性化需求。

為了保證知識的準確性,每一個加入導師會成員都必須經過實名制認證,導師賬號登陸系統時需要經過更多的驗證步驟,來確認導師身份。比普通使用者要經過更嚴格的身份稽覈,以免權力被濫用。

3. 邏輯層(AI、資料層)

語義理解:作為人機互動的基礎模組,會使用當前AI領域最新的研究成果。綜合多條件參與的實時情境判斷, 結合智慧硬體採集到的各類資訊, 根據使用者輸入語言或文字,結合知識團體的語境,做出最合乎邏輯的判斷。然後針對語義理解探測出的使用者意圖,匹配知識圖譜,給出答案。以下是部分相關技術簡介:

基於CCG(Combinatory Categorical Grammars )的語義解析:組合範疇語法組合範疇語法(CCG)是範疇語法的一個現代分支。由於它呈現優秀的計算特徵,近年來得到國外計算語言學界的廣泛關注和應用。組合範疇語法是一種適度的上下文自由文法,它在句法和語義之間有一個透明的介面,能夠在同一框架下統一刻畫自然語言中的不連續結構、無界限依存、非正常語序等現象,並可從已有的轉換生成語法樹庫轉換成CCG樹庫,從中提取CCG詞庫, 效率很高。

基於句子重寫的語義解析:將多種表達相同含義的句子透過語義歸一化的方法,轉化成一種標準的解析結果。

問答模版:針對使用者提出的問題,需要根據人類習慣的溝通方式建立模版,進行匹配,然後根據AI系統學習到的知識給出答案。系統會維護一個非常大的模版庫。並會隨著使用者的增加不斷完善。

多層次邏輯樹驗證:由於人類知識的複雜性,認知策略的多元性,導致少量規則無法應對人類的對話場景, 而依賴深度學習訓練出來的結果, 一旦離開了訓練資料的場景,泛化能力會迅速下降。我們透過構建多層次邏輯樹,並行的對對話過程中涉及到的知識、概念、邏輯關係進行實時計算,最大程度的模擬人類考慮問題的方式,得出最合乎人類邏輯的結果。

4. 價值層(鏈層)

見第三章描述

5. 物理層

物理層是整個AI加區塊鏈系統的物理承載層, 是提供優質服務的基石。為了整體的TCO保持在一個合理水平,同時兼顧架構的伸縮性,我們採取混合雲的架構模式。在自有託管機房,大量採用刀鋒伺服器組建叢集。為提高關鍵儲存裝置的IO效能,採用高效能PCIE快閃記憶體卡。同時採購部分通用的雲端計算服務,用於應對流量高峰。

網路部分選擇多線接入機房,併購買跨國出口頻寬,確保全球服務能力。

為了支撐海量知識的儲存, 我們基於現有的成熟的儲存引擎, 開發了適合自己應用場景的分散式儲存系統,採用多場景資料分層快取,冷熱資料分離等技術作為系統支撐。

關於更多圖靈鏈資訊:http://www.turingchain.ai/
更多區塊鏈專案介紹:http://www.qukuaiwang.com.cn/news/xiangmu 
風險提示:區塊鏈投資具有極大的風險,專案披露可能不完整或有欺騙。請在嘗試投資前確定自己承受以上風險的能力。區塊網只做專案介紹,專案真假和價值並未做任何稽覈!

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;