DeFi新玩法丨看Reflexer如何將PID控制理論應用於加密貨幣

買賣虛擬貨幣

寫在前面:從與美元掛鉤的穩定幣到近期火熱的演算法穩定幣Fei,“穩定”資產還可以有新的玩法嗎?來看看Reflexer是如何將PID控制理論應用於加密貨幣的吧。注:Reflexer是一個旨在打造第一個只支援ETH的去中心化,非掛鉤穩定資產RAI的平臺。RAI可以作為其他DeFi協議的更 "穩定 "的抵押品(與ETH或BTC相比),或作為內含利率的穩定資產。值得注意的是,官方指出,RAI並不屬於穩定幣 ,其背後的系統也只關心市場價格儘可能地接近贖回價格。PID控制,是最早發展起來的控制策略之一,由於其演算法簡單、魯棒性好和可靠性高,被廣泛應用於工業過程控制,至今仍有90%左右的控制迴路具有PID結構。簡單的說,根據給定值和實際輸出值構成控制偏差,將偏差按比例、積分和微分透過線性組合構成控制量,對被控物件進行控制。

以下為全文翻譯:

這篇作品深入探討了BlockScience團隊與Reflexer實驗室合作開展的工程設計工作,重點是在2021年2月17日主網啟動前對RAI系統進行引數化。涵蓋概念包括PID控制器、治理面、不確定性下的引數選擇、控制器壓力測試和安全系統推出。

1

前言

web3領域已經成為了許多方向快速進行金融實驗的基礎。許多專案都在為其代幣尋求價格穩定(任何有用的貨幣都應該如此),並且經常以不同的方式進行。從外部貨幣掛鉤到重定價機制,有許多關於 "穩定 "的嘗試,但RAI是第一個使用既有控制理論走向反思性(或自我反思性)穩定價格的代幣系統的此類代幣。與現有的與法幣掛鉤的系統相比,RAI可以 "減震ETH",因為穩定控制器可以減弱基礎資產引起的價格波動,而不需要明確的掛鉤。

更具體地說,透過在系統設計中利用比例-積分-微分控制器(PID)控制器,RAI可以為以太坊DeFi生態系統提供一種不與任何外部資產掛鉤的低波動性儲備資產。在各種裝置中部署PID控制器的現有工程實踐深度為我們提供了堅實的工程基礎,因而我們可以從中考慮RAI的設計。

2

複雜的系統

最佳化複雜的系統基礎設施以平衡多個利益相關者的需求是工程設計的一項壯舉。它需要對系統目標、約束條件和利益相關者需求的理解,以及對所涉及的權衡進行全面分析。建模和模擬的工具,如cadCAD,可以很好地幫助我們管理複雜性和平衡最佳化,以確保首選結果。

這就需要我們深刻理解系統目標以及實現這些目標需要應用的機制所涉及的引數。在本節中,我們將研究RAI系統的各種目標,以及涉及哪些引數,包括受控和不受控。

RAI分析儀表盤向終端使用者展示相關的系統指標。這些同樣的指標透過cadCAD模型為設計提供了資訊,甚至在RAI系統存在之前,就已經對它們進行了測量。

3

目標

RAI生態系統的目標是工程設計過程的首要考慮因素。系統目標保證了cadCAD模擬引數及指標與總體目標的一致性。RAI專案的系統目標包括:

  • 在不假設贖回價格掛鉤的情況下,平滑二級市場的價格變動。

  • 在一系列外生衝擊下,控制器的穩定性。

  • 如果二級市場違反流動性要求,可平和地啟動和關閉贖回價格調整(機制)。

系統設計的下一步是確定引數,這些引數可分為兩類:一類是在系統控制下的引數(受控引數),另一類是無法控制的引數(環境引數)。

受控引數規定了系統設計者可以選擇的關鍵特性,以實現系統目標。RAI專案控制引數包括:

  • 控制器專用引數

  • 債務市場具體引數

  • 定價預言機引數

環境引數規定了系統的外部特徵,也影響系統目標的實現。RAI專案的環境引數包括:

  • ETH價格

  • 二級市場的 "外部 "交易需求(不包括因市價與贖回價錯位而產生的 "內部 "交易需求)。

此外,衡量這些目標實現情況的指標也很重要。我們可以在給定環境引數下,根據反映系統目標的KPI彙總來選擇控制引數。RAI專案針對每個系統目標的KPI包括:

  • 響應性目標:合理的套利器和控制器對不同環境引數脈衝的響應時間。

  • 波動性目標:二級市場價格變化的統計離散性。

  • 穩定性目標:測量穩定與不穩定路徑在模擬中的相對頻率。

  • 流動性目標:二級市場滑點的可控性。

4

治理面

加密經濟系統和控制系統有一個共同的現象,就是有一組由人類設定的引數,在系統動態中編碼權衡決策。在加密經濟系統中,我們把受到人類監督的引數稱為治理面。

明確治理面很重要,而且在可能的情況下,重要的是,調整這種引數的效果相對直接。通常情況下,治理的概念被用作一個籠統的概念,假設人類將擁有專門知識、規程和協調,以就未來對這些引數的更改達成一致。

在實踐中,目標是保持較小的治理面,以減少治理行動的頻率和複雜性。此外,前期基於模型的系統工程工作可以幫助確定初始引數,以制定推出計劃和(或)最大限度地減少未來變化的規模。

5

瞭解並選擇控制器型別

RAI是一種創新的加密經濟系統,它使用PID控制器的變體作為維持市場價格穩定的手段。PID控制器是最常見的一類控制器。它利用比例(P)、積分(I)和微分(D)來影響時間序列的未來值。

PID控制器的一個強大特點是,即使在沒有預測的情況下,它也能不斷地適應,因為誤差的增加往往會使它的適應強度更高。具體來說,P是對眼前測量的一種理解,而I是對過去的理解,D則是與未來的預期變化有關。

對於D而言,透過外推預期變化,有可能降低無噪聲(理想化)穩態誤差率,但代價是對突發變動的敏感性。一般來說,微分對市場價格中經常出現的噪聲和波動測量很敏感。在經濟環境中,D可能成為攻擊向量。

鑑於這些考慮,(我們)決定將分析重點放在P和I上,並將D設為零。下文將簡要介紹用於評價啟動時RAI引數備選方案的分析種類。

探索P和PI變數,為RAI啟動進行預調

迄今為止,RAI僅為了響應動態的簡單性而使用P(Kp);然而,由於已知比例控制器會受到穩態誤差的影響,因此也需要包括一個積分項。雖然積分控制器可以有效地處理穩態誤差,但它們很容易受到wind-up(飽和)的影響,即積分項的累積會導致控制動作的偏差。為了應對這種情況,我們還必須考慮一種抗wind-up(飽和)機制。因此,積分洩漏率被納入我們的引數選擇空間。

6

惡意鯨魚測試

如果不瞭解大型代幣持有者('鯨魚')的潛在影響,任何關於價格穩定性的實驗都是不完整的。在下面的場景中,我們將設想一個名為'白鯨'的惡意鯨魚購買了大部分的RAI供應,並利用它強行將RAI的市場價格保持在一個恆定的水平。

在下面的例子中,我們考慮了5種可供選擇的控制器型別的變數(正Ki與負Ki,洩露積分器與非洩露積分器,以及零Ki),並驗證了在合理選擇引數的情況下,長期來看,鯨魚是可能會輸給控制器的。

第一個視覺化是看如果白鯨保持市場價格不變,贖回價格會發生什麼。從下圖1中可以看到,在所有測試的方案上,除了Ki為負且無洩漏項的方案外,贖回價格在2周的時間內都會趨於零,這就意味著該引數化選擇不可行。

相對於比例控制,具有正Ki項的PI控制器加速了白鯨誘導的市場暴跌。負Ki項的PI控制器可以緩衝崩潰,使系統恢復。然而,洩漏項是至關重要的,因為如果讓積分項壓倒比例項,就等於控制器向攻擊者投降--這是我們不能容忍的。幸運的是,在洩漏積分項和比例項之間的關係上有一個分析邊界,能夠確保這種情況不會發生。

在RAI經濟動態的背景下,這種情況是如何發生的?發生這種情況的原因是控制器會根據市場價格自動調整贖回率。

當選擇比例控制器(僅Kp)或帶有洩露積分項的PI控制器(Kp & Ki)時,穩態動態能包括恆定的負贖回率,著是我們在RAI生態系統中的目標。值得注意的是,如果我們排除洩漏,積分項就會產生反作用的加速效應。在Ki為正的情況下,贖回率會向負方向加速,而在Ki為負的情況下,贖回率會向正方向加速。這兩種PI(無洩漏)情況都不是特別理想的情況。

在沒有洩漏項的情況下,加入積分項有可能使RAI系統不可持續,因為很明顯,它允許對使用者進行經濟剝削,或者由於越來越大的負利率而使代幣越來越無法使用。考慮到鯨魚攻擊是真實存在的問題,這一分析表明,只有在包含抗windup(飽和)洩漏機制的情況下,P控制器是可行的,PI控制器是可行的。

7

穩態誤差測試

RAI的另一個關注點是穩態誤差;具體來說,系統有可能在沒有縮小贖回價格與市場價格之間的預期差距的情況下實現某種程度的價格穩定。事實上,在控制設計空間中引入積分項的唯一原因是為了幫助消除穩態誤差。穩態誤差問題往往是在存在噪聲或衝擊的情況下產生的。

在下圖3中,市場按照馬丁格爾過程演變。我們觀察到,Ki項往往會對贖回率產生偏差(見下圖),這種偏差可能很小,但隨著時間的推移,將導致贖回價格的巨大差異。

圖3. 即使引數選擇得當,每小時兌換率的變化幅度很小(<5e-9),但隨著時間的推移,仍會導致較大的累積誤差。

在圖4中,我們可以看到累積誤差隨時間的變化。無洩漏的正Ki傾向於增加絕對誤差(較大幅度的負誤差),而無洩漏的負Ki傾向於減少絕對誤差(較小幅度的負誤差),兩者都是相對於P控制器測量的。負Ki無洩漏的PI控制器實現了最小的絕對誤差,但由於上面討論的惡意鯨魚攻擊,我們已經排除了該設計。

在我們的例子中,相對於僅有P的控制器,加入洩露積分項的好處很小,因此需要進一步的調整,以便在穩態誤差的基礎上有意義地區分這兩種選擇。就目前而言,這意味著加入I項所增加的複雜性在短期內並不能被系統穩定性的好處所證明,在實施之前還需要在這個方向上進行更多的研究。

另一個重要的觀察是贖回價格的失控趨勢。比例控制器和有抗windup(飽和)的PI控制器能夠實現控制,而沒有抗windup(報個)的PI控制器則會失控。負Ki項會導致贖回價格發散(跑偏到無窮大),而正Ki項會導致贖回價格收斂到0。

圖5.非洩漏的PI控制器會在贖回價格上產生漂移,即使累積價格誤差的大小仍然是有界的。

8

不確定性下多維繫統的引數選擇

在對控制引數進行迭代的同時,還要對RAI系統和互動作用的大量資料和複雜性進行科學分析,這就需要使用新的科學方法。

上面的簡單模型只考慮了P(I)的控制邏輯,下面用於分析的模型則包括了該背RAI的抵押債務頭寸以及作為RAI二級市場(和價格感測器)的流動性池服務

為此,BlockScience開發了 "不確定性下的引數選擇 "方法,以實現資料驅動的知情決策。這篇關於 "在不確定性下執行引數選擇"的文章對它以及相關步驟和挑戰進行了簡要描述。

RAI引數選擇

在下面一節中,我們將提供一些非詳盡的例子,說明在更廣泛的RAI系統模型上執行的一些計算實驗,其中包括SAFEs系統和流動性池(ETH/RAI Uniswap例項)。

場景測試

我們的工作流程規定了一些測試場景,以將系統目標與可測量的KPI,以及最終與選定的控制引數聯絡起來。所執行的場景包括:

  1. "合理性檢驗",以確保系統的Plant表現符合預期;這將考慮控制器關閉的情況,唯一的不確定性來源是ETH價格的變動。

  2. 衝擊檢驗,即引入外生過程的預設變化,衡量系統的反應能力,以及

  3. 軌跡抽樣,即蒙特卡洛在許多隨機過程實現上執行,在各種環境條件下對反映系統目標的關鍵績效指標進行測量和評價。

"合理性檢驗"測試

要測試的基線場景是債務和二級市場系統在沒有控制器的情況下自行執行。這種測試是為了確保 "Plant "模型在使用它來評估控制器之前正常工作。

這個合理性檢驗透過固定贖回價格來複制'掛鉤到法幣'的控制器。在這種情況下,系統應該達到一種狀態,即ETH的價格變動會被'傳遞'到市場價格上,而贖回價格固定在其初始條件下(這種情況下,RAI是Reflexer在釋出時設定的值,3.14美元/RAI)。"合理性檢驗"的結果見下圖6。

圖6:在PID控制器關閉的情況下,將生成的ETH價格訊號引入模型,在RAI的市場價格上產生相應的變動。

如圖6所示,在控制器關閉的情況下,ETH價格產生的變動會在RAI的市場價格中產生相應的變動,並有輕微的向上漂移(具體到ETH價格的衝擊過程實現)。觀察到的動態與同類系統(如單一抵押品DAI)中的動態相似。

衝擊測試的攻擊和失效模式

與任何綜合系統設計一樣,我們需要了解我們系統的侷限性,以及在什麼情況下會出現故障。衝擊測試從實現外部過程的一次性變化開始,例如ETH的價格,並檢查由此產生的對系統動態的影響。衝擊測試對於選擇能保持系統穩定的引數範圍特別有用,即保持價格和代幣餘額不至於跑到無窮大或為零。

下面是一個例子,比如,兩週後ETH價格突然下跌30%。我們可以看到,在Kp=2e-07和5e-09的情況下,對PI變數的影響是失控的,而那些由引數建議給出的值則保持穩定和有界。

圖7:2周後ETH價格階梯變化下贖回價格與市場價格的衝擊分析。綠色為洩露PI控制器的可行引數範圍,紅色為失敗模式的例子。

建議引數範圍

基於不確定性工作流程下的引數選擇,我們確定P控制器是最簡單和最安全的網路啟動配置,並進一步觀察到,如果我們希望進一步減少穩態誤差,可以新增一個積分,但只有當洩漏項被包括在內,並進一步滿足條件Kp > -Ki /(1 - �),其中α是洩漏積分引數使才可以。

下圖8是使用引數值取自推薦範圍的模擬示例,其中比例項為正,積分項為負,表現出穩定性--控制器的作用是減弱外生隨機過程的變化,如ETH價格。在這種情況下,Kp項比Ki項強3個數量級以上,積分項每期洩漏1/1000的值。由此產生的系統在穩態時的表現與純P控制器相當(如下圖所示),但如果出現穩態誤差,則有額外的能力來消除它們。

圖8:贖回價格與ETH價格的比較,使用推薦引數的實現。

圖9:模擬RAI流動資金餘額與RAI債務餘額的實現情況

9

逐步推出

在建立和部署新的金融系統時,我們需要進行漸進式的測試和推廣,以確保系統安全,然後再向更多使用者和更多資本開放。

2020年10月,ProtoRAI(PRAI)進行了一個激勵性的主網測試,以低債務上限的方式啟動,用於測試系統行為,併為更大規模的正式RAI系統啟動提供參考。這裡的目的是在全面部署之前,觀察小規模低質押的情況。

RAI網路於2021年2月17日上線,初始配置只有比例控制器Kp項。該系統表現出預期的行為,與我們在比例控制器情況下預期的結果一致。

截至2021年4月2日,每個RAI分析儀表盤的價格

繼續監測實時資料,並將其與系統模型相結合,將揭示是否值得納入綜合控制項Ki及其洩漏的 "抗飽和"機制。這將增加系統的複雜性,但也可以確保長期的可持續性,從而在RAI系統的生命週期內促進治理最小化。

10

治理最小化

試圖透過忽略治理面來實現治理最小化,就好比上了一輛自動駕駛汽車,卻無法指示汽車導航,讓它帶你到哪裡去。

在實踐中,治理最小化首先要有一個定義明確的治理面,然後是關於誰、何時以及如何改變引數的明確程式。成功的治理最小化意味著做出更少、更小、更明確的改變,並減少業務開銷。

引數完全不耦合的情況很少;更多的時候,適當的值是相互關聯的,就像我們看到的Kp、Ki和α(洩露積分引數)。模型在監測系統健康方面發揮著重要的作用,因為它們可以幫助抑制為了治理行動而採取的治理行動,這實際上是將系統置於風險之中,同時反過來幫助確定何時需要採取行動,有足夠的預警來規劃、測試和執行有效的干預措施。

11

下一步

鑑於我們已經有了RAI動態和主網釋出的全功能模型,我們接下來要擴大現有模型的規模,使其與實時資料相結合,為持續監測提供資訊。此後還要作出決定,要從衝擊和事件中學習,以提高我們對周圍複雜的新動態的理解。

結論

在這篇文章中,我們總結了RAI穩定性控制器的引數選擇的工程工作,旨在進一步教育和告知以太坊社羣關於計算機輔助設計在複雜系統中的重要性。

透過介紹PID控制器的概念和它在RAI生態系統中的引數化,以及對系統進行電池衝擊和靈敏度測試以瞭解系統的響應情況,我們更好地瞭解了RAI如何應對系統控制之外的各種攻擊和外生衝擊。

最終,Reflexer團隊的目標是提供一種低波動性、最小化治理、穩定價格的資產,供以太坊生態系統使用。儘管存在不確定性,但只要有嚴格的控制理論基礎,這些特性就可以變得可靠。


本公眾號所載文章中觀點僅代表原作者個人立場,不代表巴位元資訊立場。投資者不應將文中觀點、結論為作出投資決策的惟一參考因素,亦不應認為文中觀點可以取代自己的判斷。在決定投資前,如有需要,投資者務必向專業人士諮詢並謹慎決策。

作者:Yangz,來源:巴位元資訊

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读