OKEx歐易“躲過”19日與24日全網故障 原因是什麼

買賣虛擬貨幣

吳說作者 | Colin Wu

本期編輯 | Colin Wu

主要採用阿里雲伺服器,以及處理高併發能力相對較強,是OKEx躲過這兩次危機的原因。

眾所周知,19日因東京AWS節點故障,幾乎所有中國交易所都出現了故障。

其中火幣傳聞由於“為了追求速度犧牲了高可用,強制要求所有服務全部遷移至單可用區,即此次故障的C區,於此同時並沒有快捷有效的緊急應對預案,一旦出現單區故障,需要將所有服務遷移出去,資料也需要重建,時間成本非常高”,導致出現了非常嚴重、時間較長的全網宕機。

尷尬的是,22日由於出現劇烈波動行情,火幣再次首先出現全網故障,幣安等緊隨其後。過去一段時間來說,只要行情出現劇烈波動,幣安往往第一個出現問題。因此何一也在社群表示,求推薦參與王者榮耀、雙十一的技術人員,來解決高併發問題。

加密貨幣交易所雖然和傳統金融軟體相比使用者數並不多,但也有很多獨特的地方,例如是7乘24小時不間斷交易、有來自全球的使用者、行情常常突發劇烈波動等。尤其是像幣安這樣的全球性交易所,更容易出現故障。

此次很多人在討論,三大交易所中近期相對低調的OKEx,確實在這兩次幾乎全網的故障中全身而退,顯得有些與眾不同。也有使用者嘲笑OKEx流量變小所致。這似乎不合邏輯,因為二線交易所例如抹茶、庫幣、Gate也多次出現了故障。

OKEx坊間傳聞更重視技術。無論如何,這兩次全網宕機OKEx能夠相對獨善其身的原因到底是什麼?我們聽聽OKEx自己是怎麼看的。吳說區塊鏈採訪了OKEx相關技術負責人,內容相對平實,以下采訪內容代表OKEx方面觀點。

1、19日AWS節點故障,OKEx為何沒有出現問題?

回覆:OKEx其實也有業務跑在AWS上,但更多服務在香港的阿里雲伺服器,所以此次沒有出現故障。選阿里雲是歷史原因,因為用得更熟悉,服務更好一些。但也不見得這是優勢,因為過往阿里雲也出現過類似的(故障)問題。無論如何,如果真的存在將所有服務遷移到單一可用區,這肯定不是一個理性的行為。

2、22日因為流量激增,OKEx沒有出現問題,原因是什麼?

回覆:我們很少因為突發的流量宕機,我們團隊還是認為,OKEx的系統穩定性會更好一些。系統要達到高等級的服務質量,是一個需要從頂層設計到體系化執行的過程。一般來說,系統服務穩定性,通常用SLA指標來衡量。比如,我們所說系統穩定性達到4個9,即99.99%,表示的含義是每年系統服務中斷的時間在50分鐘以內(指突發情況,不包括主動維護),我們可以比較接近這個數字。

3、也有觀點認為,是因為OKEx流量相對較小,所以才沒有出現宕機?

回覆:從資料上來看,OKEx現貨方面會稍低一些,但合約衍生品和競爭對手相比是可以的,還有一些優勢。不出現宕機的原因,我們認為還是自身技術能力和交易系統效能更好一些,能承擔的併發量更大。

4、OKEx其實在17-18年也出現了一些問題,但近兩年來確實相對不錯,請問是什麼原因?

回覆:我們很少因為突發的流量宕機,不過去年最後一個月故障比較多,主要是我們準備上統一賬戶,升級維護比較頻繁。

技術發展和升級有一個過程,具體的進步不太方便細說,但確實是在技術和風控上有了很多調整。

例如採用標記價格機制。在計算中採用了移動平均值機制,這一機制可以平滑過濾短時間內的合約價格波動,有效減少了市場中異常波動產生的不必要強制平倉。最新推出的底層交易系統3.0版本,相較前一版本延時降低,瞬時成交峰值超過100萬次/分鐘,相較老系統穩定性、併發能力都有很大提升。

5、統一賬戶的推進受到了很多討論,但也有人認為存在技術與風控上的難點,你怎麼看?

回覆:統一賬戶的確業務更復雜了,風控邏輯也更復雜了。統一賬戶也是有不同模式的,如果使用者選擇更激進的賬戶模式,有可能造成較大的損失,但是也有比較獨立的模式。目前統一賬戶已經上線,老使用者會陸續切換過來,我們認為技術上的難點已經解決。

根據銀保監會等五部門釋出的《關於防範以“虛擬貨幣”“區塊鏈”名義進行非法集資的風險提示》,請大家樹立正確的投資理念,本文內容報道不對任何經營與投資活動推廣進行背書,請投資者提高風險防範意識。轉載請註明來源,否則將追究法律責任。

作者:吳說區塊鏈,來源:吳說區塊鏈real

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;