機器學習能否預測加密貨幣的價格?

買賣虛擬貨幣

作者| MichelKana,Ph.D

這份實用指南提供了你預測加密貨幣價格飛速上漲所需的基礎知識。

十五年前,我開始探索數字貨幣的世界,併為一個只使用簡訊的點對點移動貨幣平臺做了原型。

最近,我的一位合作者問我,人工智慧是否可以預測加密貨幣的價格。她對區塊鏈的炒作很好奇。

經過研究,我發現預測加密貨幣價格是一個可以解決的問題,但絕對不是針對所有市場條件。

加密資產的典型預測模型將利用時間序列預測(如ARIMA、Facebook Prophet)、機器學習(如隨機森林演算法、線性迴歸)或深度學習方法(如LSTM)。

在本文中,我研究了在預測給定日期的Litecoin平均價格時,片斷插值的表現如何。

資料

我們將關注2013年4月至2021年2月期間Litecoin的歷史價格。這些資料取自coinmarketcap,並且是可以免費使用的。我將資料分為80%的訓練資料集和20%的測試資料集。後者用於評估我們預測收盤價的準確性。

加密貨幣Litecoin的價格歷史 (Source:Kaggle)

短暫的探索性資料分析顯示,平均收盤價在年初和年末是最高的。10月份最低。

多項式迴歸

你可能聽說過多項式迴歸,這可以說是建立一個階數為d的基礎來近似一個非線性函式(在我們的例子中,加密貨幣價格波動)的最簡單例子。

我對Litecoin的歷史價格進行了簡單的多項式迴歸,使用5、25和80的階數。在每種情況下,R2值將提供一些關於模型在測試資料集上的擬合度好壞的資訊。

從下面的藍線與訓練資料的擬合度來看,我們可以觀察到隨著多項式階數的增加,曲線越來越陡峭。這是由於模型複雜性增加,因為高階多項式試圖追逐訓練集中的每一個單一資料點。

第0天代表2013年4月30日,第2800天代表2021年2月28日。

特別是在有離群值的區域(圖的中間部分),高階多項式往往會向這些離群值的方向發展。因此,80階多項式的模型具有最高的方差。

它在訓練資料上的偏差也是最低的,這體現在最高的R2值上,相比之下,低階多項式的R2更低,意味著更高的偏差但更低的方差。低階多項式對訓練資料的敏感性較低。

分片插值

我發現一個更靈活的方法是使用片斷多項式來預測加密貨幣價格。

分片插值用低階多項式擬合大量的資料點。由於我們只使用低階多項式,我們消除了過度的振盪和非收斂性。

給定一組資料點,分片插值的工作原理是在每一部分資料中使用不同的多項式。

特別是,我們使用連線的分片多項式,也稱為樣條。

樣條的一個例子是下面的截斷線性函式。它在4的左邊是平的,稱為函式的結。

給定幾個結點,我們可以將多個線性基函式組合起來,並將其擬合到非線性資料中。

為了檢測加密貨幣價格中存在的高度曲線關係,我使用了一個截斷的三次函式,也叫三次樣條。

使用三次樣條,我們將資料分割成塊,並對每個塊擬合一個三次樣條。每個樣條函式在結點處連線到下一個函式。

三次樣條是加密貨幣價格變化的一個非常好的選擇,因為連線是平滑的。三次樣條的斜率和它們的第一和第二導數都是匹配的。三次樣條是3階的多項式函式,它仍然足夠小,以避免差異性。

三次B-樣條是三次樣條的一個更容易的變體,用於高效計算,因為最多有5個基函式參與貢獻插值。下面我們可以看到三次B-樣條在Litecoin價格上的表現,將結點放在四分位數上之後。

透過手動選擇結點,即在我們有一堆資料點的情況下,與根據四分位數放置結點時的值相比,我們在測試資料集上實現了更好的R2。

在邊界附近的三次樣條可能表現得很奇怪,你能夠在上面的紅色圖中注意到。所謂的自然三次樣條透過在每個極限處將一個三次多項式改為線性來強制要求函式在極限結點之外是線性的。

自然三次樣條需要選擇一個自由度。對於Litecoin的價格,我透過交叉驗證找到了最佳自由度:挑選了合適的174個結點的量子作為預測器的日期。結果與三次B-樣條相比,邊緣的差異性更小,但測試資料集的R2略差。

最後,我實現了平滑樣條,在懲罰價格變化的同時,使均方誤差最小化。

平滑樣條似乎是Litecoin價格最合適的分片插值。該模型在測試資料集上實現了迄今為止獲得的最佳R2值。

三次樣條模型令人興奮的部分是如何超越用於訓練模型的資料範圍進行推斷。

根據以預測和時間序列工作而聞名的著名統計學家Rob Jhyndman的說法,三次平滑樣條模型在預測方面可以作為與ARIMA模型等效的模型,但其引數空間受到限制。Rob聲稱,樣條模型提供了一個平滑的歷史趨勢以及線性預測函式。

我邀請你進一步試驗這個想法。我的計算機程式碼可以在網上以Jupyter Python/R Notebook形式檢視。

本文中使用的Google Colab Notebook

數字貨幣和加密貨幣,如Litecoin,是現代全球經濟中最具爭議和最複雜的技術創新。本文旨在使用一種不太流行的方法:三次樣條來預測Litecoin價格的變化。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读