機器學習與情緒分析:加密資產市場中的應用與挑戰

買賣虛擬貨幣
在加密貨幣市場中,有這樣一個既有的觀點認為這個市場容易受到來自新聞和社交媒體的輿論影響。就像任何其他新興且非理性的金融市場一樣,新聞或者社交媒體中傳達出的預期之外事件將影響到金融產品的價格。因此,人們越來越寄希望於透過採用諸如情緒分析(Sentiment Analysis)等機器學習的方式來監測市場情緒與加密貨幣和數字代幣之間可能存在的聯絡。儘管這種方式很重要,但人們採用的大多數情緒分析的方法都太淺顯了,以至於這些分析很難形成有實踐意義的結論,甚至常常形成具有誤導性的結論。如何有效的透過情緒分析來評估一項資產未來的價格走勢是具有挑戰性的,而這項挑戰也並非是在加密領域中所獨有的。在大多數情況下,透過文字情緒來產生有價值的洞見是一項非常困難的任務,這需要用到自然語言處理 (NLP) 模型對特定金融領域進行最佳化。大型量化對沖基金公司聘請大量機器學習領域的專家來訓練 NLP 模型以用於特定任務,比如說對收入報告進行分析,其目的在於能夠讓他們在一項中頻交易(medium frequency trade)中獲得優勢。對加密資產進行有效的情緒分析要求機器學習是有深度的和嚴密性的。為進一步闡述上述觀點,我們不妨從對情緒分析的特點開始,漸進式地加深對情緒分析的瞭解。淺談情緒分析在著名歷史劇《黎塞留》的第二幕的第二場中,英國劇作家愛德華·布林沃-李頓寫出了經典名句:“文字的力量勝於武力(The pen is mightier than the sword)”。蒼海浮沉,歷經百年,用這一經典名句來概括情緒分析的重要性似乎再恰當不過。相較於肢體語言,有時感情於字裡行間中更能影響人們的行為。僅從概念上來看,情緒分析從屬於 NLP ,它更專注於識別文字交流中存在的情緒狀態。不同於一般看法,情緒分析不僅僅是一門技術,它還是深度學習領域裡的一個子類,用於甄別文字資料中的各類情緒因素。從這個角度來說,我們姑且可以認為以下幾種情緒分析與智慧加密資產相關。
· 極性分析(Polarity Analysis):這類情緒分析將文字情緒劃分為:積極、消極和中性。比如在大多數情緒分析模型中,“比特幣價格的止跌企穩提升市場信心”這句話就被歸類為積極類。· 情緒/語氣分析(Emotion/Tone Analysis):不同於對文字進行總體歸類,這種分析方式致力於對特定語境下所呈現的不同感情進行打分。情緒分析演算法通常聚焦於難過、開心或憤怒等情緒。例如:“比特幣止損後大幅回升”將會被認定是情緒高漲。· 情緒面分析(Aspect Sentiment Analysis):這種型別的情緒分析聚焦於對一句話中特定主體的情緒進行解讀,而並非籠統的將一句話視作一整個部分。舉例來說:在“ Bakkt 期貨市場的出現對於比特幣市場具有里程碑式的意義”這句話中,情緒面分析將會對與“ Bakkt 期貨”相關的內容進行情緒分析,而不是對整句話進行分析。根據以上分析,我們可以清楚的看到將情緒分析用於加密資產的好處。儘管如此,在對這類技術嚐鮮之前,我們還應該考慮其中存在的風險因素。文章內容的上下文、主觀性、反語甚至是語法錯誤都可能讓最好的 NLP 演算法失效。加密資產的情緒分析加密資產是一種新的資產類別,這種資產現在依舊受到金融市場的非理性因素影響,同時它也缺乏有效的資訊披露渠道。從這個觀點來看,認為像情緒分析等 NLP 技術能夠識別 alpha 或聰明 beta(smart beta)因子以預測加密資產的行為變化情況的這種觀點僅僅是符合邏輯的,但與現實情況略有差異。(CoinDesk 中文版注:alpha 指的是資產獲得的超額收益,而 beta 指的是一種評估證券系統性風險的工具,用以度量一種證券或一個投資證券組合相對總體市場的波動性。)
當把情緒分析技術應用於加密資產時,我們可能會主要遇到兩種型別的挑戰:1、將主流 NLP 技術應用於特定領域(如加密資產分析)時面臨的挑戰2、錯誤的理解了新聞和社交媒體中所反映出來的真實情緒含義第一個挑戰幾乎可以被視為是快速發展的 NLP 技術的一個預期外的副作用。如今,對於開發人員來說透過調取簡單的應用程式程式設計介面 (API) 從而將情緒分析技術應用於實踐是相對容易的,在這一過程中,API 呼叫者不需要具備任何有關深度學習的專業技能。儘管透過呼叫 NLP 的 API 能夠對一個普通句子的情緒進行有效分析,但是當試圖從一句特定語句中推斷出特定領域的相關資訊時,這些 API 的表現是相當糟糕的。比如說,分析“比特幣 ETF 可能即將獲批”這句話,需要 NLP 模型對特定市場下的專業術語的語義非常精通,並且能從非常微觀的層面,而並非僅從整句話中,對語境中的情緒進行推斷。第二個挑戰來自於對新聞和社交媒體評論中所反饋出情緒的錯誤識別。作為資訊的一個來源,新聞所包含的資訊是相當豐富的但是在進行情緒分析是也可以說是相當無用。其直觀的原因是:好的新聞中所包含的情緒應該是中立的。社交媒體的內容表現形式則截然相反。推特(Twitter)或者電報(Telegram) 中關於加密貨幣的觀點通常會包含一些情緒,但就大多數情況而言,這些評論都是基於對一些公眾普遍關切的重大資訊的情緒反饋,這就意味著這些情緒裡面並沒有包含有價值的資訊。除此以外,來自社交媒體的評論往往是嘈雜和相對主觀的,這可能將會誤導情緒分析的結果。
從純技術的角度來說,為加密資產搭建有效的情緒分析模型需要對模型進行加密市場專業術語的訓練,同時也需要將新聞作為資訊來源和社交媒體作為情緒放大器進行分析。然而,當我們將情緒分析模型應用於加密資產領域時,我們目前面對的最大的心理誤區之一就是我們是否克服了這項技術挑戰。市場與情緒影響的謬論市場情緒影響謬論描述的是一種不好的或者是非理性的情形,比如說在新興的金融市場領域,投資者們認為情緒分數和金融資產的價格變動之間有直接的相關性。為了闡述這樣一種動態行為經濟學,我們假設你正在使用分析工具對最近推特上關於比特幣的情緒進行分析。從心理上來說,大多數投資者傾向於將市場情緒解讀為領先指標:· 如果市場情緒是積極的,那麼就意味著看好後市· 如果市場情緒是消極的,那麼就意味著看空後市但是,當你的模型用於分析公開的重大資訊時,以下非直覺的情緒分析應該作為滯後指標:
· 如果市場情緒表示樂觀,但是市場價格並未上升,這意味著熊市的來臨· 如果市場情緒表示悲觀,但是市場價格並未下降,這意味著牛市的來臨當意識到情緒—價格關係的非一致性時,這使得情緒分析不再被視作市場領指標,而是當作交易策略中的一種相關因子進行分析。從情緒分析到市場影響分析從資訊的角度來看,加密資產市場是複雜且充滿不確定因素的。就情緒分析而言,多種因素混雜其中對當前的分析模型而言是一個噩夢。我們或許應該開發一種更全面的分析方法,而並非僅僅專注於市場情緒分析。情緒與市場的影響指標在長期來看,是集極性(消極、積極、中立)分析、情緒(不安的、興奮的、悲傷的等)分析以及基於情緒面(主題、主體等)分析於一體的。這個方法要求訓練模型精通於加密資產的動態變化,從而在特定市場環境下對市場情緒進行分析。情緒與市場的影響模型這一觀點在概念上不算特別:量化情緒、情緒和話題組合在特定市場條件下對加密資產的影響。這一方法的部分優點在於它並不像目前大多數情緒分析模型一樣是不受監督的;它能夠透過訓練獲得加密市場特定領域的知識。比如說,我們可以透過訓練讓模型瞭解到對中國在加密資產市場投資進行樂觀的報道可能給上週處於相對熊市的市場帶來積極的影響。情緒與市場的影響分析模型的核心原則就是將情緒分析模型對特定加密市場的分析置於特定的語境之中。
在加密資產市場領域,情緒分析可能仍將是人們熱衷談論的頭條話題。然而,為了讓其行之有效,這些模型需要更深入的加強機器學習的嚴密性以及增加基於特定動態加密資產市場之上的知識儲備。隨著市場的發展,我們可能會看見情緒分析技術由簡單的線性分析轉變為透過對加密資產市場領域特定話題的有效量化從而形成對市場的全面分析。Jesus Rodriguez(耶穌·羅德里格斯)是區塊鏈智慧基礎設施平臺 IntoTheBlock 的技術長和聯合創始人,同時也是 Invector 實驗室的首席科學家。同時,他是加密貨幣和人工智慧領域的活躍投資者、演講者和寫作者。

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;