加密貨幣博弈論

買賣虛擬貨幣

加密貨幣博弈論

是什麼使區塊鏈技術成為這樣一個突破?看看現實世界,法幣如何維持和儲存。無論你是誰,你的錢將被儲存在一箇中心化的地方,如銀行。這個模式的問題在於,你把錢交給一個實體,出於各種原因,它有被盜用風險。區塊鏈透過在內部完全去中心化和無腐敗化來解決這個問題。它實現這一點的方式是,結合密碼學和博弈論。

什麼是市場結構?

理解這個概念之前,先了解一些基礎知識。任何市場的組織和基本特徵都稱為市場結構。市場結構基於許多因素進行差異化,如生產者數量,價格控制和進入門檻。基於這些因素,市場結構有四種:

  • 完全競爭(Perfect Competition)
  • 壟斷(Monopoly)
  • 壟斷性競爭(Monopolistic Competition)
  • 寡頭壟斷(Oligopoly)

完全競爭

任何人都很容易進入這個市場,個人賣家在產品價格上沒有任何權力。以芒果為例,任何人都很容易進入這個市場,必須要做的便是種植芒果,他們不能隨意改變芒果價格,如果一個人以 10 美元價格出售一個芒果,買家可以從以 5 美元出售芒果的人那裡買單。

壟斷

壟斷是完全競爭的極地般對立面。這是一個由一家公司主導的市場,進入門檻非常高,高到沒有其他人能進入。De beers diamonds 是壟斷市場的一個很好例子。

壟斷性競爭

這是一個有很多賣家的市場,且非常低門檻。他們的產品相似,不真正相同。想一下 pizza delivery 服務。現在,dominoes 和 pizza hut 有同樣產品,存在細微差異。顯然,其中一家可以根據客戶喜好等因素稍微提高產品價格。不過,如果 dominoes 的比薩餅價格太高,人們就會直接去 pizza hut 購買。 因此,如果 dominoes 和 pizza hut 都開始過度收費,由於進入門檻非常低,另一位玩家可以進入並吸引走所有客戶。

寡頭壟斷

寡頭壟斷是由幾個市場參與者主導的市場,進入門檻很高。 寡頭壟斷的最佳例子之一是智慧手機市場。市場以蘋果,三星等少數公司為主導。很像壟斷競爭,產品相似但不完全相同。雖然這的確給了他們一定控制價格的能力,但其實沒有太多餘地。如果明天,蘋果公司決定給 iPhone 定價 4000 美元,除蘋果狂熱分子外,絕大多數人將選擇安卓手機。顯然,他們可以隨時聚在一起,作為一個團體來一起提高價格,但這被稱為“勾結”,在許多國家,包括美國,都是非法的。

當不能透過改變價格來競爭的時候,怎麼能比競爭對手更好呢?即“非價格競爭”,這意味著競爭而不改變價格。要怎麼做?他們透過改變產品的外觀和風格,並給予獨特體驗。非價格競爭的最明顯形式是廣告。

廣告是展示產品獨特品質和推出新產品的最有效方式之一。但還是有一個問題。看過的廣告中,有多少,你還實際受其影響?有可能你已經被大量廣告轟炸了,它們中,有多少是你真的記得的?如果你是寡頭壟斷的一方,並且盲目地做廣告,你將花費很多金錢。

結果,為了賺回所有這些錢,你將不得不持續提高你的產品價格。如果發生這種情況,你的買家就會去競爭對手那消費。你怎麼面對這個?如何在不損失客戶的情況下,宣傳你的產品?你必須要考慮你的競爭對手將採取的行動,做出決定。為了做到這一點,你必須使用博弈論。

博弈論簡介

博弈論是戰略決策研究。這是關於公司如何決策,同時牢記其競爭對手所將採取行動。博弈論由 John Van Neumann 和 Osker Morgenstern 於 1944 年設計,被認為是壟斷市場研究領域的一個突破。

從那時起,博弈論有了自己的生命,在各種其他技術和領域中得到廣泛應用。

博弈論模型有至少 3 個組成部分:

  • 參與者:決策者。如公司經理們。
  • 策略:為進一步推動公司發展所做的決策。
  • 回報:策略結果。

在博弈論中,有兩種型別的遊戲。

  • 零和遊戲:一個玩家的收益,以另一個玩家為代價。
  • 非零和遊戲:一個玩家的收益,不以另一個玩家為代價。

怎麼應用博弈論?讓我們回到之前討論的問題,公司應不應該宣傳其產品的特定方面。假設有 A 和 B 兩家公司。

“支付矩陣”,此圖解讀如下:

  • 如果公司 A 和 B 都決定做廣告,兩者收益分別為 4 和 3。
  • 如果 A 不做廣告,B 決定做廣告,兩者收益分別是 2 和 5。
  • 如果 A 做廣告,B 不做廣告,兩者收益分別是 5 和 1。
  • 如果 A 和 B 公司都不做廣告,兩者收益分別是 3 和 2 。

A 和 B 應該採取哪一個決定?為了解決這個問題,我們需要分別看一下 A 和 B 。

首先,看 B 公司

  • 情況1:如果 A 做廣告
  • B 做廣告,收益為 3;不做廣告,收益是1。B 想獲得最好收益,就要做廣告。
  • 情況2:如果 A 不做廣告
  • B 做廣告,收益為 5;不做廣告,收益為2。B 想獲得最好收益,就要做廣告。
  • 結論:無論 A 如何,B 都應該做廣告。

現在,看 A 公司。

  • 情況1:如果B 做廣告
  • A 做廣告,收益為4;不做廣告,則為 2 。A 想獲得最好收益,就要做廣告。
  • 情況2:如果 B 不做廣告
  • 如果 A 做廣告,收益為 5;不做廣告,則為 3。A 想獲得最好收益,就要做廣告。
  • 結論:無論 B 如何,A 的最佳策略是做廣告。

所以,在這個例子中,對於 A 和 B ,最穩定狀態,將是他們都做廣告:對於 A 和 B ,這是他們的主導策略。 一個主導策略是參與者的最佳行動方式,不管對手什麼做。在這個例子中,(4,3)也稱為 Nash 平衡。

什麼是 Nash 平衡?

Nash 平衡是一個遊戲解決方案,每一個參與者都在考慮到其他所選策略的情況下,選擇各自最優策略,如果他們改變策略,則不能得到任何好處。這在分散式計算機系統(如區塊鏈)中具有巨大影響。事實上,區塊鏈是“非欺詐”的,因為整體協議遵循 Nash 平衡。現在,我們先看看 Nash平衡在博弈論概念之一中如何運轉。

囚徒困境

假設 Rob 和 Ben 在一家白酒店鋪偷竊時被抓住,在調查過程中發現,他們過去犯了更嚴重的罪行,比如銀行搶劫事件。在調查期間,警察置問他們,並向他們提出選項。

  • 選項1:如果你們兩個都不供出對方,你們都將在監獄裡待上4年。
  • 選項2:如果其中一個供出另一個,供出事實的人就會獲得 0 年監禁,另外一個獲得7年監禁。
  • 選項3:如果你們兩個都認罪,你們都會獲得 2 年監禁。

分析一下。

顯然,Rob 和 Ben 是強硬的罪犯,因為有“盜賊的榮譽”,所以他們不會供認。但讓我們深入探討一下。

如果他們都不供出對方,意味著,他們都得到 4 年監禁。然而,這是一個非常不穩定的狀態,因為他們都知道,他們有更好的交易。如果他們供出另一個人,他們將無需受監禁。

在這樣的情況下,兩人都供出對方,Nash 平衡發生了。

但這給我們帶來一個問題。

如果兩個玩家的最佳解決方案,對社會有不利影響,會怎麼樣?比如 Rob 和 Ben 正在計劃一個搶劫銀行方案。在這個假設情景中,最好和最優策略是 Rob 和 Ben 偷竊。

這就是“懲罰”想法的由來。

什麼是懲罰?

這個世界不必然是一個善良和公平的地方。人如果沒有處於“檢查 check”狀態下,通常非常腐敗。讓事情處於“檢查”之下的方式是,執行懲罰策略。

假設在以上例子中,我們有一個懲罰策略:

  • “對公共事業每-0.5的損耗,將給予-7的懲罰因子。”

如你所見,透過加入懲罰因子,Nash 平衡可能會讓對社會造成不利影響的人或事,變為對社會有利。

這在文明社會如何適用?想想一個由向人民徵稅所組建的警察部隊。在這種情況下,我們有一股專門力量,執行懲罰任務,社會參與的方式是透過支付稅收。如果你不繳納稅款,你也會受到懲罰。

“punishing the non-punishable ” 的另一個有趣例子是社會排斥。想想一個社會,一個人叫Max,犯了罪。他立即成為社會中的被遺棄者。這是社會上每個人都參與懲罰的場景。現在假設有一個人和 Max 有關聯,那麼那個人也會變“壞”,也會被社會所排斥。

Nash 平衡和懲罰的概念,在區塊鏈和保持礦工誠實方面,有很大影響。我們後會探討。在探討之前,我們必須瞭解一些更基本的博弈論模型。

謝林點(焦點)(The Schelling (Focal) Point)

經濟學家 Thomas Schelling 與一群學生進行了一次實驗,他問他們一個問題:“明天你必須在紐約遇到一個陌生人。在哪裡和什麼時候見他們呢?”他發現最常見的答案是“大中央車站,中午”,因為對於紐約人而言,大中央車站是一個自然焦點,焦點也被稱為“謝林點”。

所以,要定義一個謝林點:人們在沒有溝通的情況下,會傾向於使用這個解決方案,因為它讓人感到特別,相關或自然。

讓我們用一個遊戲來展示這個概念。假設有兩個囚犯被關押在兩個不同房間,給他們一系列隨機數字。然後告知他們要猜測另一個囚犯猜的數字,兩者之間不作任何溝通。如果他們猜到錯誤數字,他們將會被殺死(只是為了將刑罰提前)。

給他們的數字是:

  • 7816239, 676716313, 100000000 和 871823719.

你認為他們會選哪個號碼?

  • 100000000.

為什麼?因為和其餘數字相比,它是不同和特殊的,這就是為什麼它是謝林點。在我們整個歷史中,人類在不知不覺中有意識地融合在各個地方,如酒吧,教堂,社羣中心等,因為在社會上,這些地方是普遍的謝林點。

謝林點運轉的一個非常有名例子是“小雞遊戲”( “The Chicken Game”):

兩個人朝著對方騎腳踏車,如果他們碰頭,他們就死了,然而,第一個擺脫離開對面車手的人就是“小雞”。

所以,在這個遊戲中,有兩種情況可以在崩潰中結束:

  • 情況1:兩名騎手彼此相向。
  • 情況2:一名騎手左轉,另一名右轉。

Thomas Schelling 利用焦點的概念給出瞭解決方案。他說,這個遊戲的最佳解決方案是不要和另一騎手有眼神交流(即切斷與另一騎手的交流),而是關注自己的本能。由於在美國,人們靠道路右邊開車,如果我們讓本能接管,我們會自動將腳踏車轉向右側,因為這就是我們的謝林點所在。

嚴格觸發平衡(Grim Trigger Equilibrium)

為了解一個嚴格觸發平衡如何工作,我們需要考慮一個場景。想象一個君主制仍然存在的社會狀況,相信由於神的神聖權利,國王可以統治別人。然而,在這樣的社會,如果國王被殺,“神權”就會自動消失,因為每個人都明白,國王不是神聖的。這將會使所有閘門被開啟。

既然大家都明白,國王是可殺的,就會開始一個無休止的血腥革命迴圈,沒有什麼可以阻止所有後來的國王被殺害。阻止這個惡性迴圈的唯一辦法是第一次就不要殺國王,而要保持“神權”概念。這被稱為嚴格觸發平衡。將其認為是一個狀態,如果你偏離了一點點,將會導致一個無休止的迴圈遞迴懲罰。

協調問題

考慮這個矩陣:


現在,如果你看到這個矩陣,有兩個 Nash 平衡:(A,A)和(B,B),偏離任何一個狀態都不會使他們受益。這個遊戲的想法是,你如何說服人們從(A,A)走到(B,B)?如果有一小部分人參與,那麼相對簡單,你可以簡單地透過電話或電子郵件進行協調。但是,當我們談論的是一大批人時,情況將發生變化。

囚徒困境與協調問題之間的根本區別在於,囚徒困境是,兩人都必須選擇(B,B),因為即使(A,A)是一個道德上更好的解決方案, (B, B) 還是(對他們來說)最有利的選擇。在協調問題上,不是關於道德或者回報,而是一個人從一個狀態到另一個狀態的動機。為什麼一大群人會改變他們做事的方式呢?

如果只有一小部分群體改變自己的狀態,則是協調遊戲失敗的時候,如果是大部分群體改變自己的狀態,則成功。我們來看一個例子。

假設我們要將語言改為基於符號的語言。例如:

  • 原宣告:“給我你的號碼?”
  • 新宣告:“#?”

如果只有你使用這種語言,那將會失敗,因為大多數人不會理解你在說什麼,而且你會迴避此對話,因為你的收益很低,你沒有動力去改變。

但是,如果你的社會中,大多數傾向於使用這種語言,你將不得不改變你的語言,否則你將永遠無法適應社會,現在,加入動機很強。

為什麼沒有人會說中世紀英語了?如果你在這個社會上說這種語言,你就會被忽略。

有界理性(Bounded Rationality)

想象這種情況,Sarah 每天都去雜貨店買一個蘋果。她每一天做這件事,像儀式一樣。然而,她每天都面臨著一種情況。每天,當她在商店時,店主都離開 5 分鐘,並且沒有安全監控。她可以很容易地偷竊蘋果,沒人會知道。但她從來沒有這樣做。

Sarah 所做的就是這裡說的“有界理性”。有界理性基本上意味著,在給予選擇的時候,人們總是會遵循一個簡單路徑,並且總是他們所習慣的。這條路徑可能不是最適合他們的,它可能不會給他們帶來最高回報,但他們將始終遵循最簡單路徑。為什麼 Sarah 選擇了遵循她簡單的日常生活的良性道路,而不是偷竊和逃離而不會產生任何影響,因為第二種情況比她簡單的日常生活複雜一點。

現在我們已經瀏覽了一些博弈論模型,來看看它對加密貨幣的影響,以及它如何有助保持系統漂浮(keep the system floating)。

區塊鏈和加密貨幣博弈論

礦工在區塊鏈系統中有很大權力,如果他們選擇為自己個人利益而作弊,可能會給系統造成破壞。

為了緩解這種情況,區塊鏈使用博弈論機制來保持系統的防禦性。為了解博弈論如何保持礦工誠實,來看看另一個點對點系統,讓使用者一次又一次地擺脫作弊懲罰。

Torrenting 是世界上最受歡迎的點對點系統之一。使用 torrents 時,使用者有兩個角色:下載和“播種”(seeding)。下載檔案後,應透過稱為“播種”的方法將檔案共享。但是,他們不會由於“播種檔案”而得到補償,因此他們經常拒絕這樣做。大多數 torrent 使用者都是“騙子”,因為他們不會播種他們的檔案。他們可以逃避作弊懲罰,因為系統沒有一個像區塊鏈那樣的“懲罰模式”。

礦工怎麼作弊?

  • 他們可以包含一個無效交易,給自己額外幣。
  • 隨機新增區塊,而不用擔心工作量證明( Add blocks randomly without worrying about Proof of work )。
  • 在無效區塊之上挖礦,獲取更多BTC。
  • 在次優得分割槽塊之上挖礦(Mine on top of a sub-optimally scoring block)。

舉個例子。考慮以下區塊:

  • 在藍色區塊 51 中,花費 20 個比特幣獲得 500 個萊特幣。
  • 從區塊 50 建立一個新鏈(分叉鏈),在替代性區塊 51 中,他沒有執行萊特幣交易。
  • 最後他得到了他原來的 20 個比特幣和 500 個新的萊特幣。

以上就叫做“雙重花費”。顯然,在理論上,礦工可以在新的紅色鏈上,保持雙重花費並且挖掘額外比特幣。可以想像,這可能會破壞比特幣系統。

礦工為什麼不這樣做?因為他們都是善良和有榮譽感的人?你不能基於個人道德來製造一個系統,畢竟道德無法量化。這是區塊鏈真正天才的地方。區塊鏈的設計方式是自我實施的 Nash 平衡。礦工不這樣做,原因是挖礦有遞迴懲罰制度。

挖礦及懲罰制度中的 Nash 平衡

如果一個礦工建立一個無效區塊,其他人就不會在其之上開挖,因為在區塊鏈機制中,已經定義了一個規則,在無效區塊之上開挖的任何區塊都將成為無效區塊。因為這個規則,礦工將自然地忽略無效區塊,並在主鏈上繼續挖礦,也就是圖中的藍色鏈。

類似邏輯適用於次優得分割槽塊( sub-optimally scoring block)。再看看圖,沒有礦工會想在紅色區塊 52 上挖礦,因為藍色區塊 53 的分數要高於該紅色區塊( No miner will want to mine on Red Block 52 because the Blue Block 53 will have a higher score than the red block)。

這兩種情況都得到緩解,因為礦工們,作為一個組織,將選擇最穩定狀態,也就是 Nash 平衡狀態。顯然,你可以讓所有礦工都在紅色區塊上,使它成為新的區塊鏈,然而,礦工的數量如此巨大,這樣的事件根本無法協調。正如協調一致遊戲狀態,如果群眾中絕大多數人沒有改變自己的狀態,少數人就沒有任何動力去留在新狀態。想到這一點,礦工為什麼會花費所有算力和風險,而徒勞無功?

為什麼使用者會使用主鏈,而不是其他鏈?

現在,我們已經知道為什麼礦工會喜歡藍鏈……使用者呢?在遊戲中,有兩個玩家,礦工和使用者。為什麼使用者比起紅鏈,更喜歡藍鏈?再次,博弈論發揮了作用。

  • 你需要記住的第一件事是,加密貨幣具有價值,是因為人們賦予它價值。為什麼一個普通使用者會賦予從藍鏈出來的幣一個價值,而不是賦予從紅鏈出來的幣?原因很簡單,從使用者角度來看,主鏈是一個謝林點。他們賦予主鏈價值,因為對於他們而言,主鏈似乎自然且特別。
  • 有界理性:使用者更重視主鏈的另一個原因是,他們只是習慣於它。像有界理性狀態一樣,人們每次都會選擇最簡單的解決方案。透過一條更新的鏈進行轉移,將不必要地使事情複雜化。

什麼是 Proof Of Work Takeover Problem?

在我們開始解釋之前,讓我們再次回顧一下舊圖表:

Vitalik Buterin 提供了一個很好的 Takeover problem 的例子,我們將會展開說。假設有人為某項活動制定了假設性的智慧合約。合同條款如下:

  • 任何礦工都可以透過將非常大額的存款傳送進合約,以此加入活動( Any miner can join the activity by sending a very large deposit into the contract)。
  • 礦工必須將已經開採的部分已完成區塊的份額髮送到合約中(The miners must send shares of the partially completed blocks that they have mined into the contract ),並且合同對其進行驗證,還驗證你是否為礦工,驗證你是否具有足夠的雜湊算力。
  • 在系統中 60% 的礦工加入之前,你可以隨時離開(Before 60% of the miners in the system join you can leave anytime you want)。
  • 60% 的礦工加入後,你將受到合約捆綁,直到 20 個區塊被新增到硬分叉鏈,即紅鏈( After 60% of the miners join, you will be bound to the contract until the 20 blocks have been added to the hard fork chain aka the red chain)。

是的,這確實非常惡毒,你可以看到這個攻擊可能存在的問題。新鏈不僅會越來越大,越來越長,因為整個礦工的 60% 都是合約式地捆綁到這個新鏈,這將很快使原來舊鏈(藍鏈)變得無關緊要。這將使雙花遍佈各處,該貨幣價值將快速下降。

現在,你可能會問,為什麼礦工會加入這樣一個 takeover 的過程?

來看看他們的加入動機:

  • 最後可能得到獎勵。
  • 對他們而言,加入不存在風險。

他們有什麼動機遵守合約?

  • 他們一開始就存入了鉅額。
  • 再次,可能獲得巨大回報。

理論上,這樣的 takeover 可以結束任何貨幣,但這不是那麼容易發生,因為……你猜到了…… 博弈論機制。

採取嚴格觸發手段搶救( Grim Trigger argument to the rescue )

當我們第一次談到嚴格觸發因素時,想想我們的國王論證。如果一個國王被殺害和篡位,什麼能阻止新的國王被殺,阻止變成一個無止境的血腥迴圈?為了阻止這種情況發生,最好的行動方法是,第一次就不要殺死原先國王。

類似地,將此邏輯用於區塊鏈。如果一個區塊鏈被取代及摧毀,礦工轉移到一條新鏈,什麼可阻止這條新鏈被很快取代?為了阻止這些無盡迴圈發生,重要的是,第一次就不要發生這種取代行為。

然而,嚴格觸發手段確實有一些失敗之處,顯然,有些地方,它表現得非常引人注目:

  • 當礦工不與單數貨幣相捆綁時,此論點就失敗了。如果礦工正在致力於幾種貨幣,他們可以簡單地組合接管一個低價值貨幣(The argument fails when the miners are not bound to singular currency. If the miners are working on several currencies, then they can simply group to take over a low-value currency)。
  • 如果這些礦工受束縛於及忠於一個特定貨幣,這個論點就會成立。畢竟,建立和維護該貨幣的價值和合法性符合他們的直接利益。
  • 如果該貨幣需要專門的 ASICs ,嚴格觸發手段就可成立(If the currency requires specialized ASICs, then the grim trigger argument holds up)。如果一種貨幣只能由專門軟體挖掘,礦工們就會確保這種貨幣不會發生任何事情,也不會損失價值(miners will make sure that nothing happens to that particular currency and that it doesn’t lose value)。畢竟,專業 ASICs 只能用於特定貨幣。對於其他貨幣,這種專業 ASICs 就是沒用的,此外,它們成本很高。
  • 如果該種貨幣可以使用 CPUs 挖掘,這個論點則不成立。CPUs 畢竟不是很貴,它可以用於挖掘其他貨幣。
  • 然而,如果擁有 CPUs 的礦工們與該貨幣有利益相關,因為他們不想失去他們在這個貨幣上投資的權益,以上論點就成立。這是一種PoS 。

結論

可以看出,正是博弈論機制使區塊鏈如此特別。技術或機制相關,不是新的,而是這兩個概念的結合,使加密貨幣變得安全,防止內部腐化。即使比特幣和以太坊因為任何原因而失敗,由於這種路徑破壞了合作關係,加密貨幣將永遠存在下去

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;