Ⅲ、引用兩張來自網路的圖文:
在本文當中比特幣為什麼採用UTXO模型不是重點,我們瞭解UTXO的原理即可。
二、比特幣的指令碼引擎
比特幣指令碼是非圖靈完備的。比特幣使用自行定義的一種指令碼進行交易和其他的操作,為比特幣提供有限的靈活性。實現諸如多重簽名、凍結資金等簡單功能,但更多的就不行了。
比特幣這麼做的原因是犧牲一定的完備性來保障安全性。比特幣指令碼的原理是先定義了一堆操作碼,然後指令碼引擎基於堆疊來逐個執行每個操作碼。
堆疊很好理解,佇列是先進後出,而堆疊正好相反,是先進先出,將一個元素壓入(push)堆疊後該元素會被最先彈出(pop)。
在比特幣早期的版本中傳送一筆標準轉賬(pay-to-pubkey)交易需要指令碼簽名(scriptSig)和公鑰驗證指令碼(scriptPubKey),具體處理流程如下:
先填入要執行的指令碼(Script),然後簽名(sig)和公鑰(pubKey)被壓入堆疊,然後操作碼OP_CHECKSIG會去驗證簽名等,若驗證透過就將true壓入堆疊,否則就將false壓入堆疊。
三、CVE-2010-5141漏洞分析
瞭解以上知識後就可以開始分析CVE-2010-5141漏洞了。筆者下載了存在漏洞的版本0.3.3,下載地址在github的bitcoin倉庫中找release.
script.cpp程式碼片段VerifySignature函式:
執行每個交易都會呼叫VerifySignature函式,該函式用於執行指令碼以及驗證簽名,然後給交易標註是否被花費。
首先txFrom引數是上一筆交易,txTo是正在處理的這筆交易,如果理解了上面的章節中講解過的UTXO模型,這裡就不難理解了。重點看1125行程式碼,呼叫了EvalScript函式,第一個引數是txin.scriptSig(包含簽名資訊)+分隔操作碼OP_CODESEPARATOR+ txout.scriptPunKey(包含公鑰資訊、OP_CHECKSIG指令),這些就是EvalScript函式要執行的指令碼,後面的引數可以暫時不用管,只要EvalScript函式返回true那麼這筆驗證簽名就透過了。EvalScript函式如何才能返回true?
首先堆疊不能是空的,然後棧頂強轉bool後必須是true。筆者簡單解讀為必須要有棧頂而且值不能是0。
然後再看關鍵的OP_CHECKSIG操作碼
(注:由於操作碼太多,本文針對OP_CHECKSIG操作碼)
上面程式碼不難理解,呼叫Checksig函式來驗證簽名,然後返回給FSuccess變數,如果為真就壓一個vchTrue(非0)進棧,否則就壓一個vchFalse(0)進棧;如果opcode是OP_CHECKSIGVERIFY而不是OP_CHECKSIG的話就讓vchTrue出棧,並開始執行後面的操作碼。
按照OP_CHECKSIG的正常邏輯,驗證簽名不成功的話一定會有一個vchFalse留在棧頂,雖然堆疊不為空,但是棧頂的值是0,還是會返回false。
回到之前的程式碼,EvalScript函式執行的指令碼主要由以下變數組成:
1. txin.scriptSig
2. OP_CODESEPARATOR
3. txout.scriptPubKey
第一個簽名資訊可控,第二個不用管只是一個分割符,會被刪掉,第三個不可控,因為是來自上一個交易。
第一個變數可控,而且是作為指令碼執行,所以這個變數可以不僅僅是簽名資訊,還能是opcode,這就好辦了,下面需要引用一個神奇的操作碼 OP_PUSHDATA4,我們看看比特幣0.3.3是怎麼處理這個操作碼的:
首先獲取操作碼。如果操作碼的值小於或者等於OP_PUSHDATA4的值就把vchPushValue全壓入堆疊,再跟進GetOp函式
經翻閱原始碼,發現OP_PUSHDATA4指令被定義為78,所以當函式遇到OP_PUSHDATA4時,指標會向又移78+4=82位,其中78位資料會被壓入棧,所以只要在txin.scriptSig中注入一個OP_PUSHDATA4操作碼,後面的公鑰資訊以及OP_CHECKSIG指令都會被”吃掉”並作為引數入棧,當指標走到最後時,進行最後的判斷:
1. 堆疊是否為空?不是
2. 棧頂元素是否為0?不是
於是滿足條件EvalScript函式返回true,然後VerifySignature函式也返回true,既然簽名驗證都繞過了,那別人的比特幣便可以任意花費了。
四、CVE-2010-5141漏洞修復方案
筆者下載了比特幣版本0.3.8,直接看關鍵部分程式碼
修復方案也很明確,把scriptSig和scriptPubkey分開執行,無論你scriptSig裡面有什麼也不會影響到後面的scriptPubkey執行。
寫在最後:
因為比特幣漏洞分析是從DVP第一期漏洞專題開始連載的,目前素材來自2010年,目前漏洞分析主要存在以下難點: