天天看點

區塊鍊入門

區塊鍊(blockchain)是眼下的大熱門,新聞媒體大量報道,宣稱它将創造未來。

可是,簡單易懂的入門文章卻很少。區塊鍊到底是什麼,有何特别之處,很少有解釋。

區塊鍊入門

下面,我就來嘗試,寫一篇最好懂的區塊鍊教程。畢竟它也不是很難的東西,核心概念非常簡單,幾句話就能說清楚。我希望讀完本文,你不僅可以了解區塊鍊,還會明白什麼是挖礦、為什麼挖礦越來越難等問題。

需要說明的是,我并非這方面的專家。雖然很早就關注,但是仔細地了解區塊鍊,還是從今年初開始。文中的錯誤和不準确的地方,歡迎大家指正。

一、區塊鍊的本質

區塊鍊是什麼?一句話,它是一種特殊的分布式資料庫。

區塊鍊入門

首先,區塊鍊的主要作用是儲存資訊。任何需要儲存的資訊,都可以寫入區塊鍊,也可以從裡面讀取,是以它是資料庫。

其次,任何人都可以架設伺服器,加入區塊鍊網絡,成為一個節點。區塊鍊的世界裡面,沒有中心節點,每個節點都是平等的,都儲存着整個資料庫。你可以向任何一個節點,寫入/讀取資料,因為所有節點最後都會同步,保證區塊鍊一緻。

二、區塊鍊的最大特點

分布式資料庫并非新發明,市場上早有此類産品。但是,區塊鍊有一個革命性特點。

區塊鍊沒有管理者,它是徹底無中心的。其他的資料庫都有管理者,但是區塊鍊沒有。如果有人想對區塊鍊添加稽核,也實作不了,因為它的設計目标就是防止出現居于中心地位的管理當局。

正是因為無法管理,區塊鍊才能做到無法被控制。否則一旦大公司大集團控制了管理權,他們就會控制整個平台,其他使用者就都必須聽命于他們了。

但是,沒有了管理者,人人都可以往裡面寫入資料,怎麼才能保證資料是可信的呢?被壞人改了怎麼辦?請接着往下讀,這就是區塊鍊奇妙的地方。

三、區塊

區塊鍊由一個個區塊(block)組成。區塊很像資料庫的記錄,每次寫入資料,就是建立一個區塊。

區塊鍊入門

每個區塊包含兩個部分。

  • 區塊頭(Head):記錄目前區塊的元資訊
  • 區塊體(Body):實際資料

區塊頭包含了目前區塊的多項元資訊。

  • 生成時間
  • 實際資料(即區塊體)的 Hash
  • 上一個區塊的 Hash
  • ...

這裡,你需要了解什麼叫 

Hash

,這是了解區塊鍊必需的。

區塊鍊入門

所謂 Hash 就是計算機可以對任意内容,計算出一個長度相同的特征值。區塊鍊的 Hash 長度是256位,這就是說,不管原始内容是什麼,最後都會計算出一個256位的二進制數字。而且可以保證,隻要原始内容不同,對應的 Hash 一定是不同的。

舉例來說,字元串

123

的 Hash 是

a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0

(十六進制),轉成二進制就是256位,而且隻有

123

能得到這個 Hash。

是以,就有兩個重要的推論。

  • 推論1:每個區塊的 Hash 都是不一樣的,可以通過 Hash 辨別區塊。
  • 推論2:如果區塊的内容變了,它的 Hash 一定會改變。

四、 Hash 的不可修改性

區塊與 Hash 是一一對應的,每個區塊的 Hash 都是針對"區塊頭"(Head)計算的。

Hash = SHA256(區塊頭)

上面就是區塊 Hash 的計算公式,Hash 由區塊頭唯一決定,

SHA256

是區塊鍊的 Hash 算法。

前面說過,區塊頭包含很多内容,其中有目前區塊體的 Hash(注意是"區塊體"的 Hash,而不是整個區塊),還有上一個區塊的 Hash。這意味着,如果目前區塊的内容變了,或者上一個區塊的 Hash 變了,一定會引起目前區塊的 Hash 改變。

這一點對區塊鍊有重大意義。如果有人修改了一個區塊,該區塊的 Hash 就變了。為了讓後面的區塊還能連到它,該人必須同時修改後面所有的區塊,否則被改掉的區塊就脫離區塊鍊了。由于後面要提到的原因,Hash 的計算很耗時,同時修改多個區塊幾乎不可能發生,除非有人掌握了全網51%以上的計算能力。

正是通過這種關聯機制,區塊鍊保證了自身的可靠性,資料一旦寫入,就無法被篡改。這就像曆史一樣,發生了就是發生了,從此再無法改變。

區塊鍊入門

每個區塊都連着上一個區塊,這也是"區塊鍊"這個名字的由來。

五、采礦

由于必須保證節點之間的同步,是以新區塊的添加速度不能太快。試想一下,你剛剛同步了一個區塊,準備基于它生成下一個區塊,但這時别的節點又有新區塊生成,你不得不放棄做了一半的計算,再次去同步。因為每個區塊的後面,隻能跟着一個區塊,你永遠隻能在最新區塊的後面,生成下一個區塊。是以,你别無選擇,一聽到信号,就必須立刻同步。

是以,區塊鍊的發明者中本聰(這是假名,真實身份至今未知)故意讓添加新區塊,變得很困難。他的設計是,平均每10分鐘,全網才能生成一個新區塊,一小時也就六個。

這種産出速度不是通過指令達成的,而是故意設定了海量的計算。也就是說,隻有通過極其大量的計算,才能得到目前區塊的有效 Hash,進而把新區塊添加到區塊鍊。由于計算量太大,是以快不起來。

這個過程就叫做采礦(mining),因為計算有效 Hash 的難度,好比在全世界的沙子裡面,找到一粒符合條件的沙子。計算 Hash 的機器就叫做礦機,操作礦機的人就叫做礦工。

區塊鍊入門

六、難度系數

讀到這裡,你可能會有一個疑問,人們都說采礦很難,可是采礦不就是用計算機算出一個 Hash 嗎,這正是計算機的強項啊,怎麼會變得很難,遲遲算不出來呢?

原來不是任意一個 Hash 都可以,隻有滿足條件的 Hash 才會被區塊連結受。這個條件特别苛刻,使得絕大部分 Hash 都不滿足要求,必須重算。

原來,區塊頭包含一個

難度系數

(difficulty),這個值決定了計算 Hash 的難度。舉例來說,

第100000個區塊

的難度系數是 14484.16236122。

區塊鍊入門

區塊鍊協定規定,使用一個常量除以難度系數,可以得到目标值(target)。顯然,難度系數越大,目标值就越小。

區塊鍊入門

Hash 的有效性跟目标值密切相關,隻有小于目标值的 Hash 才是有效的,否則 Hash 無效,必須重算。由于目标值非常小,Hash 小于該值的機會極其渺茫,可能計算10億次,才算中一次。這就是采礦如此之慢的根本原因。

區塊頭裡面還有一個 Nonce 值,記錄了 Hash 重算的次數。第 100000 個區塊的 Nonce 值是

274148111

,即計算了 2.74 億次,才得到了一個有效的 Hash,該區塊才能加入區塊鍊。

七、難度系數的動态調節

就算采礦很難,但也沒法保證,正好十分鐘産出一個區塊,有時一分鐘就算出來了,有時幾個小時可能也沒結果。總體來看,随着硬體裝置的提升,以及礦機的數量增長,計算速度一定會越來越快。

為了将産出速率恒定在十分鐘,中本聰還設計了難度系數的動态調節機制。他規定,難度系數每兩周(2016個區塊)調整一次。如果這兩周裡面,區塊的平均生成速度是9分鐘,就意味着比法定速度快了10%,是以難度系數就要調高10%;如果平均生成速度是11分鐘,就意味着比法定速度慢了10%,是以難度系數就要調低10%。

難度系數越調越高(目标值越來越小),導緻了采礦越來越難。

八、區塊鍊的分叉

即使區塊鍊是可靠的,現在還有一個問題沒有解決:如果兩個人同時向區塊鍊寫入資料,也就是說,同時有兩個區塊加入,因為它們都連着前一個區塊,就形成了分叉。這時應該采納哪一個區塊呢?

區塊鍊入門

現在的規則是,新節點總是采用最長的那條區塊鍊。如果區塊鍊有分叉,将看哪個分支在分叉點後面,先達到6個新區塊(稱為"六次确認")。按照10分鐘一個區塊計算,一小時就可以确認。

區塊鍊入門

由于新區塊的生成速度由計算能力決定,是以這條規則就是說,擁有大多數計算能力的那條分支,就是正宗的比特鍊。

九、總結

區塊鍊作為無人管理的分布式資料庫,從2009年開始已經運作了8年,沒有出現大的問題。這證明它是可行的。

但是,為了保證資料的可靠性,區塊鍊也有自己的代價。一是效率,資料寫入區塊鍊,最少要等待十分鐘,所有節點都同步資料,則需要更多的時間;二是能耗,區塊的生成需要礦工進行無數無意義的計算,這是非常耗費能源的。

是以,區塊鍊的适用場景,其實非常有限。

  1. 不存在所有成員都信任的管理當局
  2. 寫入的資料不要求實時使用
  3. 挖礦的收益能夠彌補本身的成本

如果無法滿足上述的條件,那麼傳統的資料庫是更好的解決方案。

區塊鍊入門

目前,區塊鍊最大的應用場景(可能也是唯一的應用場景),就是以比特币為代表的加密貨币。

原文釋出時間為:2018年01月08日

本文作者:robertkun

本文來源:

CSDN

,如需轉載請聯系原作者。