Як насправді працює видобуток біткойнів

По мірі наближення біткойнів до загальноприйнятого прийняття та визнання, його основна модель безпеки, що характеризується як майнінг, потрапляє під центр уваги і все більше вивчається щодня.

Люди все більше стурбовані та цікавляться впливом видобутку біткойнів на навколишнє середовище, безпекою та ступенем децентралізації базової моделі та навіть потенційним впливом прориву квантових обчислень на майбутнє біткойнів та інших криптовалют.

Часто перевірку роботи описують як "криптографічну головоломку", але що це за головоломка, насправді?

Для того, щоб по-справжньому зрозуміти ці запитання (і будь-які можливі відповіді), вам слід мати фундаментальне розуміння самого майнінгу біткойнів та його розвитку.

У цій статті буде розглянуто всі технічні компоненти та рухомі частини перевірки роботи, а також те, як вони безперешкодно синхронізуються між собою, щоб дозволити Біткойну стати децентралізованою платформою, якою він є сьогодні.

Чому майнінг працює: криптографічний односторонній хешування

Біткойн-блокчейн часто описують як базу даних, яка є криптографічно безпечною і, згодом, незмінною. Основною технологією, яка забезпечує цю незмінність та безпеку, є криптографічне хешування.

Криптографічна хеш-функція - це математична функція, яка, простіше кажучи, приймає будь-який вхід і відображає його у рядок фіксованого розміру.

Однак існують чотири особливі властивості цих функцій, які роблять їх безцінними для мережі Біткойн. Вони є:

  1. Детермінований - для будь-якого входу в криптографічну хеш-функцію отриманий результат завжди буде однаковим.
  2. Швидкий - обчислення результату хеш-функції, якщо вводити будь-який вхід, є відносно швидким процесом (не потребує важких обчислень)
  3. Унікальний - Кожне введення у функцію повинно призводити до абсолютно випадкового та унікального виводу (іншими словами, жоден з двох входів не призводить до однакових результатів)
  4. Незворотно - з огляду на вихід хеш-функції вихідний вхід отримати не вдається

Ці правила забезпечують основу, яка дозволяє майнінгу біткойнів захистити мережу.

Зокрема, творець біткойн-протоколу Сатоші Накомото вибрав використовувати хеш-функцію SHA-256 як основу для видобутку біткойнів. Це специфічна криптографічна хеш-функція, математично доведена, що вона має вищевказані властивості. Він завжди виводить 256-бітове число (найосновніша одиниця обчислення), яке зазвичай представлене в шістнадцятковій системі числення з 64 символами для зручності читання.

Вихід функції SHA-256 зазвичай називають хешем її введення.

Ось приклад введення та виведення функції SHA-256 (ви можете спробувати це тут):

Input to SHA-256:  Output to SHA-256: 77077b1f4c3ad44c83dc0bdb8d937e9b71c0ef07a35c2664bb7da85be738eacf

Цікаво, що в більшості місць, де в протоколі біткойн використовується хешування , використовується подвійне хешування . Це означає, що вихід вихідної функції SHA-256 потім повертається назад у функцію SHA-256, щоб отримати інший результат. Ось як виглядає цей процес:

Input to SHA-256(first round):  Output (first round): 77077b1f4c3ad44c83dc0bdb8d937e9b71c0ef07a35c2664bb7da85be738eacf Input to SHA-256 (second round): 77077b1f4c3ad44c83dc0bdb8d937e9b71c0ef07a35c2664bb7da85be738eacf Output (second round and final result): 3c6c55b0e4b607b672b50f04e028a6951aed6dc97b91e103fb0f348c3f1dfa00

Подвійне хешування використовується для захисту від нападів на день народження. Атака на день народження - це сценарій, коли зловмисник може створити той самий хеш, що і інший вхід, використовуючи зовсім інший вхід (який називається колізією ). Це порушує третю властивість унікальності. Без нього два абсолютно різні блоки біткойнів можуть бути представлені абсолютно однаковим хешем, що дозволяє зловмисникам потенційно вимкнути блоки.

З функцією SHA-256 ймовірність цього нападу нескінченно мала. Якби це не було майже неможливо, SHA-256 вважався б розбитим.

Однак у минулому інші хеш-функції були "порушені". Для того, щоб захиститись від цього, що відбуватиметься з SHA-256 у майбутньому (і ефективно порушити модель безпеки біткойнів), краще хешувати хеш . Це зменшує вдвічі ймовірність зіткнення, роблячи протокол набагато безпечнішим.

На дуже високому рівні майнінг біткойнів - це система, в якій усі транзакції біткойнів надсилаються майнерам біткойнів. Майнери вибирають транзакції на один мегабайт, об’єднують їх як вхідні дані у функцію SHA-256 і намагаються знайти певний результат, який приймає мережа. Перший майнер, який знайшов цей результат і опублікував блок в мережі, отримує винагороду у вигляді комісій за транзакції та створення нових біткойнів.

Давайте зробимо крок далі і зануримось у сам біткойн-блокчейн, щоб побачити, що саме шахтарі роблять, щоб захистити мережу.

Видобуток біткойнів: технічний вступ

Видобуток корисних копалин був введений як рішення проблеми подвійних витрат. Якщо у мене є 1 біткойн, і я відправлю його Бобу, а потім спробую надіслати той самий біткойн Алісі, мережа гарантує, що буде прийнята лише одна транзакція. Це робиться за допомогою відомого процесу, який називається видобуток корисних копалин.

Перш ніж заглибитися в технічні деталі, важливо зрозуміти, чому майнінг необхідний для захисту мережі. Оскільки фіатна валюта існує зараз, валюта, яку ми маємо, створюється та перевіряється федеральним резервом. Оскільки біткойн працює за жорстких припущень про децентралізацію та консенсус, не може існувати жоден центральний орган, який підтверджує та фіксує час випуску цієї валюти та перевірки будь-яких операцій, що відбуваються з цією валютою.

Сатоші Накамото запропонував єдине відоме рішення на той час для вирішення цієї проблеми перевірки в консенсусно-орієнтованій системі. Ця схема, названа в доповіді про біткойни як доказ роботи , елегантно виправдовує те, що транзакції перевіряються тими, хто готовий витратити на це достатньо фізичної обчислювальної енергії та часу, одночасно вводячи стимул стимулювати конкуренцію на ринку. Ця конкуренція дозволяє властивості децентралізації виникати та процвітати органічно в екосистемі.

Погляд всередині блоку

Блок біткойнів складається переважно з двох компонентів:

1. Транзакції, у вигляді дерева меркла

Майнінг-комп’ютери збирають достатньо транзакцій, щоб заповнити блок і об’єднати їх у дерево меркла.

Дерево меркле є відносно простим поняттям: транзакції лежать внизу дерева як листя і хешуються за допомогою функції SHA-256. Комбінація двох листових транзакцій знову хешується за допомогою функції SHA-256 для формування батьківського елемента листя. Цей батько постійно хешується вгору в поєднанні з іншими батьками хешованих транзакцій, поки не буде створений єдиний корінь . Хеш цього кореня фактично є унікальним поданням транзакцій, що знаходяться під ним.

Корінь дерева меркле - це поєднання хешів кожної транзакції в дереві.

Recall that for any any input to a hash function, the output is entirely unique. Therefore, once most nodes on the network receive a mined block, the root of the merkle tree hash acts as an unchangeable summary of all the transactions in that given block.

If a malicious actor were to try and change the contents of a transaction in a block, its hash would be changed. This change of a hash would be propagated up the transaction’s merkle tree until the hash of the root is changed. Any node can then quickly catch this malicious act by comparing the root of the changed block’s merkle tree to that of a valid block’s merkle tree.

2. The block header

The block header is a summary of the contents of the block itself. It contains the following six components:

  • The version of software the Bitcoin client is running
  • The timestamp of the block
  • The root of its containing transactions' merkle tree
  • The hash of the block before it
  • A nonce
  • The target

Remember that the root of the transaction merkle tree acts as an effective summary of every transaction in the block without having to look at each transaction.

The hash of the previous block before it allows the network to properly place the block in chronological order. This is where the term blockchain is derived from — each block is chained to a previous block.

The nonce and target are what make mining tick. They are the basis for solving the SHA-256 puzzle that miners need to solve.

Please note that all of this data in the block header is compressed into 80 bytes using a notation called little-endian, making the transfer of block headers between nodes a trivially efficient process. For the purposes of this explanation, we’ll ignore this compression and assume data is in its original form.

Explaining the Mining Problem

The target stored in the block header is simply a numeric value stored in bits. In traditional base 10 notation, this target ranges anywhere between 0 to somewhere in the range of 2²²⁴ (a 67+ digitnumber), depending on how many miners are competing to solve this problem at the same time.

Recall that the output of SHA-256 is just a number. The goal of a miner is to take the current block’s header, add a random number to it called the nonce, and calculate its hash. This numeric value of the hash must be smaller than the target value.

That’s all there is to it. But it’s much easier said than done.

Recall the first property of SHA-256: an input into a hash function will always result in the same output. Therefore, if the miner took the block header, hashed it, and realized that the hash value wasn’t less than the target, they would have to change the input somehow in order to try finding a hash below the target value.

This is where the nonce comes in.

The miner adds a number (starting from 0), called the nonce, to the block header, and hashes that value. If the hash value isn’t less than the target, the miner will increment the nonce by 1, add it again to the block header, and hash that changed value. This process is repeated continuously until a hash less than the target value is found.

A Mining Example

Here’s a rough approximation of what made up the first block header:

  • The merkle root of the transaction in the Genesis block:
Merkle Root: 4a5e1e4baab89f3a32518a88c31bc87f618f76673e2cc77ab2127b7afdeda33b
  • The first known Bitcoin version: 0.1.0
  • The timestamp of the block: 2009–01–03 18:15:05
  • The target (this is also the highest the target will ever be):
Target: 0x00000000FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
  • No previous block hash — this was the first block, and so this is a unique case

The final block header after adding its components together:

Let’s take this large header and compute the double-hash:

SHA-256 of header: 7d80bd12dfdccbdde2c41c9f406edfc05afb3320f5affc4f510b05a3394e1c91 SHA-256 of the previous result (final result): c5aa3150f61b752c8fb39525f911981e2f9982c8b9bc907c73914585ad2ef12b

Both the target and the output hash are incredibly large numbers when converted to base 10 (remember, over 67 digits long). Instead of trying to demonstrate the comparison of the two here, the following Python function handles the comparison instead:

def isBlockHashLessThanTarget(blockHash, target): return int(blockHash, 16) < int(target, 16)

True is returned if the hash is less than the target, false otherwise.

Here is the result with our target and block hash:

Now we take the original block hexadecimal value and add 1 to it. Here is the following result:

We then run the same hashing algorithm and comparison on this changed data. If its not below the target, keep repeating.

Once a successful hash is found, the latest nonce used to find this solution is saved within the block.

The listed nonce on the Genesis block is 2,083,236,893.

This means Satoshi Nakomoto iterated through this process over 2 billion times before he found a hash that was acceptable.

I’ve written a small Python implementation of this Genesis block mining process that can be found on my GitHub.

subhan-nadeem/bitcoin-mining-python

bitcoin-mining-python - A Python implementation of the Bitcoin mining algorithm

github.com

See how long it would take for you to successfully mine the Genesis block!

A Caveat: extraNonce

The nonce value in a block header is stored as a 32-bit number. This means that the highest nonce anybody is able to achieve is 2³² (approximately 4 billion). After 4 billion iterations, the nonce is exhausted, and if a solution is not found, miners are once again stuck.

The solution to this is to add a field to the coinbase (the transaction contents of a block, stored as the merkle tree) called the extraNonce. The size of this extraNonce is only limited by the size of block itself, and so it can be as large as miners wish as long as the block size is within protocol limits.

If all 4 billion possible values of the nonce are exhausted, the extraNonce is added and incremented to the coinbase. A new merkle root and subsequently new block header are calculated, and the nonce is iterated over once again. This process is repeated until a sufficient hash is found.

It’s best to avoid adding the extraNonce until the nonce is exhausted, because any change to the extraNonce changes the merkle tree. This requires extra computation in order to propagate the change upwards until a new root of the merkle tree is calculated.

The Miner Reward

A miner who successfully publishes a block the fastest is rewarded brand new Bitcoin, created out of thin air. That reward currently stands at 12.5 BTC. Just how do these Bitcoins come into existence?

Each miner simply adds a new output transaction to their block that attributes 12.5 Bitcoins to themselves before beginning to mine the block. The network protocol will accept this special transaction as valid upon receiving a newly validated block. This special transaction is called a generation transaction.

Its the miner’s responsibility to add this transaction into the block before mining it. There has been at least one case where miners forgot to add the reward to the transaction before mining a block, effectively destroying 12.5 BTC!

Validating Proof-of-Work

Let’s say our miner has found a hash that is less than the target. All this miner has to do is publish the mined block with the original six components to any connected nodes.

This node receiving the block will first verify the transaction set, ensuring all transactions are valid (for example, all transactions are appropriately signed, and coins aren’t being double-spent and/or being created out of thin air).

It will then simply double-hash theblock header and ensure the value is below the block’s included target value. Once the block is deemed valid, the new node will continue to propagate this block across the network until every node has an up-to-date ledger.

As you can see, newly published blocks can easily be verified by any given node. However, publishing a valid block to the network requires an incredibly large amount of computational power (thus, electricity and time). This asymmetry is what allows the network to be secured while simultaneously allowing individuals who wish to conduct economic activity on the network to do so in a relatively seamless manner.

The Block Time and Adjusting the Target

As the first miners began mining, they each monitored the block time. Each Bitcoin block has a set block time of 10 minutes. What this means is that given the current level of computing power (networkhashrate) on the network, nodes will always expect newly validated blocks to be produced every 10 minutes on average.

We can reasonably expect blocks to be produced within 10 minutes because the probability of finding a block, given the network hashrate, is known.

For example, let’s take the easiest target that’s ever existed in Bitcoin: the genesis block. The probability of any single hash being less than the easiest target is 1 in 2³². That’s one in over four billion. Therefore, we can reasonably expect somebody to run 2³² iterations of the mining problem in order to find a proper hash. Nodes on the network expected four billion of these iterations to be run across allminers on the network every 10 minutes.

If, over a large sample size of blocks, blocks start appearing faster than 10 minutes, this is a pretty clear indication that nodes on the network are iterating through four billion hashes much faster than 10 minutes. This situation prompts every node to adjust the target proportionally based on the increase (or decrease) in network power to ensure blocks continue to be produced every 10 minutes.

In actuality, nodes on the network monitor the block time across 2016 blocks, which comes out to exactly two weeks. Every two weeks, the total block time is compared to the expected block time (which is 20160 minutes).

To obtain the new target, simply multiply the existing target by the ratio of the total actual block time over the last two weeks to get the expected block time. This will adjust the target proportionally to the amount of entering or exiting computing power on the network.

The block time and the ability to easily calculate the probability of finding a valid block lets nodes easily monitor and determine the total hashpower on the network and adjust the network. No matter how much computing power is added to the network or how quickly its added, on average the block time will always remain at 10 minutes.

The current total hash rate on the network is 28.27 exahash per second. That’s 28.27 x 10¹⁸ hashes run every second across all computers on the network.

In summary

We have now comprehensively covered the following:

  • Why cryptographic one way hashing is vital to proof-of-work
  • A breakdown of the construction of a Bitcoin block
  • The actual mining process and iteration itself
  • How nodes can easily validate other blocks
  • How the network manages to maintain the algorithm and competitiveness by monitoring the block time and adjusting the target

You should now be able to understand and explain how proof-of-work actually functions and why it is considered to be an entirely secure algorithm that enables decentralization and consensus!

Follow me on Twitter and Medium if you’re interested in more in-depth and informative write-ups like these in the future!