袁煜明:比特币的十周年数据深度解析

本报告所有数据均来自于火币区块链研究院数据团队的抓取和加工,引用请注明来源“火币区块链大数据”。报告发布时间2018年12月28日,作者:袁煜明、杜海、施俊晶、王子路。

摘要

2009年1月3日,中本聪在芬兰赫尔辛基某小型服务器中挖出50枚比特币,翻开了区块链技术的序幕,时光飞梭,经历了屡次起起伏伏,比特币即将迎来创立的10周年。

火币研究院通过整理汇总十年来的比特币的数据,包括比特币网络链上数据,比特币在交易所的交易数据以及全球最早的比特币论坛Bitcointalk的论坛数据,从沉睡的比特币、转账地址类型以及论坛关注话题演变这三个方面得出了一些有趣的结论。

结论

沉睡的比特币:

1)如果将2015年1月1日作为沉睡比特币的分界线,即2015年1月1日后未转出的作为沉睡比特币。沉睡的比特币共418.8万,占目前流通比特币的24%。

2)在2018年比特币币价下跌过程中,每次经历大幅反弹时,都会有沉睡地址被大量激活;在比特币11月末价格跌破6000的心理价位支撑后,同样有大量沉睡地址被激活。

3)2009年和2010年共有187.3万个沉睡的比特币,2011年和2012年共有85万个,根据2018年沉睡激活的比例,我们推测2009和2010年大部分沉睡比特币可能已经丢失可能,2011年和2012年也有相当一部分已经丢失。

总计已经无法找回的比特币可能预计在200万-300万左右,占比特币总量约12%-18%。

比特币转账类型探究

1)2010年后P2PKH(转入公钥)完全取代了P2PK(转入公钥哈希)。取代原因两个1)P2PKH地址长度更友好 2)安全性。

2)2014年末以及2017年末:P2SH(转入脚本哈希)的崛起与爆发。P2SH的崛起,实际从侧面反映了数字资产市场中机构参与者数量的增加。

3)2017年末:P2WPKH与P2WSH(隔离见证)的出现。从交易量和交易数量看:P2WPKH和P2WSH转账正在被越来越多的比特币持有者所接受,作为小额支付或者作为中间过渡式的转账方式。但处于安全考虑,比特币持有者很少将大量比特币存放在隔离见证钱包。

最早的比特币论坛(BitoinTalk)话题趋势探究

整体而言,论坛的发帖数量和活跃度随时间呈上升趋势,每年的年度热词却有所变化。10年“货币”被提及最多,11年是“门头沟”,12至13年是“钱包”和“中本聪”,14至16年是“区块链”,17年是“隔离见证”与“分叉”,18年则是“密码”。值得一提的是,2009年的论坛一共只有7篇帖子,属于极少数极客,而仅今年就已经有接近一万篇了。比特币和区块链正在被越来越多的人所熟知认可。

1240

报告正文 

1.沉睡的比特币

1.1 沉睡比特币占所有流通比特币比例

因为1)比特币的公钥和私钥由椭圆曲线加密算法生成,私钥可推出公钥而反之不能,2)早期人们对比特币私钥保存的意识薄弱、助记词/多重签名等保险手段未得到普及,所以在比特币网络早期,一旦忘记秘钥或者丢失存储秘钥的硬件,找回比特币几乎是不可能的事情。

关于有多少比特币在沉睡,其中有多少已经永久遗失一直是数字货币爱好者们津津乐道的话题(华尔街日报在2018年7月曾预计有将近1/5的比特币已经永久遗失)。

火币研究院通过抓取比特币网络从创世区块以来所有链上数据,对未花费(unspent)的比特币数量的按时间进行类了统计。

1240

如果我们按照年份来区分,可以看出沉睡比特币有两个波峰,一个是2009年即比特币创世之年,另一个为2013年,也就是比特币迎来真正意义上的第一波大牛市,当时价格最高达到1100美金。

1240

1.2  沉睡比特币的激活规律

在将近1/4比特币流通量的沉睡比特币中,究竟有多少是忘记私钥永久遗失的比特币?沉睡的比特币的激活时间有没有规律可循?未遗失的比特币会不会集体套现对市场造成巨大冲击?带着这些问号,我们对最近一年内沉睡比特币的重新激活进行了探索。

火币研究院研究了2018年所有转账的比特币,发现共有104万个2015年1月1日后沉睡的比特币在2018年被激活,时间分布如下图。今年沉睡比特币被激活的波峰有四处,分别在1-2月,4-5月,8月与12月。

1240

如果我们再对比比特币今年的价格走势,巧合的是,今年四次激活的波峰中,前三次都正好处于比特币价格上涨/反弹的时点,比特币价格在1月处于价格顶端(17000USD)仅次于2017年12月的19000USD,随后分别在5月与8月经历两次较大的反弹。

1240

今年12月的沉睡比特币激活较为特殊,截止12月13日为止,沉睡比特币激活的数量已经远超2018年所有月份,其中有很大部分的原因是coinbase整理钱包激活大约15万-20万。去除该部分外,仍然处于今年高峰。其中已观察有部分2011-2013年的矿工地址的沉睡比特币被转出。结合比特币价格数据,不排除因为比特币跌破6000支撑位后,部分早期矿工进行恐慌性抛售。

我们发现:在2018年比特币币价下跌过程中的每次经历大幅反弹时,都会有沉睡地址的被大量激活;在比特币11月末价格跌破6000的心理支撑后同样有大量沉睡地址的激活。

1.3  永久遗失比特币预计

火币研究院进一步分析了2018年激活的沉睡比特币上次活跃时间,如图5。其中2011年之前的沉睡比特币的激活数量几乎忽略不计,主要集中于2013年与2014年。2013年和2014年的沉睡比特币重新激活百分比分别为26%与43.6%;2011年和2012年重新激活百分比为8.7%-8.8%;2009年和2010年重新激活百分比仅有0.3%与0.6%。

1240

2009年和2010年共有187.3万个沉睡的比特币,2011年和2012年共有85万个,根据2018年沉睡激活的比例,我们推测2009和2010年大部分沉睡比特币可能已经丢失可能,2011年和2012年也有相当一部分已经丢失。

我们估测:总计已经无法找回的比特币可能预计在200万-300万左右,占比特币总量约12%-18%。

2.比特币转账类型研究

比特币的主要交易格式有五类,分别是:

1、P2PK(pay to pubkey)

P2PK是最原始的一种转账方式,任何使用此方法通过P2P网络发送比特币的人都会在交易细节中向人们展示他们的公钥。

2、P2PKH(Pay to pubkey hash)

P2PKH类似于P2PK,但是在此基础上对公钥进行哈希,用来隐藏公钥提高安全性,同时也缩短地址位数。

3、P2SH(Pay to Script hash)

P2SH是一种支付给脚本哈希的转账方式,是一个强大的新型交易,它极大地简化了复杂的交易脚本,目前常用作多重签名。

4、P2WPKH(Pay to witness pubkey hash)

5、P2WSH(Pay to witness script hash)

隔离见证交易类型,只有使用P2WPKH和P2WSH这两种交易格式,才能实现扩容效果。

火币研究院通过抓取比特币创世以来所有交易脚本的余额,如图6:

1240

从比特币交易脚本维度,我们可以发现在比特币发展中三个重要的时间节点:

2.1  2010年初:P2PKH逐步取代P2PK

比特币最早期交易脚本都是P2PK,但是在2010年后P2PKH完全取代了P2PK,现在已经几乎没有比特币转账使用到P2PK了。

P2PKH(付给公钥哈希)为什么会取代P2PK(付给公钥),有以下两点优势:

-1. 公钥哈希的长度仅有20字节,而公钥的长度有65字节(或者33字节如果压缩的话)。从转账方便度更有优势。

-2. 公钥哈希是在公钥的基础上经过了SHA256和RIPEMD160的加密,理论上会比暴露公钥更为安全。

值得一提的是,比特币最早期P2PK的比特币从2012年后转出基本趋于稳定,目前仍然有将近200万左右仍未转出。

2.2  2014年末以及2017年末:P2SH的崛起与爆发

1240

标准化的多重签名的实现最早源于比特币改进协议 BIP11,由于比特币的工作机制要求币的发送者必须在交易时明确指定脚本,如果收款方使用多重签名地址,付款方需要支付给一个脚本地址,而不是一个简单的地址。增加了付款的难度。

多重签名真正被普及并被大量钱包使用在于 Pay-To-Script-Hash(P2SH)交易类型的产生,其大大简化了多重签名的执行流程。它解决了两个重要的问题1)付款方的支付工作简单化,收款方只需告诉付款方一个哈希值即可。2)实现了效率上的提升,输出脚本较小。

在《火币区块链产业专题报告:合规基础设施系列(中)–资产托管》中我们有提到:

“P2SH 样式地址的资产余额共经历了两次快速增长,第一次系 2014 年底至 2015 年初,系 P2SH 脚本出现之后被社区认可, P2SH 样式地址中比特币余额增长至 100 万个,第二次系 2017 年下半年起,真正反映了机构用户的上升,截止目前,P2SH 样式地址中比特币余额已增长至逾 500 万个。

由于多重签名优势在于安全性,防止私钥单点沦陷带来的风险,适合机构用户,因而我们认为,上述多重签名钱包数据的增长,实际从侧面反映了数字资产市场中机构参与者数量的增加,并正通过多重签名方式管理其资产。”

值得一提的是:最近一个月中,P2SH的交易方式已经占到总交易量的40%,交易笔数的37%。

2.3  2017年末:P2WPKH与P2WSH的出现

隔离见证是把脚本签名(scriptSig)信息从基本结构 (base block) 里拿出来,放在一个新的数据结构当中。做验证工作的节点和矿工也会验证这个新的数据结构里的脚本签名,以确保交易是有效的。主要用来解决交易堵塞的问题,也是为了闪电网络铺路。

隔离见证设计了两种新的交易格式,叫P2WPKH和P2WSH。

隔离见证可以让比特币全网同时存在上述四种交易格式。但是只有使用P2WPKH和P2WSH这两种交易格式,才能实现扩容效果。因为这两种隔离见证交易格式在1M区块里不包含签名数据,而是将签名另存他处。

隔离见证技术上线后,虽然P2WPKH和P2WSH地址余额在2018年12月相较2018年6月增长了将近一倍。但是目前比特币网络的P2WPKH和P2WSH地址的余额为15.5万,仅占比特币流通量的1%不到。

然而最近一个月的转账的金额和数量来看,P2WPKH的占了11%的转账金额和6%的转账数量。

1240

结合之前比特币社区有人担忧隔离见证技术存在漏洞,可能会被黑客利用偷币(虽然没有被验证),我们认为,出于安全考虑:比特币持有者很少将大量比特币存放在隔离见证钱包。但是由于手续费低,交易顺畅等优点,P2WPKH和P2WSH转账正在被越来越多的比特币持有者所接受,作为小额支付或者作为过渡式的转账方式。

3.BitcoinTalk论坛发展与演变

3.1 BitcoinTalk论坛概况

3.1.1 论坛简介

bitcointalk.org是全球最早的比特币爱好者社区,在比特币发展的初期,中本聪就曾以名为satoshi的账号在此布道。他共计发表过19篇帖子和300多次回复,但在2010年10月之后销声匿迹。著名的比特币第一笔商业交易也发生在这里,2010年5月,laszlo成功用一万枚比特币向Jercos换取了两张披萨优惠卷。

1240

3.1.2 每年话题数

BTC talk论坛每年新发起的主题数目总体成上升趋势。截至目前,2018年的新增帖子数已经是2010年的31倍。几次峰值分别出现在比特币价格波动较大的年份(2011年、2013-2014年、2017-2018年)。

1240

3.1.3 每年活跃程度

活跃度是衡量论坛参与程度的重要指标之一,在本文中取活跃度=回复量+0.1*浏览量。

汇总每年所有主题的活跃度后可以发现,2018年的表现尤为突出,为244万,是2010年比特币早期发展阶段的11倍。2017年虽然新增帖子数量很高,但活跃程度却有所欠缺。此外,2011年和2014年的表现同样亮眼。

1240

3.2 关键意见领袖

3.2.1 话题总热度与发起话题数量排名

话题总热度排名旨在汇集作者名下所有帖子的活跃度,也可以理解为影响力,筛选出论坛中的头部用户和话题领袖。除去匿名用户(Anonymous)以外,热度最高的三位分别是Gavin Andresen、Phinnaeus Gage和zhoutong。

在排行榜中,不仅有早期贡献者如satoshi、NewlibertyStandard,也有后来的话题领袖如Huobi-USD、shamzblueworld。

发帖最多的五名用户是:rickbig41, Bitcoinpro, OmegaStarScream, remotemass, alyssa85。其中rickbig41是论坛管理员。

1240

综合影响力之后可以发现,发帖数量与影响力并不构成绝对的正向关系,但高产作者的影响力普遍较高,其中不乏在热度排行榜中的意见领袖,如Phinnaeus Gage、Elwar、OmegaStarScream等。

3.2.2 意见领袖代表

1)Satoshi

中本聪的活跃时间是2010年,主要发布了一些比特币介绍、问题解答和版本更新的内容。其中热度最高的是论坛第一篇帖子:欢迎来到新的比特币论坛!共收获161个回复和63000浏览。最后一篇是比特币0.3.19版本介绍。

1240

2)Gavin Andresen

在中本聪退出之后,Gavin Andresen接任比特币开发者领导,并在2014年退出。在这段时间中他共发起了47个主题,并位列关注度排行的第一名。

Gavin的帖子大部分都是比特币版本更新的内容,还有一部分是行业动态和自己的参会行程。

3)zhoutong

周同自称是一个19岁的新加坡华人(2012年),他最早开设了比特币融资平台Bitcoinica,并围绕比特币推出了一系列衍生品。2012年Bitcoinica发布公告称遭受黑客攻击,比特币被洗劫一空,周同也在2013年消失。

Zhoutong在论坛中的帖子主要围绕Bitcoinica展开。他最后一篇帖子“我将要离开比特币”引起了激烈反响。

3.2.3 参与度最高的话题

参与度的计算方式为回复数除以浏览数,本章筛选出浏览量大于一千的主题帖进行了排名。上榜的题目大多以问句形式存在,并围绕比特币进行讨论。

1240

3.3  十年词频变化

3.3.1 出现频率最高的词

纵观BitcoinTalk十年近五万篇标题,bitcoin以25057次出现占据榜首,第二名btc则出现了3100次。排除比特币之后,词频排行如下:

1240

前三名分别是blockchain、crypto、price。一些热点事件如mtgox和segwit也出现在了榜上。

3.3.2 每年词频

2010年

这一年比特币仅被极少数极客知晓,btctalk也刚刚建立,所以讨论人数不多。因为中本聪推出比特币时将它定义为一种点对点的电子现金系统,货币、支付、系统等单词在这一年被提到最多次。

1240

2011年

门头沟(mtgox)曾经是世界上最大的比特币交易商,而2011年是它迅猛发展的一年,这一年也是交易所发展的一年,从词频中可以看出。因为各种交易平台的上线,从10年到11年,比特币相比购买披萨时的价格上涨了一万倍,最高达到31.9美元,直到门头沟爆发黑客事件。

1240

2012年

受黑客事件的影响,加密货币的安全性受到了投资者们的质疑,币价持续走低,并在2012年初跌破了2美元。人们开始不相信交易所,转而对钱包和安全性产生了需求,这一年的年度热词中,“钱包”一词占据榜首。

1240

2013年

钱包、中本聪、货币等词占据榜单前列,除了关心钱包问题外,人们开始竞相猜测中本聪的真实身份。这一年,一部分欧洲国家接连出台了比特币发行政策,比特币的价格一路走高,并在年底突破了1147美元。随着中国对比特币的影响力逐渐增加,“中国”一词被提及59次,处于排行榜前列。

1240

2014-2016年

这段时间中区块链超越中本聪和钱包,成为被提及次数最多的单词。这可能是因为14年到16年比特币市场持续低迷,一度跌至200美元,仍然坚守的人转而开始思考区块链这一革命性技术的未来。

1240

2017年

2017年隔离见证、分叉、价格新晋排行榜榜首,其中隔离见证是因为这一年关于segwit的讨论持续了很久,分叉是由于各种分叉币、山寨币的涌现,价格则是因为17年是比特币的大牛市,人们讨论币价的热情空前高涨。

1240

2018年

随着整个加密货币生态体系的逐渐完善,crypto密码和区块链以绝对优势占据了榜单的前两名,人们的目光已经不仅仅局限于比特币本身。虽然比特币在暴跌之后步入了熊市,但他所代表的去中心化理念和带来的关注永远不会消失。btctalk上每个小小的单词都是区块链发展的缩影。

1240

参考文献

[1]袁煜明、朱翊邦《火币区块链产业专题报告:合规基础设施系列(中) “——资产托管”》,火币区块链产业专题报告

[2] Andreas M. Antonopoulos,《Master Bitcoin》

[3] Arvind Narayanan, 《Bitcoin and Cryptocurrency Technologies》

[4] why is p2pkh used instead of the simpler p2pk? https://bitcoin.stackexchange.com/questions/72184/why-is-p2pkh-used-instead-of-the-simpler-p2pk?rq=1

https://www.jinse.com/bitcoin/298309.html

https://www.8btc.com/article/337069

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇