“开源“的财富:链上数据是一座被忽视的金矿

几乎所有数据在区块链行业里都是公开的,这些数据是“开源“的财富。金矿就摆在人们眼前,太多创业者却“看不见“。

“开源“的财富:链上数据是一座被忽视的金矿

图片来源:

当前每一个加密风险投资基金都在追求一件事:投出下一个独角兽(价值10亿美元以上的公司)。像比特大陆这样的挖矿硬件制造商(去年曾寻求港股IPO)和Coinbase这样的交易所是首批跻身独角兽俱乐部的成功企业。

从总体上看,目前加密领域的独角兽可以分为两大类:金融服务(Coinbase,Kraken,Circle,Binance)或挖矿硬件开发(Bitmain,Bitfury)。在这两个行业中,有很多有前途的公司正在排队向独角兽努力,包括Bakkt。

然而,本文主要关注一个不同的领域,而这个领域在未来也可能会有众多独角兽兴起:区块链数据产业

“开源“的财富:链上数据是一座被忽视的金矿

1

隐藏在公开数据背后的数据

在当前这个信息时代,投资公司需要数据来获得竞争优势。在区块链世界中,几乎所有数据都是公开的,网络上发生的每笔交易都会永久记录在公共账本中,包括交易金额和涉及的地址。然而,从某种意义上说,数据仍然是“隐藏的”,因为这些存储在区块链中的数据难以处理以提取真正有用的信息。

正如TD research 合伙人和和以太坊2.0 Prysm客户端的主要开发者Raul Jordan所言,用于比特币、以太坊以及许多其他区块链的数据模型(LevelDB)都是同样为了交易完整性而优化的,并不是针对相关上的存储或检索。LevelDB不包含数据采集相关的模型,也不支持SQL查询。这使得很难从这种数据格式中提取有价值的信息,此外,研究表明LevelDB容易出现数据损坏问题,这就让处理区块链数据变得难上加难。

区块链数据被“隐藏”起来的一个明显例子是Bitcoin Private(BTCP)在2018年3月Zclassic /Bitcoin合并分叉中偷偷增发了200万BTCP(Bitcoin Private是Zcash的分叉链Zclassic和BTC合并分叉产生的,目的是为了引入零知识证明),直到2018年12月,当Coinmetrics公布了BTCP发币总数的分析时才注意到这一点。可能是因为BTCP并不是一个受欢迎的项目,所以这个事件花了大约9个月才被注意到。但是,这也表明即使是“公开的”区块链数据也需要专门的处理来挖掘有意义的信息。

2

基本数据分析 

2.1

源数据分析

处理和分析区块链数据的复杂性为数据科学家和工程师创造了一个完美的机会,让他们可以通过创立解决这些复杂问题的企业来进入区块链行业,而准确的数据分析在加密行业中有着众多的应用,下面我们来探讨这样的模式。

但在深入讨论之前,先问一个简单的问题:谁需要查询区块链数据?为什么?

答案是每个人。

事实上,每个加密用户都需要定期查询区块链数据。例如,当用户需要知道交易是否已确认时,只需连接到区块浏览器网站并使用地址或交易ID进行搜索。实际上,这背后的流程是这样的:用户“搜索”整个区块链以获得有关特定地址或交易的信息,区块浏览器公司代表用户执行了任务并交付了结果。在后台,该公司实际上没有真的去查询区块链,而是查询了自己创建的根据区块链数据派生的相关数据库。

为了cover产生的成本,公司需要收入来源。例如,最受欢迎的以太坊区块浏览器Etherscan通过广告来产生收入,而几乎所有其他的区块链数据服务企业都使用类似的收入模式,无论是DApp数据,例如Dappradar;还是不同加密货币的价格及其市值信息,例如CoinMarketCap。但在许多情况下,这种收入模式容易受到负面影响,特别是在投放的广告所宣传的项目合法性方面。

“开源“的财富:链上数据是一座被忽视的金矿

2.2

合规性分析

区块浏览器市场的总体市值已经有了百亿级别的体量,因为它们所提供的2C服务是每一个区块链的参与者都需要的,并且往后还会有很大的增长空间。

但对于一些2B的数据服务,仅仅是区块浏览器级别的数据服务还不够。投资者、基金和区块链公司需要更加复杂的数据收集和分析,例如加密货币交易所。在美国和欧洲,交易所需要进行非常密集的数据分析来配合反洗钱法的规定以保证用户不会将交易用于非法活动,例如将盗取的或者勒索的加密货币进行销赃。

这些企业还有义务保证加密货币不会被用于支持非法的企业或活动。例如Chainalysis,Elliptic这样的公司提供区块链数据分析工具,而政府和交易所也正在使用这些工具来打击非法使用加密货币的行为。大多数交易所更愿意与专业数据分析提供商进行合作,而Coinbase却决定通过收购备受争议的数据分析公司Neutrino,让企业本身就具备这样的能力。“开源“的财富:链上数据是一座被忽视的金矿

经济型数据分析

3.1

经济型数据有哪些指标?

区块链数据的另一层作用在于分析经济信号,而这正是投资者,基金以及研究机构作出投资决策时所需要的。这里有三个非常重要的数据指标:交易所数据、链上数据、链下活动数据。“开源“的财富:链上数据是一座被忽视的金矿

从经济角度来看,交易所数据是最重要的但也是最难获得的,因为作为交易所并不希望自己平台的数据轻易被挖掘。至于原因,之前Bitwise的一份报告也很明显:95%的交易所交易量是伪造的。

链下数据也同样难以获得,因为链下数据几乎涵盖了除了链上交易以外的一切信息,不仅繁杂而且难以量化。对于链下数据的收集分析目前仅仅来自于一些社区以及依靠捐赠存活的小型网站。如Coin Dance,它提供有关比特币网络及其分支上运行的节点的数量&客户端分布的历史数据。Electric Capital 的开发者活动报告则是社区贡献的一个很好的例子,这是一个依靠基金运行的范例。

3.2

经济型数据的供应商

对于数据的精确以及标准化方面的需求催生了很多相关的数据企业,值得一提的是,目前的企业关注最多的还仅仅是交易所数据和链上数据,链下数据目前还没有很明确的商业需求。

目前已经有数量众多的数据分析企业,从今年从各个渠道获取的数据质量就可以看出这一点。值得关注的平台包括Kaiko,Coinmetrics和Messari。这些公司为数据生态系统做出了卓越贡献,并且很有可能利用数据驱动投资来获得更高额的收益。

Kaiko是在交易所数据方面的领先数据供应商之一。自2014年以来,他们一直从事汇总交易所数据的业务:从30多个交易所收集1000多个加密货币的数据。Kaiko提供每月访问其交易所数据的许可证,或用于无限制的API调用的订阅服务,每月所需的费用高达2.5万欧元。有兴趣的客户还可以购买交易所中有关币的历史价格和交易体量的数据。他们还计划将其产品扩展到包含OTC数据。最近,他们向Bitwise提供了数据,来协助Bitwise作出有关交易所交易量的调查报告,得出的结论是,交易所中有95%的交易量是伪造的。该数据和分析的主要成果之一是创建“Real 10”交易量指数,该指数汇总了10个交易所的交易量,这些交易所已经证明了自己可提供可靠的交易量信息。

Messari最初的愿景是通过鼓励加密项目披露有关项目及其创始人的重要信息,如相关开发者,早期投资者,ICO和Pre-ICO详细信息,从而提高加密生态系统的透明度,并且其所披露的数据库是公开和免费的。此外,Messari的OnChainFx为主要加密货币提供了经过改进的数据源,其中包括多种创新指标,例如“Y2050”市值(截止到2050年所能释放的币的总市值)和所有列出的加密货币的“Real 10”交易量。虽然Messari不对这些公开数据和服务收费,但他们会对经过数据分析所得出的结论以及他们开发的用于分析此数据的专用工具收费。除了多个链下活动数据外,Messari还计划向其客户提供币历史价格和交易量数据。

数据分析企业面临的挑战

虽然区块链数据领域有很多优质公司,但这些公司需要解决的主要问题发掘这些数据真正的潜力。目前的数据分析可能会出现以下两个问题:

1、交易数据可能会产生误导,因为它不包括场外交易市场。许多OTC交易盘在协商价格后会通过直接转账进行交易。因为场外交易活动一般是非公开进行的,数据公司需要与多个场外交易商签订合同以获取这些数据。

2、在许多情况下,源自链上区块链数据的活动并不代表真实的经济活动。例如,当一个主体在其控制下的不同钱包之间转移币时,比如将币从交易所的热钱包移动到冷钱包,反之亦然。要剔除此类事件中的数据,需要维护每个交易所使用的不同的钱包地址列表,这通常属于数据分析公司的工作范围。

这些公司离独角兽企业有多接近?

由于其业务和客户的性质,区块链数据分析公司目前更可能接近实现数十亿美元的估值。这些公司的客户是政府,立法机构和交易所,必须遵守KYC规定;并且他们是资金充足且资金雄厚的主体,而这些主体又有利于数据分析企业发展。

数据分析企业的另一个优势是进入门槛高,减少了竞争。早期参与区块链数据分析领域的企业获取了大量历史信息,例如有关勒索软件攻击和法律条款的信息,这些信息是新进入者(或者可以说是传统的软件服务商)无法轻易获得的。

交易所数据分析公司可以提供详细的价格和交易信息,先入市场使他们更早地取得了和交易所的合作机会,从而汇总早期的交易所数据,这些数据是新的竞争对手无法获得的。当然,作为后入者,如果能在链上数据的分析和提取有效信息方面有足够的方法和技巧上的创新,或者可以提供更加深入的信息挖掘,也有机会占据一席之地。

5思考

对于区块链这样一个去中心化的世界,数据分析的供应商虽然作为一个重要的环节,但很可惜它是中心化的,有可能会因为利益而发布一些有误导性的数据分析结果。

为了避免这样的问题,在数据分析上,有没有可能也做到去中心化?能不能通过构建分散协议来以分散的方式为Web 3.0索引和查询数据,并将分析结果共享?这是一个值得思考的新模式,或许会诞生一些新的项目。

本文来自,仅作分享,存在异议请联系平台删除。本文观点不代表刺猬财经 - 刺猬区块链资讯站立场。

(0)
上一篇 2019年4月20日 上午7:45
下一篇 2019年4月20日 上午9:00

相关推荐