Web 3.0 的核心理念是将数据的所有权归还给用户,允许用户控制自己的数据,在保障安全性的 前提下,实现数据的互操作性。Web 3.0 提出了一种去中心化的方案,可以应用于网络生态系统的任何部分,包括虚拟主机、存储、域名系统、应用程序和搜索功能。在这一过程中,区块链在改变传统的数据存储方法方面发挥着至关重要的作用。
近年来,区块链领域的技术不断发展,承载应用的基础设施也在不断更新迭代。区块链本质上是一个运行在分布式系统上的哈希链表。所谓哈希链表,就是在一个区块的开头部分包含上一个区块的哈希值,以此起到类似链表指针的“定位”作用,由于哈希计算的不可逆性与防碰撞性,区块链上的数据极难被某一特定组织篡改。
关于区块链基础设施建设,目前有六大问题亟待解决。
1. 能源问题
区块链依靠加密技术提供安全性,就分布式网络达成共识。通常的共识协议是“计算量证明”,以比特币为例,“挖矿”要让显卡长时间满载,功耗会相当高,电费开支也会越来越高。国内外有不少专业矿场开在水电站等电费极其低廉的地区,而更多的用户只能在家里或普通矿场内挖矿,耗费大量电力。甚至云南某小区有人进行疯狂挖矿导致小区大面积跳闸,变压器被烧毁的案例。
2.硬件问题
挖矿算法其实是本质上很简单的散列运算,但需要特别庞大的工作量。因此,人们普遍采用支持大规模并行运算的GPU(显卡)而非CPU来进行挖矿。大量GPU组成的矿机成本很高,全球GPU产能有限,相当一部分被集中在矿机里,进一步推高了竞争成本。另外,还有专门为了挖矿而设计的芯片:ASIC。例如比特币采用SHA256算法,那么比特币ASIC矿机芯片就被设计为仅能计算SHA256,所以就挖矿而言,ASIC矿机芯片的性能超在算力上有绝对的优势。但ASIC设计周期很长且仅能被用于挖矿,很多人认为这种“恶性竞争”是对资源的浪费。
3.技术门槛问题
区块链是分布式、加密技术等一系列理论的集合。要理解区块链,就要理解其背后的加密和分布式原理——这是有门槛的。反之,要是不了解区块链,就看不到其带来的好处,也很难说服用户和投资者参与进区块链生态中来。
4.跨链问题
区块链是一个技术概念,而不是一个协议。不同共识下延伸出的不同区块链之间,以及同一区块链共识修改产生的硬分叉之间,理论下都是无法交互的,要形成生态只能在一个链下进行,但这样就违背了去中心化的宗旨,因此我们需要跨链技术。跨链技术可以帮助 Web 3.0 的开发者和用户在区块链的可信保障下创造价值流通。而在区块链技术应用方面,多链并存的格局预计将一直存在。不同区块链生态的 Web3.0 用户有进行交互的需求,跨链技术会在这个过程中发挥重要作用。对此,我们需要更加底层的协议。
5.安全性问题
去中心化身份(Decentralized Identification,DID)是互联网上的一个地址,DID 文件包含相关信息以实现用例,如签到、数据加密、通信等。加密证明,如数字签名,允许实体证明对这些标识符的控制。DID 可被看做 Web 3.0 中的身份中心。由于用户控制着 DID 的中枢,他们可以决定何时、与谁以及在什么条件下透露他们的数字身份要素。围绕 DID 与区块链技术,已有许多项目建成 DID 生态系统,DID 作为 Web 3.0 的基础设施之一,安全性至关重要,事实上,很多关于区块链的安全风险,都跟DID信息泄露有关。对此,我们需要更加安全的存储方式。
6.效率问题
尽管区块链有去中心化、隐私性强、共识可自然进化等好处,但效率并不是其中之一。比特币规定每十分钟生成一个新区块,每个区块最多可打包四千多份交易。这导致一次比特币交易需要至少等待一个小时才能确认成功。以太坊规定每十五秒生成一个新区块,看起来更快了,但仍然远远低于主流互联网应用。另外更多的新区块带来了更多的分叉与更多的手续费,这是一个近乎无解的问题,要是我们为了提升区块链效率而不断提升新区块的产生速度,那么我们要面对越来越多的分叉(同时出现的区块),我们不得不付出更多的交易费用补偿这些分叉(否则没人愿意打包新区块了),也要面临更严峻的网络拥堵问题。
中国电信天翼云的一份创新性产品:存储资源盘活系统,或许可以适应Web3时代下的基建。存储资源盘活系统是纯软件的存储控制器,能够安装在任意Linux服务器上,可以把各服务器中分散的磁盘整合成高性能的存储资源池,通过分布式双控制器架构保证了低延迟、高可用、易拓展的特性;通过完善的控制台、命令行与API来统一调度管理所有存储资源;通过强大的兼容性和独特的硬件异构特性充分利用全部存储资源。
在能源问题方面,存储资源盘活系统为了降低能耗、响应双碳政策,在硬件适配与软件优化方面做了很多技术创新。
芯片适配:支持ARM和X86双架构并存,利用ARM处理器的低功耗优势可以充分节省能量消耗,甚至可以采用光伏等清洁能源供电。存储介质适配:适配全磁盘存储、全闪存储、SSD/HDD混闪等多种存储节点,支持国产SSD,可以帮助产业逐步推进改造升级。SSD可以提供约10倍于HDD的性能,而功耗仅为机械盘存储的50%,有效做到低碳运转。优化EC配置策略:适配任何规模的集群,提高磁盘空间利用率。允许用户在空间利用率、性能和可靠性之间灵活选择,用户甚至能够为不同的卷指定不同的EC策略,降低存储成本和网络开销。存储资源盘活系统还优化了EC编码效率,能够提升性能的同时大幅降低CPU占用,节省集群整体能耗。优化资源使用策略:软件运行在用户态,仅在高频率读写操作时才轮询到CPU计算周期,对整体CPU计算资源使用率能做到削峰填谷、平滑占用。用户态进程级的特性,也节省了必须需要单独的计算节点(BM、VM)部署管理的资源。仅在需要读写时才对节点内特定磁盘发送指令,平时磁盘处于休眠状态降低能耗。
在硬件问题方面,存储资源盘活系统作为一组用户态进程来运行,与其他系统级、软硬件集成或云服务级软件定义的存储解决方案相比,存储资源盘活系统不依赖于任何特定版本的Linux内核或Linux发行版,不依赖或修改操作系统环境,不垄断整个硬盘驱动器,不干扰任何其他进程的执行。因此,它可以与其他应用程序同时运行在同一个Linux操作系统实例中,有效帮助用户提高现有硬件资源的利用率。存储资源盘活系统集群中的每个Linux操作系统实例可以有不同的硬件配置,例如不同数量的CPU、不同大小的内存、不同容量的本地硬盘、不同类型的存储介质,等等。矿机频繁更新,淘汰的硬件可以继续被盘活为存储资源池来“发光发热”。
在跨链问题方面,软硬解耦、易于扩展、自动化、基于策略或者应用的驱动是跨链的必要条件。就业务应用来说,即不限制上层应用,不绑定下层硬件,实现非结构化数据的协议互通;同时应具备完善的监控能力,实现应用感知。存储资源盘活系统采用了全用户态架构。可与其他进程完全共存于同一操作系统中。支持部署全闪存或混合 SSD/HDD 存储节点,允许集群中每个实例具有不同的硬件配置,这种我们称其为硬件异构的特性,适合区块链机房分布繁杂的场景。存储资源盘活系统通过标准iSCSI协议提供分布式块存储服务,可以与多种虚拟化平台,数据库系统,应用系统整合,几乎实现了跨链的所有要求。
在安全问题方面,存储资源盘活系统从安装到运行,可使用非root权限,可以轻松的部署到任何Linux操作系统中,让用户快速体验。如果用户不喜欢,杀死进程、删除目录即可,系统不留任何残渣。存储资源盘活系统采用了容错架构设计。能兼容各种不可靠环境,并确保在不可靠环境下数据不丢。不用担心DID信息残留造成的信息泄露风险。存储资源盘活系统将文件打碎成若干数据块并进行分布式存储,具有良好的防篡改作用。整个存储网络中存在多个备份,也可以设置纠删码数据冗余策略进一步提高安全性,这样可以有效避免战争、自然灾害等外在原因造成的中心数据丢失,有助于提高长期数据保存的安全性。解压后只需几个命令行就可以完成配置,还搭配有直观的图形化界面,最大可能避免了因配置错误而导致的安全问题。
在效率问题方面,存储资源盘活系统不要求节点配置NTP服务,可以容忍CPU忽然变慢,节点间网络忽然变慢,磁盘忽然变慢等各种复杂局面。相对于业内其他软件定义存储,软件可靠依靠硬件可靠保证而言。存储资源盘活系统实现纯软件层面容错能力,适合区块链高并发,经常回滚的场景。
存储资源盘活系统作为纯软件的分布式块存储产品,增加存储节点即可实现动态扩容,天然适合区块链。其硬件异构、支持iSCSI、全用户态架构的特性支持跨链应用。其进程级、容错架构、冗余保护的特性降低了DID等敏感信息损坏或遭受攻击的风险。可以作为Web3新基建中的核心组成部分。