TStor OneCOS简介
“
TStor OneCOS海量对象存储,是基于腾讯云公有云存储架构打造的完全自研的分布式软件定义存储,轻松支持单桶万亿对象和EB级容量,集群容量无限伸缩,同时支持自研4U60高密服务器。
”
经过版本不断迭代,持续加强功能和优化性能,当前最新推出V1.1.1版本,主要更新如下:
小文件合并
处理海量小文件对于对象存储一直是一个巨大挑战,很难实现性能和空间利用率的兼得。基于云上存储实践经验,OneCOS底层Yotta存储引擎选择异步合并方式作为最佳方案。为了保证小文件写入性能,小文件使用副本方式先写入并成功返回,确保不影响写入性能。然后存储层进行异步合并,将小文件转为大对象进行沉降,大对象采用大比例EC存储,大对象组成如下:
合并后的小对象原始数据需要进行删除回收,回收机制会先进行沉降后的大对象可读测试,并通过多重检查机制验证小对象合并无误才开始进行回收操作。
在小文件合并后删除的场景,小文件合并技术实现了空洞回收能力,及时合并或释放空洞,保证空间持续性的高利用率。
存储引擎能力提升
OneCOS支持60盘位腾讯自研服务器,采用20TB大容量磁盘作为主要存储介质,极大提高存储密度。由于磁盘的IOPS性能难以满足元数据和日志等读写操作需要,因此Yotta采用更优的Nvme SSD加速技术来加速存储性能,提高WAL可用性,加快数据的写入,同时保证数据的强一致性。
WAL需要淘汰机制保证空间不被占满,为了防止WAL超过空间限制,新版本增加了“最迟避让”机制,保证WAL空间的实时可用。
数据上云
混合云和多云场景下,数据在各子系统中的流动变得非常重要。数据上云功能实现了存储桶自动同步备份对象数据到云上存储,存储不限于公有云,还包括S3兼容的私有云存储或其他存储。数据上云通过存储内部自带的上云网关实现,通过生命周期一样的使用方式就能配置上云策略,完全不用依赖第三方平台或工具,即可实现自动同步数据到云上。
数据上云实现了存储桶数据增量和全量上云多种能力,启用数据上云,对于桶中已有的数据,上云网关拉取所有对象列表进行处理。后续新对象上传成功后,对于开启数据上云的桶,也会加入上云队列,网关通过多重机制保证上云成功和准确。
WORM
WORM(write-once-read-many ),也可以叫做对象锁定(Object Lock),为存储桶设置对象锁定功能,防止对象写入后被篡改,以满足各类合规需求,如电子档案、法律文书等。WORM可以通过API和控制台高级配置进行管理。
存储桶配置对象锁定后,桶内所有对象不可删除和修改;对象存储类型不能修改;对象HTTP头部 用户元数据都不能修改,对象锁定一旦生效,不可撤销锁定。只有当存储桶为空时,可以通过删除存储桶,删除对象锁定。
对象检索
对象检索功能用于协助数据管理者更加高效的使用海量数据。OneCOS依靠事件通知功能实现对象检索能力,客户业务层不再需要元数据管理逻辑,只需要关心业务存储对接。用户开启对象检索功能后,对于后续新增的对象,不管是通过对象接口上传的数据还是生命周期删除、跨区域复制过来的对象,事件通知功能自动将对象元数据同步到检索集群。目前检索集群推荐ES(Elasticsearch ):
开启对象检索功能并配置好外部检索集群,后续新上传的对象的元数据将同步到检索集群,业务可对存储桶、对象名、标签、上传时间和对象大小等元数据信息进行检索,快速查找和使用对象。
后续我们将针对TStor OneCOS的核心能力给大家更多技术性分享,如果你想了解TStor OneCOS的更多内容,请点击[阅读原文],立即申请。