我们要使用的几个组件为Hadoop 2.6,HBase 1.0.0,MySQL 8,zookeeper 3.4.5,kafka 2.1.0,Flink 1.13,Canal 1.1.5。为了方便,这里都使用伪集群和单机安装。
“我马上就要 37 岁了,我也不清楚自己到底还能坚持奋斗几年,指不定再干几年突然就失去动力了,所以我不想把时间浪费在大公司里和别人拼看谁更能熬。”...
来源:https://blog.csdn.net/weixin_41605937/article/details/110933984
在云数据库发展和国产化替代的双重驱动下,中国数据库需求迎来爆发式增长,市场潜力巨大。腾讯云深耕数据库领域十余年,服务客户数已经超过50万。2020年,腾讯云数据库进入Gartner数据库魔力象限,正式步入世界顶级数据库厂商...
一家快递公司的服务质量主要从快递的配送时间、快递包裹的破损率以及快递员的服务态度这三个方面上体现。本文主要针对快递的配送时间做数据分析,本次分析主要针对一线城市之间的路线转运、转运次数和时效展开,同城寄件...
hbase的内部使用KeyValue的形式存储,其key时rowKey:family:column:logTime,value是其存储的内容。
分布式场景下如何进行快照读是一个很常见的问题,因为在这种场景下极易读取到分布式事务的“中间状态”。针对这一点,腾讯云数据库TDSQL设计了全局一致性读方案,解决了分布式节点间数据的读一致性问题。 近日腾讯云数据库...
一篇关于字节跳动基于 Apache Hudi 的实时数据湖平台 ByteLake 的分享。
该文档主要通过使用HBase快照导出历史全量数据并还原到新的HBase集群,然后改造源生的ExportSnapshot类,通过比较变化的文件实现导出增量,并最终实现HBase跨集群的增量备份和还原。...
本文为 TiDB Hackathon 2020 比赛中 TiFlink 项目最新进展的介绍,使用 TiKV 和 Flink 实现了强一致的物化视图的功能。