那些复杂的技术设计的开始离我们并不遥远

2020-12-08 17:20:09 浏览数 (1)

大家总是高估技术的复杂性和进步的速度。

我来带大家回忆一下,仅仅三五年前:

2015年腾讯居然没做多数据中心多活架构——

2015年天津港大爆炸,当时腾讯天津数据中心距离中心点仅有1.5公里,它是腾讯当时在亚洲最大云计算数据中心,2010年刚刚投入运行,共计8万平方米,约20万台服务器,腾讯内部称它为“天津数据备份中心”,承载微信、即时通讯等业务的部分数据需求。

当时巨大的冲击波使得这个数据中心的铁门都被扭曲,工作人员也因为人身安全而不得不撤出现场,如果这个数据中心出现意外,很多存储在这个数据中心的数据都没了,包括你的朋友圈数据,而且当时腾讯也没有做备份。

幸运地是,在这以后,安全问题得到了腾讯重视,后来又在贵州专门建立了新的,更大规模的数据中心。

2015年的支付宝也没好到哪里去,2015年5月27日因市政施工挖断支付宝杭州数据中心光缆,虽然它的单元化架构容灾基本成型,但还是碰到很多实际问题,花费了数小时完成切换、恢复服务,所以5月27日才成为蚂蚁的技术日,再后来,2018年云栖大会上更是现场演示了三地五活“剪网线”,达到了中国互联网的顶尖水平。

到了2017年5月9日,饿了么CTO张雪峰才宣布饿了么多活(Multi-Active IDCs/Regions)取得成功,实现首次多活生产环境全网切换(灰度)(注意:是中国首次)。

张雪峰还称,据他所知,国内日均(非峰值或大促期间)订单100万笔以上的交易平台,除阿里巴巴真正意义上实现了全网多活(不是双活),饿了么是异地多活,美团外卖是set化,两者还是有些不一样,但是在上层容错能力上,美团外卖似乎更好一些。在他看来,异地多活的难点在于技术和实施。

技术上,最重要的是实时数据强一致性,尤其对于外卖配送这种即时性非常强的业务场景来说。实施上,最大的挑战在于给高速飞行(快速产品迭代)中的飞机换发动机。

所以独立自主实现了秒级按商户、按城市、按省、按机房、按设备切换商户流量,商户和用户和设备无感知,还真的不算晚。

0 人点赞