此文介绍,腾讯云某大客户,上云前后的考虑和困局分析。
一、环境介绍
上云前,主要是依赖第三方机房和自建机房,物理服务器数量超过千台。机房承接部分数据灾备,同时双机房,实现核心业务灾备环境。
二、环境困局
1)机房环境:
硬件:风火水电,包括机房消防、市电、网络入口等,需要建设和维护能力;
合作商:机房保障与SLA,执行力、规范性、支持等约束有限;
空间限制:小机房机柜、电力等限制非常常见;
2)服务器环境:
交付周期长:采购-交付-上线,周期很长。特别是供应紧张期,机器交付遥遥无期。
资源利用率低:业务选型、资源独占需求等高;
沉没成本高:大促、旺季等引入的资源,造成的成本大大提高,且影响周期长;
3)梯队建设:
纯粹维护IDC和系统运维的同学,占运维团队(包括SRE、业务部署、工具开发、虚拟化等小组)1/3。
涉及专业人才广:网络、硬件、系统、机房基建、工具开发等同学,要求数量和质量;
三、需求破局
从业务、技术、成本几大方面考虑,上云可以带来弹性资源的便利,借助云厂商的梯队提高运维梯队层次,同时降低沉没成本。
四、上云考量
1)匹配度分析:
2)可行性分析
五、小结
随着云技术架构完善,越来越多的公司上云只是顺势而为。但上云的过程,却需要结合天时地利人和,看似水到渠成,实则是多位IT人日思夜想、出谋划策,甚至是赌上职业前景的选择。