粗略地看出运维应该做的事情包括一下几项: 部署:包括基础设施的资源部署、软件环境的部署 业务上线:代码发布,手工>半自动>全自动 稳定运行:保障用户进入网站页面后能一直顺利地完成整个业务流程 监控:监控运行过程中的各种状态,告警配置 备份:系统备份,数据备份,配置信息备份等等,全量、增量、差异
性能优化:出现问题时能进行运维侧的优化,可帮助研发优化代码性能,容量不够时可快速扩容 故障处理:出现故障后能快速定位问题点,故障总结与知识库沉淀 数据分析反馈:对线上运行的状态能进行充分分析,把有用结果反馈给研发和产品,推动产品进行下一次迭代