基于多次复盘的经验汇总,仅以当前工作环境做汇总,供参考。
- 系统问题定位和解决
- 需要抓住足够多的证据链,不能臆测代码和运行机制。常用手段有 curl,日志,sentry。
- 能在本地复现不要跑到联调,降低定位成本。
- 排查超过两小时并且无清晰路径下需要扩大问题知晓范围,找人协助。
- 排查过程需要有详尽的记录,记录要字符串,减少截图数据。
- RFC 设计
- 跨系统交互需要补充系统交互图,明确系统边界。
- 需要数据备份和回滚方案,做好预案。
- 设计文档需要同步小组群。
- 评审会需要拉上 leader 知晓。
- 系统设计需要考虑兼容性和可观测性。
- 需求项目要建立人员 backup 机制。
- 系统开发
- 迁移是迁移,不要做重构,保证功能原样,同时也会降低测试成本。
- 警惕复制代码的行为,必须知晓你提交代码的逻辑和背后含义。
- 对于复杂逻辑和接口需要有详尽的注释,或者粘贴 wiki 链接说明设计。
- 新系统设计需要维护起测试用例,保证单测覆盖度,降低测试成本。
- 联调和沟通效率
- 重大项目和长耗时,需要考虑拉站会或者小黑屋。
- 能群聊的不要私聊,扩大内容的知晓范围。
- 并行工作需要分时间块,避免碎片化时间并行。
- 遇到人力合作问题,需要及时升级到 leader 支持。