在产品的迭代和更新中,会遇到各种各样的问题或事故,为了避免同样的问题和事故再次发生,对相关的问题或事故进行及时复盘分析,总结经验,防止再次发生。
01
根本原因分析
根本原因分析(Root Cause Analysis)(RCA)是一项结构化的问题处理方法。用以逐步找出问题的原因并加以解决,而不是只关注问题的表征。它是一个系统化的问题处理过程,包括确定和分析问题原因,找到问题的解决办法,并制定问题防御措施。
根据原因分析法的目标是找出问题(发生了什么)、原因(为什么发生)、措施(什么办法能够防止问题再次发生)。
5whys分析法,又名why-why分析法,它是根本原因分析的一种具体方法,被用来识别和说明因果关系链。简单的说,就是针对问题持续地问5个为什么,不断提问为什么前一个事件会发生,直到回答“没有好的理由”或者“一个新的故障模式被发现”才停止提问。通过这样的分析思路可以找到问题深层次的根本原因和事故的漏洞。并制定相应的解决方案防止问题或事故再次发生。通常需要至少5个“为什么”,5whys不是说一定就是5个,可能是一个,也可能是10个都没有抓住问题的根源。
why-why分析法的主要部分:现状描述、原因调查、问题纠正、进行预防:
02
具体分析流程
第一步:对问题或事故进行详细描述(运用5W2H方法对问题进行详细描述,What,Who,Where,When,Why,How,How much)
- what:描述发生了什么问题;
- who:描述谁负责的、谁发现的、谁解决的;
- where:描述在哪里发生了问题;
- when:描述什么发现问题、持续了多长时间、什么时间解决问题;
- why:描述为什么会有这次事故;
- how:描述事故是怎么解决的;
- How much:描述事故造成了多少收入、用户损失(可量化的范围);
第二步:提问(为什么—为什么分析):为什么这个问题会发生?检验发现的原因是否是根本原因?
- 识别并确认导致当前问题或事故的直接原因。如果原因是可见的,验证它。如果原因不可见,考虑潜在原因并核实最可能的原因。依据事实确认直接原因可以问:
- 这个问题或事故为什么发生?
- 我能看见问题或事故的直接原因吗?
- 如果不能,还有什么潜在原因?
- 怎么核实可能的潜在原因?
- 怎么确认是否是直接原因?
- 检验回答的原因是否是导致事故的根本原因,如果不是重复上一步骤。直到找到问题发生的根本原因为止。最后通过这个过程建立根本原因的原因/效果链。检验是否是根本原因可以问:
- 处理根本原因会防止发生吗?
- 如果不能,其他的根本原因是什么?
- 我已经找到根本原因了吗?处理了根本原因可以防止问题或事故再次发生?
- 这个原因是否可以通过事实依据的因果关系链和问题或事故关联起来?
- 一般需要持续5个为什么?
第三步:找到问题的根本原因,制定计划并修复防止再次发生。
- 找到问题的根本原因后,杜绝根本原因,采用明确的手段和措施去处理问题,预防和避免类似的问题再次发生,吸取教训。
- 对采取的手段和措施需要再问问“采取后是否可以避免问题再次发生”,如果不可以,需要再寻找其他解决方案。
解决问题不能只顾解决表面原因而不去管根本原因。学会分析问题由表入里,直指问题要害,大大降低了解决问题的成本,从而间接提高了工作效率。