FMEA是一种系统工程的可靠性分析方法,又称为失效模式及其影响分析,它主要分析所有可能产生的故障模式及其对系统造成的所有可能影响,并按每一个故障模式的严重程度,并进行分级,检测难易程度以及发生频度予以分类的一种归纳分析方法。
通常情况下,FMEA分析表包括以下几个要素:
1、功能点;2、故障模式;3、故障影响;4、严重程度;5、故障原因;6、故障概率;7、风险程度;8、已有措施;9、规避措施;10、解决措施;11、后续规划
以电商大促中的商品库存这个功能点来说明一下。
它的异常模式包括销售趋势变弱和销售超过预期了。前者会导致销售量达不到预期,库存就会被积压,后者会产生断货,损失了高峰流量的机会。这两种情况发生的概率都充满了不确定性了,但是后果都很严重,产生原因也是五花八门,比如你的运营活动因为违反微信分享规范导致被屏蔽了,再比如某个用户对同一个商品下单数量惊人。所以,需要对库存和运营流量进行监控,时刻关注销售状况。另外通过技术手段限制用户购买数量,防止抢占库存,从而规避风险,降低异常模式发生的概率。当异常模式真的发生时,需要及时采取停止补货、及时补货、调整价格、调整运营活动等等的某种策略。并且将其过程纳入案例库中,方便后续复盘和改进。在这个例子中,FMEA分析就好比风险应急处理机制。
最后,在我看来,FMEA其实不单纯是一种故障后果防范的工具,更是一种设计理念。也就是说,在你设计软件的时候,就需要考虑某个部件如果损坏了,可能对系统的影响,并且在设计的时候就能够预见,并制定对策。只有做到这点,你的系统才是健壮和可靠的。