所谓“预测”,统计学上是有精确定义的:是对事物的发展趋势和在未来时期的数量表现做出推测和估计的理论和技术——它是一个概率结论。可是当你在百度上搜索“预测”这个关键字时,会出现好几页的结果都是五行、八卦、星座、塔罗牌。这可能就是真实的预测和多数人眼中的“预测”之间的差异:一个算数,一个算卦。
聊聊概率结论的不确定性
人们总是喜欢确定的因果关系——“因为A 所以B”,并且认为数据自己就可以表达出这种因果关系。可惜的是,这个世界是由概率组成的,几乎不存在“因为A 所以B”,存在的只是“我们考虑A 这个因素,有30% 的概率可以得到B;我们考虑C、D、E、F、G、H、I、J,有70% 的概率得到K。”甚至多数现实比这个更复杂。而定量分析的预测方法的选择和预测结果通常与以下几个因素有关:目标、时间期限、精度要求、费用预算、数据的完备程度与模型的复杂程度、历史数据的形状。比如:战略性决策对精度要求较低,则使用中长期预测方法;业务型决策,要求精度较高, 则使用短期预测方法;精度越高的模型需要的工作量越大、费用越高,等等(参考《预测与决策》一书,西安电子科技大学出版社)。
关于“预测”的例子非常典型,能够充分说明“数据”在商业化的道路上被“妖魔化”了。这种现象的本质是,“概率结论”很难被非统计学专业的人理解,甚至完全被充要关系或线性的因果关系替代。关于这种现象,《不确定世界的理性选择: 判断与决策心理学》一书给出了一个非常有意思的研究结果:即使是受过系统化概率论思维训练的人群,也会严重低估未来的随机成分,并且更喜欢确定的结论,甚至认为彩票可以有方法通过计算提升中奖概率——被试即使有“随机独立性”的概念,也会不自觉地认为彩票的结果会和历史结果相关。这是一种极端的情况,也是实验的非常好的场景——彩票的每一期的中奖结果都是独立的(和历史的相关性为0)。那么在日常应用中,这种偏差就更显著。另外,这本书在介绍关于彩票预测的心理学实验之后讲了一个非常有趣的故事,一个西班牙人中了全国彩票后,记者采访他是否有什么秘诀?他说:“我刻意选择了尾数是4 和8 的彩票,因为我连续7 个晚上梦见了数字7,而7 乘以7 等于48。”
那么当业务人员提到“预测”两个字,我们就要开始搬出ARIMA 模型、贝叶斯定理或者马尔可夫模型吗?答案当然是“不”。科普预测的原理到底是什么?作为数据产品经理要理解最基本的统计学知识和数学建模方式,用于做一些专业判断,但是千万不要动不动就去给业务人员科普统计学常识,毕竟术业有专攻。更何况,业务人员说出的“预测”和你脑子里复杂的统计学知识可能根本就是两件事。于是这就变成了一个沟通问题:先搞清楚业务人员讲的“预测”到底是什么。
不确定感带来的焦虑
如果你做过某个零售类业务的数据分析师,那么对预测一定不陌生。在成熟的业务体系下,多数情况我们都会沿用之前的某个非常稳定的预测模型,在一些特殊事件发生时再引入新的参数更新模型——这是因为有足够的历史数据支撑。但是模型提供的只是一个可能性:它表示“基于历史状态,如果不发生任何特殊事件,那么大概率会朝着这个方向走”。这种预测的实际意义通常和零售业的预算、备货、原材料和辅料准备等实际业务诉求相关,也就是有很多具体的业务行为是需要参考这个模型的。通常也只是参考,并不会完全依赖。业务人员还需要考虑所处的阶段和打法(激进的还是保守的)、市场环境(主要竞争对手是不是即将有大动作)、上下游配合(合作的大渠道今年是不是有动作)等等因素。甚至在很多时候,预测值只是一个目标(Flag), 给业务人员形成一种心理暗示。
如果在业务体系并不成熟的公司,那沟通的第一个目标,是问明白这个预测值对应的业务行为是什么,或者说这个预测值会怎么影响业务行为。当无法判断确切目标时,多数业务人员在说出“我需要一个预测值”时,表达的更多是对未来不确定性的焦虑。这时需要询问业务人员对已有的事实数据的了解和使用程度,思考已经提供给业务人员的事实数据是否是足够的。最大的误区莫过于,对方说出“我需要一个预测值”,数据产品经理就立即陷入了如何预测的思考里。
充分描述历史数据
业务人员会由于信息过少而感到焦虑,很大程度是由于报表体系对历史数据的描述不完整,而不是缺少一个所谓的“预测值”。
历史数据是否被充分描述了?换句话说,就是指标体系的搭建是否已经足够精细, 并且落地为多维度的报表?数据源和数据质量是否能完全支撑业务的基础诉求?报表是否可以更精细?(关于如何构建指标体系和报表的维度可参考《数据产品经理新人的工作笔记》第4章)
工作笔记:一个需求沟通框架
这个框架主要用于需求方发起一个需求后,双方需要沟通的情况下。这里需要注意区分“需求沟通”和 “会议”之间的差异。会议的目标是就某一件事有决议,而需求沟通——尤其是初次沟通的目标,是充分挖掘并记录业务人员关于这个需求的信息,将你本人非常明确的内容做出反馈,盘点待确认信息并告知对方。
在沟通前,需要准备的内容如下表。
在沟通中要仔细记录,如下表。
上表可能会在多次沟通中才能填写完成:前8 项填写完成,最后一个“待确认信息”,才叫作需求确认。
在沟通中,请务必确保业务人员明确的内容为需求流程和涉及的审批流程。
在沟通后,我们要完成“待确认信息”的确认和反馈。经过充分沟通后,“待确认信息”中没有了业务逻辑的部分,只剩下技术方案相关的问题,即认为是可以输出PRD 的状态。而上表的蓝色部分,就是PRD 主体部分的主要依据。