深度学习以及机器学习面试常见问题以及答案

2022-10-28 11:29:19 浏览数 (2)

  1. 特征工程怎么做的,选择了哪些特征作为预测变量?为什么用RFM模型来构建特征变量?

解题思路 特征工程包括:特征构建->特征提取->特征选择。 选择特征:用户行为特征、用户消费特征、用户画像特征 为什么RFM模型:因为我们没有太多的用户行为数据,能用的数据比较有限。但是有一定的成交数据。只要有成交数据,就能进行RFM的分析。其次,模型的分层可解释性强。其他很多算法模型、机器学习模型,往往通过聚类进行用户的分层,对于业务来讲,不是很好解释。但RFM模型分成的用户类别,是非常好理解的。

One-hot的作用是什么?为什么不直接使用数字作为表示

作用:1)将类别变量转换为机器学习算法易于利用的一种形式的过程 。如:网络一般通过softmax层输出,它的输出是一个概率分布,从而要求输入的标签也以概率分布的形式出现,进而算交叉熵之类。 参考链接

代码语言:javascript复制
          2)让特征之间的距离计算更加合理。如1,2,3对应的[1,0,0],[0,1,0],[0,0,1]之间距离都是sqrt(2)。否则直接用数字,13距离为2;12、23距离为1,凭什么呢?

你觉得batch-normalization过程是什么样的

1)BN的作用:对于每个隐层神经元,把逐渐向非线性函数映射后向取值区间极限饱和区靠拢的输入分布强制拉回到均值为0方差为1的比较标准的正态分布,使得非线性变换函数的输入值落入对输入比较敏感的区域,以此避免梯度消失问题。

2)BN的实现:即BN论文中伪代码的步骤&#x

0 人点赞