“ 本篇内容为师妹在美团面试时的相关记录,希望对目前学习推荐系统方向的朋友们一些方向指引,同时也希望对寻找推荐系统相关工作的朋友们一些借鉴意义。如有相关问题,请后台留言交流。”
01
—
背景介绍
本人经历几乎没有什么实践项目,大部分是算法相关的工作,研究生阶段主要做的是推荐系统,涉及矩阵分解、图嵌入等,所以问题很多是和我方向相关的,大家可以有选择地参考一下~
02
—
一面
几乎全部是项目相关的:
1、说说矩阵分解
2、围绕LLE来问:LLE全称是什么;简述LLE和PCA的特点和区别;LLE里面涉及的图拉普拉斯有没有了解(应该问的是LE:Laplace Eigenmaps)(一定要了解相近的一类对比算法)
3、整体代码的实现(一定要有条理地说清楚啊);deepwalk是手写还是工具包,有没有用numpy;图嵌入的训练集是什么,矩阵分解的训练集是什么
4、简述word2vec;说说滑动窗口大小以及负采样个数的参数设置以及设置的比例;怎么衡量学到的embedding的好坏
5、是否了解图卷积
6、说说推荐系统算法大概可以分为哪些种类:(1)基于内容;(2)基于协同过滤:基于内存(UB IB);基于模型(MF)
03
—
二面
1、推导LR
2、图结构是怎么存储的?利用你所做的这个图结构实现深度/广度优先遍历,格式是:def find_path(graph, root, destination) 深度优先遍历用栈结构实现;广度优先遍历用队列结构实现
3、聊到了宏观会问到的业务上的问题: 如果图表只存储了学校这片区域的中心点,但是我们下单的宿舍地址不在中心点附近,怎么去确定这个具体位置?说:可以遍历走过该地址的外卖员的轨迹,大量相交的交点大概率是具体位置; 还问,如果要给外卖员分配订单,怎么去分配?从外卖员到下单地址的距离远近,下单的紧急程度,外卖员正在派送的位置与下一个要派送的位置是否顺路(不可以时东时西)
04
—
三面
1、详细描述工作,画出来整体框架
2、工作最大创新点,在代码实现方面遇到的难点
3、看你对比的都是传统的或者是基于图的推荐算法,有没有尝试过对比一下或者有没有了解其他不同数据源的深度学习算法?
4、说到上面提到了attention机制,问了怎么看待attention机制,为什么有这么多工作去使用它
5、除了优化模型,还可以从什么方面去取得更好的性能:说了特征工程的处理,GBDT得到feature importance取topk贡献较大的特征作为模型输入
6、上面说到的特征处理,提到了会筛选出来特别的节日来单独处理,问:为什么要把平常日、周末、节假日分开处理
7、怎么去规划工作几年中的小目标
05
—
四面
1、推导SVM公式,挨个步骤说清楚,我说错了y的取值范围,应该是{ 1,-1};没说清楚函数间隔和几何间隔的物理含义
2、问了满二叉树和完全二叉树,大概画了一下;问了红黑树,说没学过,没有接着问了
3、问了随机森林有了解吗?知道里面的有放回的采样方法吗?后面问了个数学问题:
给定n个小球,有放回地采样。当n趋向于无穷的时候,某小球不被取到的概率是多少?
以上是全部流程啦,其中一面是电话面的,后三面是去到美团现场面的(时间会提前跟我们沟通好的),一个下午面完,感觉效率很高,全程感觉也比较好,面试官会根据我们经历,顺着我们的话去深挖,也会结合业务去一块讨论。收获满满的一次面试~ 希望可以对大家能有一点帮助,一起加油鸭!~~~