腾讯实习 | 推荐算法面经(已OC)

2024-06-21 16:42:27 浏览数 (2)

时间线:

5.29 投简历 约面 5.30 一面 结束后10分钟约2面 5.31 二面 6.5 过了一个周末到周二还是二面链接 就去催了下 然后当天转为hr面 6.7 约hr面 6.10 本来hr面定在6.10端午节当天 然后他们那边失误了 可能忘记是端午节了 鸽了我 6.11 hr打电话表示抱歉工作失误,重新约了下午的hr面 面完 云证录用评估 6.14 下午oc

本人BG:

本科双非,top2硕

无论文,有算法竞赛经历,无实习,有两段科研经历(CV方向)但没有paper,机器学习和深度学习、算法数据结构基础还可以,推荐算法是3月之后跟着下面这个链接学的,顺便做了个相关的项目。

FunRec (datawhalechina.github.io)

leetcode大概300不到,再加上以前打比赛刷了些题,算法题感觉问题不大。

一面:40min问题 20min算法

自我介绍

LR的损失函数 手推梯度(刚开始比较紧张 写错了一点感觉

了解哪些精排算法(交叉类、wide&deep类、序列模型、多任务都说了几个

知道正则化吗(L1,L2

他们分别有什么优势(稀疏化、防过拟合、平滑函数

知道FTRL吗(这个大概知道,公式里面有一项控制参数,有一项是L1正则化

FTRL的优势(我只知道稀疏性

知道在线学习吗(我说不太了解 然后面试官很耐心的给我讲了下 我就反应过来说这样FTRL就方便控制参数

问项目

youtubeDNN论文看过吗

youtubeDNN训练和服务(训练是sampled SoftMax 服务是生成user vector后和item vector做ANN

ANN用的什么框架(faiss

问faiss候选集多大(我说全量数据

然后问我数据量有多大(我如实回答 面试官觉得我的数据太小了 这个没办法 github上的项目对于这种大厂来说都是玩具

正样本和负样本怎么构造的(正样本和负样本都说了一下

GBDT LR介绍

GBDT更适合哪类特征(dense feature

如果数据中出现缺失值怎么处理(我说了两个想法 一个是用其它未缺失的特征做ANN取前k个的平均 第二个是用一个简单的网络去预测这个缺失值 但是面试官教了个更好的想法

之前做的是CV 问我为什么不试试大模型(我说我刚转方向 先尝试一下搜广推

算法题:

(面试官看我有算法竞赛奖 说那你一定写的很快吧 我说好久不参加了 我尽力

LC215找到数组中第K大的元素

我第一反应建大小为K的小根堆 然后依次入堆 留下来堆顶就是 然后手撕了一下堆 复杂度nlogk 写出来后面试官问我知道快排吗 我突然反应过来 又把快排那个思路写了一遍 这个更快

反问

二面:40min问题 20min算法

没有自我介绍 上来就是项目 一串问题

项目里写了itemcf和usercf 问具体是怎么算的(倒排表优化,累积相似的的时候再根据用户活跃度之类的信息reweight一下

倒排表面对很大的数据有什么问题(我说时间太高 内存上也不好存和计算

有什么解决思路(我说这时候考虑把相似度换成ANN的相似度

问我用的什么ANN(faiss

问我ANN里面是怎么解决维度太大的问题(我用LSH的想法解释了一下,先降维,然后只考虑邻域的向量缩小候选集

怎么评估模型(topk命中 NDCG AUC

auc怎么算(先说了一下roc 然后说了两种算auc的公式

哪些特征适合交叉网络 哪些适合GBDT这类(我脑抽说反了 最后悔的一集

YoutubeDNN正负样本怎么构造的(正样本和负样本都说了一下

(还有些问题记不得了

说一下你知道的优化器(全梯度下降 SGD BGD Momentum Adagrad RMSprop Adam我全介绍了一编 硬拖时间

算法题:

(同样看到我有算法竞赛 面试官问我的奖大概是什么水平 我给他解释了一下什么是信息学奥赛 ACM 蓝桥杯大概的难度等级之类的

LC20 有效的括号

这个比较水 三个cnt变量统计 碰到右括号如果cnt=0就是false 遍历完之后 如果cnt不全为0也false 否则true

LC61旋转链表

我刚开始说reverse(1,k)reverse(k 1,n) 然后reverse(1,n)。这个可行但是O(2n) ,面试官说这个不是最快的,然后我反应过来就说可以直接从尾巴拿出来头插法插入k次。这个O(k) 写出来跑了几个样例没问题结束

反问

后面聊了一下 问我有没有offer 对公司有什么意向 介绍了一下他们组做什么

hr面:20min

主要是聊天,问问家庭状况、平时爱好、怎么缓解压力、实习能不能稳定之类的,基本没有什么压力

总结

其实还有一些问题不记得了,两次技术面试都是时长一个小时左右,40分钟问题 20分钟算法。我两次算法写的都比较快就早结束10分钟。三位面试官人都很好,引导式的面试,解答之后如果他觉得有更好的思路也会告诉你,给的反馈很及时。刚开始还紧张,聊了几分钟就不紧张了。

总的来说找实习之路还是比较顺利的,也不枉自己这短时间的努力。学习之路任重而道远,目前自己懂的也只是皮毛,希望自己能够快快成长。同时也非常感谢几位学长和好朋友的帮助,让自己少走了一些弯路,也对相关的实习有了很大的了解,感恩

0 人点赞