面经 | NLP算法岗(拼多多)

2022-04-11 19:00:21 浏览数 (1)

体验总结

a. 两面技术面 一面HR面

b. 工作作息为11-11-6,中午11点上班,晚上11点下班,一周工作六天。但据师兄说包含午休两个小时,而且可以在晚11点前下班。

c. 以下答案为面经提供者的回答,欢迎留言讨论

一面

  • 自我介绍 项目
  • 归一化有几种方式
  • 过拟合的解决方法
  • 决策树剪枝方式
  • 情景题: 为用户的Query打标签,有层级的标签,例如教师节礼物(礼品、文具之类的)该如何处理?
    • 构建方法:
      • 决策树,对每一个二分类,层次化softMax,构造正负对 合叶损失
    • 评估方法:
      • 数据集交叉验证、上线后用户评测
    • 模型未能覆盖的实例如何解决:
      • 同语言机器翻译,把冷门query转化为言简意赅的query
    • 针对用户query对标签树进行重构
  • 编程题:
    • 已知中序前序重构二叉树

二面

  • 自我介绍 项目
  • 项目中的评价标准是什么?
    • accuracy和precision、recall一样吗?
    • AUC的解释
      • AUC(Area under Curve):Roc曲线下的面积,介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏,值越大越好。
      • AUC值是一个概率值,随机挑选一个正样本以及负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值,AUC值越大,当前分类算法越有可能将正样本排在负样本前面,从而能够更好地分类。
  • 了解哪些损失函数?有什么区别?
  • LSTM结构图,LSTM怎么解决梯度消失的? 梯度消失还有哪些解决方法
  • 介绍word2vec
  • 编程题:
    • 给定一个长度为n 1的数组,里面有n个数字,找出重复的那个数字,时间复杂度o(n)

HR面

  • 自我介绍
  • 还投了什么公司?拿到了几家offer
  • 常规谈话

0 人点赞