算法实习生面经(nlp、数据挖掘、机器学习)
作者:酱油大大大
链接:https://www.nowcoder.com/discuss/155251?type=2&order=3&pos=7&page=0
来源:牛客网
总结一下这几个月的面试吧。算法刷题的面试题没有记录。多刷刷leetcode和剑指offer就可以。
自己之前面的数据挖掘岗,但是后来自己的兴趣在nlp,所以后面很多就面试nlp岗位了。
1、xgboost 比 gbdt 有哪些优势,xgboost的原理。
3、解释一下AUC
4、lgb和xgboost 对比 哪些优势。lgb如何实现并发多线程的
5、svm对缺失数据敏感吗,为什么,决策树呢。
6、决策树是如何处理缺失数据的。
6、svm如何处理多分类
7、为什么svm采用最大间隔。
鲁棒,对未知数据泛化更好
8、svm选取样本问题,如何增加样本点。
9、词向量 降维是如何实现的
10、什么时候选择svm算法,什么时候选择决策树算法。
svm更适合处理特征多的样本。 而决策树处理特征多的样本时容易发生过拟合。
11、神经网络如何实现异或门
12、神经网络多层感知机训练过程,手写一下
13、逻辑回归完整推导过程,LR
14、CRF HMM原理 公式、维特比算法的公式
15、L1、L2正则,数据平滑 解释
16、RNN参数大小。推导。
17、LSTM公式、GRU公式
18、word2vec和glove优劣
19、基于密度的聚类了解哪些
20、nlp分词技术有哪些,如何分的。
21、计算svm支持点到超平面的距离,如何使其最小。推导
22、transformer、bert实现细节。
23、自己之前做了一个文本分类和一个情感分类的比赛,问了如何实现的
最后弱弱的想求个nlp相关职位的实习。求内推