向AI转型的程序员都关注了这个号???
机器学习AI算法工程 公众号:datayx
1,计算机视觉;2,自然语言处理;3,风控;4,推荐系统?
当前2020年 ,算法工程师哪个方向好?
看了很多回答,模棱两可、模糊不清,给岀一番没有意乂的解释,最终也没有给岀自己的意见。
我首先给出自己明确的答案:选择推荐系统。
不要说什么“根据不同岗位、不同公司、不同能力而定",我所说的都是针对普遍的大众情况
目前在商业中有所应用,而且能够创收的只有搜索推荐和计算机视觉,因此,这两个方向的人力缺口很大,尤其是计算机视觉。前两年校招时可以看到,互联网、IT、生物医药、汽车安防等等行业,几乎都会有计算机视觉的岗位。所以,很多其他方向的同学开始纷纷转向,随着大潮流投入计算机视觉这个方向,为什么这么多人投入计算机视觉方向?我认为有以下几个原因:
- 入门容易
- 模型成熟
- 人才缺口大
- 热度高,名气大
目前入门CV的常用套路就是:
- 看吴恩达《机器学习》《深度学习》课程,学一点机器学习的知识。
- 读几篇CV模型的文章,了解一下经典的Alexnet、R-CNN系列、YOLO等。
- 在github上找几个tensorflow、pytorch实现上述模型的开源代码。
- 下载VOC、ImageNet、COCO、kaggle等数据集。
- 按照开源代码中的Readme准备一下数据集,跑一下结果。
学了两个月、跑了几次结果后就认为已经入行CV了。
看过吴恩达课程的人,有的应该记得他在课里面说过"深度学习是一个基于经验的领域",我们该怎么针对不同领域的图像设置不同的参数?其中包括卷积核大小、网络架构、初始权重等等,不可能拿到一个模型,既适合医学图像,又适合人脸识别,这其中就需要n次从70%的精度调到95%以上中积累出经验。
此外,CV方向目前阶段依然存在着制约这项技术创造更多商业价值的弊端,虽然每年顶会、期刊上面关于CV的文章依然很多,但是绝大多数都是拼拼凑凑,很多模块和思想并不新颖,在关键问题方面并没有太大起色。
我认为在2020年,计算机视觉的状况不仅没有好转,反而更差。曾经狂热吹捧计算机视觉的,现在也基本鸟悄的待着了。因为时间已经逐渐验证,当下计算机视觉所能创造的价值非常有效。而且,受限于数据、准确性要求,它目前很难大展拳脚。
其次是NLP,曾在2015年,我在做计算机视觉之前就做过一段时间的NLP,我认为NLP是一种非常有价值但是地位却很尴尬的存在。
它很有价值,在语音、OCR、人机交互、推荐系统等方面都有对№LP的大量应用,但是,它却很难直接的创造大规模的价值,更多的是作为一种附属能力,结合其他算法为一个系统提供能力支撑。
风控是我目前接触较多的,首先,它应用面比较局限,仅限于金融场景。而且,目前的风控模型是比较成熟稳定的,要么基于规则、要么基于传统机器学习,短时间之内不会有特别大的改动。毕竟涉及资金,银行也不会那么沖动的选择那些不可解释的模型和算法。
目前在互联网行业常用的算法有:
但是,推荐,搜索,广告投放是互联网公司最普及也是最能产生现金流的三个方向。 无论是目前火热的头条系产品(抖音、今日头条),还是阿里系(淘宝、天猫),百度(广告推荐),腾讯(QQ音乐、腾讯新闻),乃至手机行业(应用市场)都是由推荐系统带来的商业价值。
其中,比较知名且成功的当属字节跳动。
我认为优秀的产品设计 强大的推荐算法成就了目前的字节跳动,今日头条的个性化新闻推荐,抖音的个性化视频推荐。
我们会发现,当下我们看到的、听到的都是互联网公司想让我们看到的,我们似乎生活在一个被设计的圈子里,这些背后的所有支撑力都来自于推荐系统。
我认为,推荐系统目前已经产生了很大的商业价值,在接下来的3-5年里,它还有很多场景、很多价值会被进一步挖掘,在短暂的几年里,NLP、CV、风控和推荐还是无法相提并论。
原文地址https://www.zhihu.com/question/398876586/answer/1325993716
阅读过本文的人还看了以下文章:
TensorFlow 2.0深度学习案例实战
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《基于深度学习的自然语言处理》中/英PDF
Deep Learning 中文版初版-周志华团队
【全套视频课】最全的目标检测算法系列讲解,通俗易懂!
《美团机器学习实践》_美团算法团队.pdf
《深度学习入门:基于Python的理论与实现》高清中文PDF 源码
特征提取与图像处理(第二版).pdf
python就业班学习视频,从入门到实战项目
2019最新《PyTorch自然语言处理》英、中文版PDF 源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF 附书代码
《深度学习之pytorch》pdf 附书源码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
《Python数据分析与挖掘实战》PDF 完整源码
汽车行业完整知识图谱项目实战视频(全23课)
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!
《神经网络与深度学习》最新2018版中英PDF 源码
将机器学习模型部署为REST API
FashionAI服装属性标签图像识别Top1-5方案分享
重要开源!CNN-RNN-CTC 实现手写汉字识别
yolo3 检测出图像中的不规则汉字
同样是机器学习算法工程师,你的面试为什么过不了?
前海征信大数据算法:风险概率预测
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
VGG16迁移学习,实现医学图像识别分类工程项目
特征工程(一)
特征工程(二) :文本数据的展开、过滤和分块
特征工程(三):特征缩放,从词袋到 TF-IDF
特征工程(四): 类别特征
特征工程(五): PCA 降维
特征工程(六): 非线性特征提取和模型堆叠
特征工程(七):图像特征提取和深度学习
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
蚂蚁金服2018秋招-算法工程师(共四面)通过
全球AI挑战-场景分类的比赛源码(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python flask搭建CNN在线识别手写中文网站
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python