我跟几位BATJ现职的CV算法工程师聊了聊学习路径的话题——
- 学习CV要具备哪些基础?
- CV算法工程师应当掌握哪些技能?
01
学习CV要具备哪些基础
01 编程与数理基础
掌握Python基础理论知识、了解第三方数据科学库,能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。
02 机器学习基础
了解线性回归、逻辑回归、决策树等机器学习经典模型、能够基于Python语言上手机器学习算法实践。
03 深度学习基础
熟练卷积神经网络和循环神经网络、了解简单的Pytorch使用。
04 计算机视觉基础
以OpenCV为基础,掌握图像基础知识、基本处理等CV方向的基础理论。
02
算法模型——读这些论文
01 图像分类
vgg、inception、resnet、mobilenet、SENet。
02 图像分割
unet、deeplab系列、FCN、SegNet、BiSeNet。
03 目标检测
SSD、FPN、RetinaNet、Faster rcnn、AnchorFree、基于Transformer和CNN的端到端检测。
04 GAN
GAN、DCGAN、Pix2Pix。
03
项目学习——理论结合实战
01 图像分类
图像分类是计算机视觉领域最基础也是最核心的任务,虽然最近涌现出大量优秀的CNN模型可直接用于图像分类,简化了传统图像分类人工设计特征的流程,但是真正的企业级应用中远不止使用CNN网络模型那么简单。实际项目算法开发过程中,除了模型使用还需要考虑数据分布、类别均衡、数据增强、损失函数等trick的应用。
推荐项目:花朵分类&不均衡Cifar分类
熟悉训练技巧,掌握独立完成项目级图像分类模型训练的能力。
02 图像分割
图像分割是CV主要方向之一,在自动驾驶、人像抠图、医学图像分析和工业质检均有广泛应用。能掌握经典图像分割算法,熟悉代码开发流程,独立完成图像分割项目是算法工程师必备的能力。
推荐项目:自动驾驶语义分割&人像分割及证件照制作
用代码实现数据集读取、图像分割模型训练、训练分析、模型推理、线上部署。完整地做一次图像分割项目实战。
03 目标检测
目标检测是CV领域的重要方向之一,在自动驾驶、卫星遥感、机器人、智慧工厂、智能交通等领域中应用广泛。掌握经典的目标检测算法,学会检测器性能提升方法和模型轻量化的方法,了解模型部署的流程,是计算机视觉工程师的必备技能,也是进入各大厂和创业公司的必要条件。
推荐项目:基于YOLOX构建高性能目标检测器&轻量级目标检测器
掌握构建baseline检测器的方法,掌握目标检测器性能优化和轻量化的技巧,了解工程实践中目标检测任务开发的一般流程。
04 GAN
生成式对抗网络模型被誉为“下一代深度学习框架”,是目前最强大的生成式模型,已在图像视频生成、增强、编辑等应用领域广泛落地。每隔一段时间网络上就会出现关于其神奇效果的相关报道,比如换脸、绘画、让人物跳舞、老片修复、以及让照片人脸动起来等等。这其中,图像增强可谓是GAN落地最成熟的一个方向。此外,数据爬取、数据分析筛选、模型批量调参、模型快速部署等算法工程师必备技能也是本项目的重点。
推荐项目:图像增强经典超分辨率任务均衡Cifar分类项目
学习和探索GAN技术是如何在企业中一步步落地,解决客户的实际需求。
04
项目试学
以上内容在深度之眼CV项目班中均有涉及,本公众号粉丝开放获取特殊福利:CV实操秘籍:
0.1元领取!
01 深度揭秘CV 大厂算法工程师(7月13日直播)
02 图像分类模型涨点技巧(50分钟)
03 数据爬取及筛选(86分钟)
0.1元领取!