前戏
还在国庆节假日,Amusi 尽量推送一些以阅读为主的文章。至于"实战"上手内容,还是等国庆黄金周结束后,再推送。
程序员平时压力就很大,放松一下,和家人很朋友多聚聚,享受生活,放松一下紧绷的身体和情绪。
RSIP Vision
在介绍重头戏之前,Amusi先介绍一个平台:RSIP Vision
RSIP Vision为最广泛的活动领域提供计算机视觉和图像处理咨询和算法:从精准农业到医学应用(心脏病学,肺病学,眼科学等); 从显微镜图像分析到OCR,半导体,分类和各种机器学习项目。 我们的工程师是人工智能,深度学习和所有最先进的计算机视觉技术方面的专家。
RSIP Vision 还发布了计算机视觉杂志,这是算法社区的在线杂志。
计算机视觉杂志
英文主题称为Computer Vision News,Amusi采用直接的方式翻译成计算机视觉杂志(本来想翻译成新闻的,因为吸睛度更高,但觉得不合理)。
Amusi 大概在5月份就发现了这个很cool的资源,但由于排版、翻译太耗时间,于是就一直搁着。现在换了个想法,只需要简单介绍一下内容,应该就可以了。快速阅读的时代,最重要的是质量,然而"快"也很重要。
另一方面,英文原文我都会附上,研究CV的,不看英文的,真的很难深入了。很多公众号会进行翻译,推出译文,这都是好事,但作为阅读者,要不要再去看英文版,心里要有点数。
话不多说,下面介绍计算机视觉杂志 | 10月刊的亮点
- DeepLab v3 介绍与实现(Keras)
- 22页 ECCV 2018 论文介绍
- 22页 MICCAI 2018 论文介绍
- ...
DeepLab v3
DeepLabV3 是一种用于语义分割(Semantic Segmentation)的深度学习算法。
具有以下功能的细分:
(1)Atrous卷积允许控制特征响应的分辨率网络中的不同层。
(2)Atrous空间金字塔池(ASPP)以多尺度和采样率稳健地分割对象。
(3)ASPP模块增加了图像级功能和批量标准化(Batch Normalization)。
(4)使用深度可分离卷积来恢复对象边界的解码器模块。
Atrous Spatial Pyramid Pooling (ASPP)
深度可分离卷积
DeepLab v1、v2、v3和v3
到目前为止,DeepLab已经发布了四个版本:1,2,3和3 。 下面是详细的每个版本的主要创新:
1. DeepLabV1:使用atrous卷积显式控制在深度卷积神经网络中计算特征响应的分辨率。
2. DeepLabV2:在多个采样率和有效视场中使用过滤器,该方法被称为atrous空间金字塔池(ASPP) 。
3. DeepLabV3:使用图像级功能增强ASPP模块以捕获更长范围的信息,并添加批量标准化(Batch Normalization)。
4. DeepLabV3 :扩展DeepLabV3以包括一个简单但有效的编码器 - 解码器模块,以细化特别是沿对象边界的分割结果。
22页 ECCV 2018和MICCAI 2018论文介绍
授之以鱼,不如授之以渔
因为原英文较长,且涉及论文介绍,Amusi觉得阅读英文起来会方便很多。翻译成中文,实在麻烦且无意义。
这里给出精彩的目录,大家感兴趣,可以根据文章末尾的提示进行下载。
注:原英文月刊(共计60页)里面介绍的很详细,本文仅选择性介绍,实属不完美,请见谅。
https://www.rsipvision.com/ComputerVisionNews-2018October/4/