始于2019年的新冠肺炎仍然肆虐全球,快速低成本检测该疾病成为了医学技术领域最热门的话题,早已有专家发现,核酸 胸部医学影像检测相结合是更可信的检测手段。
胸部X光影像是低成本的检测技术,但深度学习往往需要大量的训练样本,但目前公开可获得的样本不过数千。如何在样本不足的情况下使用深度学习进行检测呢?迁移学习是很不错的选择!但还可以更好吗?
今天公开的一篇论文 COVID-19 detection from scarce chest x-ray image data using deep learning 使用孪生网络在这个少样本学习问题中做了实验,取得了不错的效果。作者已经开源了代码。
论文作者信息:
胸部X光影像示例:
上图中covid为新冠肺炎样本,Viral Pneumonia 为普通肺炎,Normal为正常样本。
作者使用的数据集来自kaggle:
- https://www.kaggle.com/tawsifurrahman/covid19-radiography-database
- https://www.kaggle.com/pranavraikokte/covid19-image-dataset
数据集1 含有 1200幅 COVID-19阳性图像,1341幅正常图像和1345普通肺炎图像。数据集2 含有317幅图像,也分为上述三类。
普通迁移学习的示意图:
将在其他相近任务数据集上训练的权重进行微调,进行不同肺炎的分类训练。
孪生网络用于分类的方法示例:
同时输入两幅图像,经过图像增广 共享权重的CNN网络提取特征,模型目标是判断提取到的特征是否来自同一类。
很显然,孪生网络既可以从头训练,也可以将其中CNN网络替换为预训练模型的权重,这就是孪生网络 迁移学习。
作者在前述数据集中进行了实验,孪生网络 迁移学习取得了最好的分类结果,在各项指标中全面领先。
如下图:
对比技术包括逻辑回归、5层CNN、VGG16迁移学习、从头训练的孪生网络。
也许提到图像分类,我们往往会想到预训练模型 迁移学习,但在少样本学习中,孪生网络也是一个值得尝试的不错选择。但愿在其他任务中也有效!
论文:
https://arxiv.org/pdf/2102.06285.pdf
代码:
https://github.com/shruti-jadon/Covid-19-Detection