kaggle挑战赛——23种皮肤疾病分类

2022-08-20 11:37:12 浏览数 (1)

今天将分享kaggle系列挑战赛之23种皮肤疾病多分类的完整实现过程,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。

一、比赛介绍

数据包含23种皮肤疾病。一共有19500张,其中15500张用于训练,其余用于测试。图像是jpeg格式的RGB彩色图像,图像分辨率是不同的。类别包括痤疮、光化性角化病基底细胞癌、特应性皮炎、大疱病、脓疱疮、湿疹、皮疹和药疹、脱发和其他头发疾病、疱疹 HPV和其他性病、色素沉着疾病、狼疮和其他结缔组织疾病、黑色素瘤、指甲真菌和其他指甲疾病、毒藤、牛皮癣、疥疮莱姆病、脂溢性角化病和其他良性肿瘤、全身性疾病、癣癣念珠菌病、荨麻疹、血管肿瘤、血管炎、疣软疣。

二、技术路线

1、加载csv文件,读取皮肤病图像和对应标签值。

2、将训练数据分成9:1分成网络训练数据和验证数据,训练数据中有一些类别训练数据是不平衡的,需要对这些数据做数据增强处理。

3、对所有的图像进行统一缩放处理,大小统一大小是256x256,图像归一化,用均值是0和方差是1的方式进行归一化。

4、网络采用的是VGG16网络结构,损失是交叉熵,学习率是0.001,droupout是0.5,epoch是20,batchsize是64。

5、训练结果

训练损失函数结果

训练精度函数结果

验证损失函数结果

验证精度函数结果

6、测试结果

混淆矩阵结果

评价指标结果

precision recall f1-score support

0.0 0.69 0.49 0.57 59

1.0 0.25 0.41 0.31 71

2.0 0.36 0.38 0.37 24

3.0 0.21 0.38 0.27 21

4.0 0.00 0.00 0.00 13

5.0 0.36 0.44 0.40 82

6.0 0.20 0.20 0.20 25

7.0 0.27 0.40 0.32 15

8.0 0.36 0.27 0.31 33

9.0 0.27 0.31 0.29 35

10.0 0.44 0.28 0.34 29

11.0 0.71 0.43 0.53 28

12.0 0.87 0.61 0.72 67

13.0 0.29 0.24 0.26 17

14.0 0.34 0.42 0.38 78

15.0 0.58 0.29 0.39 38

16.0 0.46 0.34 0.39 88

17.0 0.13 0.23 0.17 39

18.0 0.38 0.51 0.44 90

19.0 0.50 0.07 0.12 14

20.0 0.67 0.29 0.40 28

21.0 0.31 0.19 0.24 26

22.0 0.43 0.26 0.33 80

avg / total 0.43 0.37 0.38 1000

为了方便大家更高效地学习,后期会将相关项目代码更新到github上,点击原文链接即可访问官方比赛网址,可以直接下载训练和测试数据。

如果大家觉得这个项目还不错,希望大家给个Star并Fork,可以让更多的人学习。如果有任何问题,随时给我留言我会及时回复的。

0 人点赞