作者:ZhiningLiu1998
编译:CV君
今天向大家介绍一个跟踪不平衡学习问题的Github资源仓库,文末附其中 7 篇相关综述论文下载。
Github地址:
https://github.com/ZhiningLiu1998/awesome-imbalanced-learning
类别不平衡问题 Class-imbalance(又称 long-tail problem 长尾问题)是指分类问题中不同类别样本数量不平衡(其实不仅是分类,在几乎所有计算机视觉问题,比如检测、分割、人脸特征点定位等都存在),在现实问题中非常常见。比如欺诈检测、罕见药物不良反应预测和基因组预测。
无法解决类别不平衡问题通常会导致许多分类算法的预测性能不准确和下降。
机器学习中 Class-imbalance 旨从不平衡数据中学习无偏模型。
作者介绍了目前处理不平衡问题的主要代码库和历年论文等,值得相关方向的朋友参考。
在代码库部分按照不同编程语言 Python、R、Java、Scalar、Julia等分类。
其中:
imbalanced-learn
https://imbalanced-learn.org/stable/
和KEEL
https://sci2s.ugr.es/keel/description.php
为作者推荐的功能完备的Python和Java库,尤其是前者,在Github上已经有4.3K颗星,与scikit-learn 兼容且已经是 scikit-learn-contrib 的一部分了。
在论文部分,作者总结了该问题的综述文章、深度学习中的类别不平衡问题技术、数据重采样技术、代价敏感学习、集成学习等方向,分别列出来不同方向有影响力的论文。
该文作者列出了7篇类别不平衡问题综述,涵盖从经典到深度学习方法的综述,在 我爱计算机视觉 公众号后台回复“ 不平衡综述 ”,即可收到下载链接。
Github地址:
https://github.com/ZhiningLiu1998/awesome-imbalanced-learning
另外想要了解目标检测中的不平衡问题,可以参考这篇综述:
目标检测中的不平衡问题综述
END