图像数据不足时的处理方法
图像数据训练时,数据不够怎么办。
- 对图像进行随机的处理,包括但不限于选择,平移,缩放,裁剪,填充,左右翻转。
- 对图像添加噪声,如椒盐噪声,高斯白噪声。当然,按理说对图像进行锐化处理,模糊处理也行。
- 改变图像本身,亮度,清晰度,对比度,锐度等等
- 颜色变换。
- 借助已经训练过的通用模型,继续训练。
- 使用GAN生成新的数据(逃)
模型评估
针对不同问题,分类,排序,回归,序列预测,选择合适的评估方式。 准确率Accuracy,精确率Precision,召回率Recall,均方根误差Root Mean Square Error,RMSE
准确率是指在分类问题中,被正确分类样本个数与总样本个数的比值。缺点,如果样本有错,而且样本的错误率90%,那么模型把90%的都预测错,那么反而会有很高的准确率。
精确率和召回率既矛盾又统一,为了提高Precision值,分类器需要尽 量在“更有把握”时才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把 握”的正样本,导致Recall值降低。 精确率和召回率的调和平均值
均方根误差RMSE
是i的样本真实值,
是i样本的预测值,n是样本个数。 RMSE能够很好的反应回归模型预测值与真实值的偏差,但是如果一些点偏差巨大,对RMSE影响也大。因此也引进了MAPE,平均绝对百分比误差,Mean Absolute Percent Error。
MAPE进行了归一化,降低了个别利群点所带来的绝对误差影响。