最新 最热

kaggle实战-肿瘤数据统计分析

数据地址为:https://www.kaggle.com/code/kanncaa1/statistical-learning-tutorial-for-beginners/notebook

2023-08-23
2

pandas-ai火了

关注小屋的朋友肯定都知道小编一直在坚持写pandas相关的文章,最近的一篇请参考:

2023-05-09
2

Kaggle 赛题解析 | AMP 帕金森进展预测

文章目录一、前言二、比赛说明1. Evaluation2. Timeline3. Prize4. Code Requirements三、数据说明四、总结

2023-03-24
1

[Nature Methods | 论文简读] 人类蛋白质图谱弱监督单细胞分类竞赛分析

Analysis of the Human Protein Atlas Weakly Supervised Single-Cell Classification competition

2022-12-29
3

机器学习中训练和验证指标曲线图能告诉我们什么?

我们在训练和验证模型时都会将训练指标保存成起来制作成图表,这样可以在结束后进行查看和分析,但是你真的了解这些指标的图表的含义吗?

2022-11-11
1

评估和选择最佳学习模型的一些指标总结

在评估模型时,虽然准确性是训练阶段模型评估和应用模型调整的重要指标,但它并不是模型评估的最佳指标,我们可以使用几个评估指标来评估我们的模型。...

2022-11-11
5

使用分类权重解决数据不平衡的问题

在分类任务中,不平衡数据集是指数据集中的分类不平均的情况,会有一个或多个类比其他类多的多或者少的多。

2022-11-11
2

在表格数据集上训练变分自编码器 (VAE)示例

变分自编码器 (VAE) 是在图像数据应用中被提出,但VAE不仅可以应用在图像中。在这篇文章中,我们将简单介绍什么是VAE,以及解释“为什么”变分自编码器是可以应用在数值类型的数据上,最后使用Numerai数据集展示“如何”训练...

2022-11-11
2

使用阈值调优改进分类模型性能

阈值调优是数据科学中一个重要且必要的步骤。它与应用程序领域密切相关,并且需要一些领域内的知识作为参考。在本文中将演示如何通过阈值调优来提高模型的性能。...

2022-11-11
4

12个常用的图像数据增强技术总结

机器学习或深度学习模型的训练的目标是成为“通用”模型。这就需要模型没有过度拟合训练数据集,或者换句话说,我们的模型对看不见的数据有很好的了解。数据增强也是避免过度拟合的众多方法之一。...

2022-11-11
5