最新 最热

降低数据大小的四大绝招。

在非常多的问题中,例如商品推荐数据存储(大量的用户和商品,还有购买金额等信息),金融数据存储(大量的标的,价格等),我们不可避免的都会碰到数据过大的问题,如果对这类数据进行处理显得直观重要,本文我们介绍碰到大数据时,我们采用...

2022-10-27
2

年龄不是上限!我只是按照自己的兴趣专注于机器学习

我只是按照自己的兴趣,尽可能多地专注于学习机器学习。年龄只是一个数字,何时开始以及可以实现多少没有上限。 Philip是Kaggle Competitions Grandmaster,他以17枚金牌名列第 47 位。...

2022-10-27
2

树之尽头,炁体源流

目前已经存在非常多可视化树模型的策略,此处我们给出另外一种最新的树模型可视化工具包--pybaobabdt,该工具包提供了可视化分析方法的双重示例。可以通过交互和可视化来增强机器学习方法。...

2022-10-27
2

重点!11个重要的机器学习模型评估指标

构建机器学习模型的想法应基于建设性的反馈原则。你可以构建模型,从指标得到反馈,不断改进,直到达到理想的准确度。评估指标能体现模型的运转情况。评估指标的一个重要作用在于能够区分众多模型的结果。...

2022-09-01
1

kaggle挑战赛——X光手骨骨龄预测

(1)、在 RSNA 2017 上,该比赛是为了从孩子的手的 X 光片中正确识别孩子的年龄。

2022-08-20
2

刘畊宏男孩女孩看过来!运动数据分析挖掘!⛵

因为疫情,2年多的时间里,大家多了很多居家的经历,但是运动健康并不能因为居家而停止,健身随时随处可以进行!健身环大冒险等大热,而前阵子的刘畊宏跳操,带火了一大票畊宏男孩女孩,可穿戴设备市场大涨,而这些设备也记录了大量的...

2022-08-09
2

5行代码提升GBDT,提升巨大!

如果你打过kaggle应该一定都知道,大家心照不宣的表格数据竞赛的第一tricks:

2022-06-02
1

Kaggle出了一本竞赛书(500页)!

今天看到了kaggle出版了一本最新的竞赛书籍,该书籍内容涵盖了Kaggle的介绍,各种Kaggle的建模问题以及建模的技巧,同时还讲述如何利用Kaggle的经历来构建你的简历等:...

2022-05-26
2

用Python可视化分析全球火山分布,发现了这些有趣的现象

也就在前天,南太平洋岛国汤加发生火山喷发,有专门的专家学者分析,这可能是30年来全球规模最大的一次海底火山喷发,它引发的海啸以及火山灰将对周边的大气、洋流、淡水、农业以及民众健康等都造成不同程度的影响。...

2022-04-13
2

数据集 | 婚姻情况数据集

某社会实验内容为男人和女人签约嫁给一个他们以前从未见过的完全陌生的人。专家根据测试和面试对夫妇进行配对。结婚后,夫妻只有短短几周的时间来决定是要保持婚姻还是离婚。该数据集记录了十次该社会实验的数据。...

2022-03-30
1