最新 最热

数据集 | 化妆品数据集

该数据集包含产品名称,成分,皮肤偏好,此数据集包含产品名称,成分,皮肤偏好和价格。

2022-03-30
0

90%冠亚军采用的时间序列建模策略

本篇文章,我们介绍Kaggle和国内时间序列相关的数据竞赛中,90%的冠亚军和金牌选手会选用的建模策略,基于滑动窗口的样本构建策略,一般有两种滑动建模训练的策略,但这两种的思路基本都基于下面这张图构建的数据集:...

2021-12-02
0

Kaggle赛题分析(二)

通过智能手机的信号日志,识别具体用户在购物中心的位置。当前的定位算法在多层建筑中精度较差,且大部分是基于GPS信息构建。

2021-10-09
0

拉通对齐 梳理Kaggle竞赛组合拳!

参加Kaggle竞赛往往都需要较多的步骤,对于小白同学,完成完成所有的步骤是一件非常困难的事情。

2021-09-08
1

如何微调GPT-2生成高质量的歌词

生成预训Transformer2 (GPT-2),顾名思义,是基于Transformer 的。它使用注意力机制,这意味着它学会关注与上下文最相关的前一个单词,以便预测下一个单词。...

2021-05-18
0

Python中的时间序列分解

时间序列分解是一种技术,它将时间序列分解为几个部分,每个部分代表一个潜在的模式类别、趋势、季节性和噪声。在本教程中,我们将向您展示如何使用Python自动分解时间序列。...

2021-04-30
1

[Kaggle] Heart Disease Prediction

文章目录1. 数据探索2. 特征处理管道3. 训练模型4. 预测 kaggle项目地址 1. 数据探索import pandas as pdtrain = pd.read_csv('./train.csv')test = pd.read_csv('./test.csv')train.inf......

2021-02-19
0

使用 seaborn 绘制 12 类图

今晚分享一个很不错的 seaborn 可视化实战入门材料,这个实战教程来自于 kaggle, 使用的是美国警察开枪数据集,大小1M,一共5个csv文件

2021-01-06
1

解决ROC曲线画出来只有一个点的问题

之前在做kaggle比赛时,有个比赛使用AUC来评比的,当时试着画了ROC曲线,结果出来的下图这样的图形。跟平时的ROC曲线差好远,就只有一个点。而别人家的都是很多转折的,为啥我的不一样。...

2020-11-05
0

缺失值的处理方法(基于sklearn)

Imputation就是用每一列的均值/中位数/最大频率的数等去补充缺失值。值得注意的是对于valid的数据而言,fit的时候仍然要用train的数据。strategy也可以修改为其他的方法。...

2020-10-26
1