最新 最热

机器学习:基于scikit-learn进行特征工程

今天给大家分享如何基于机器学习建模全能包scikit-learn进行特征工程feature-engineering。

2024-07-22
1

推荐一些学习的网站

因为武汉新型肺炎的影响,原本两个周的寒假居然成了一个月的长假,闲来无事整理一下一些生物信息学相关的学习网站,趁着假期给自己充充电!

2023-09-21
1

python降低scikit-learn版本

查看scikit-learn当前版本import sklearnprint("Sklearn verion is {}".format(sklearn.__version__))对现有包降级pip show --file sklearn #查看包信息pip uninstall scikit-learn #删除包pip ......

2023-01-18
1

Feature-engine: 一个完备的特征工程Python库,实现端到端的特征流水线

特征工程本质是一项工程活动,它目的是最大限度地从原始数据中提取并加工特征以供模型或者算法使用。在传统机器学习领域流传着这样一句话: “数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”,从而可...

2023-01-14
0

【机器学习】集成学习代码练习(随机森林、GBDT、XGBoost、LightGBM等)

对比了六大模型,可以看出,逻辑回归速度最快,但准确率最低。而LightGBM,速度快,而且准确率最高,所以,现在处理结构化数据的时候,大部分都是用LightGBM算法。...

2023-01-10
1

【机器学习】随机森林、GBDT、XGBoost、LightGBM等集成学习代码练习

对比了六大模型,可以看出,逻辑回归速度最快,但准确率最低。而LightGBM,速度快,而且准确率最高,所以,现在处理结构化数据的时候,大部分都是用LightGBM算法。...

2023-01-10
1

开源图书《Python完全自学教程》12.6机器学习案例12.6.1预测船员数量

数据集 cruise.csv 包含了船的吨位、大小、乘客密度、船员数量等特征,业务需要建立一个船员数量与其他相关特征的回归模型,从而能估计船员数量。

2022-12-09
0

43种机器学习开源数据集(附地址/调用方法)

学习机器学习是一个不断探索和实验的过程,因此,本文将主要介绍常见的开源数据集,便于学习和实验各种机器学习算法!

2022-12-06
1

数据科学和人工智能技术笔记 十八、Keras

在 Keras 中,我们可以通过在我们的网络架构中添加Dropout层来实现丢弃。 每个Dropout层将丢弃每批中的一定数量的上一层单元,它是由用户定义的超参数。 请记住,在 Keras 中,输入层被假定为第一层,而不是使用add添加。 因此...

2022-12-02
1

数据科学和人工智能技术笔记 十五、支持向量机

SVC 使用超平面来创建决策区域,不会自然输出观察是某一类成员的概率估计。 但是,我们实际上可以通过一些技巧输出校准的类概率。 在 SVC 中,可以使用 Platt 缩放,其中首先训练 SVC,然后训练单独的交叉验证逻辑回归来将 SVC...

2022-12-02
1