最新 最热

使用遗传交叉算子进行过采样处理数据不平衡

除了随机过采样,SMOTE及其变体之外,还有许多方法可以对不平衡数据进行过采样。 在使用scikit-learn的make_classification默认设置生成的分类数据集中,使用交叉操作生成的样本在最相关的指标上胜过SMOTE和随机过采样。...

2021-01-12
2

哥大读博五年总结

「 开始写这边总结的时候是三月,纽约成了疫情震中,看着新闻报道里的中央公园,中国城,第五大道,往事浮现,于是开始写这篇回顾。。陆陆续续一直没写完,转眼年底了,加州疫情更糟。。前几天看新闻说Cathedral教堂发生枪击案,震惊。...

2021-01-08
2

pycaret模型分析

解释复杂模型在机器学习中至关重要。 模型可解释性通过分析模型真正认为的重要内容来帮助调试模型。 在PyCaret中解释模型就像编写interpret_model一样简单。 该函数将训练有素的模型对象和图的类型作为字符串。 解释...

2020-10-27
2

怎样用逻辑回归解决多分类问题原理是什么?—ML Note 39

“Logistic Regression——Multi-classs classification: One-vs-all”。

2020-08-25
2

4,数据的获取

sklearn 数据集一览类型获取方式自带的小数据集sklearn.datasets.load_...在线下载的数据集sklearn.datasets.fetch_...计算机生成的数据集sklearn.datasets.make_...svmlight/libsvm格式的数据集sklearn.da......

2020-07-20
2

ECCV2020 | 300+FPS!浙大提出一种超快速车道线检测方法

论文地址:https://arxiv.org/pdf/2004.11757.pdf

2020-07-14
2

Circle Loss:从统一的相似性对的优化角度进行深度特征学习 | CVPR 2020 Oral

论文: Circle Loss: A Unified Perspective of Pair Similarity Optimization

2020-06-09
2

Using dummy estimators to compare results使用虚拟估计值来对比结果

This recipe is about creating fake estimators; this isn't the pretty or exciting stuff, but it is worthwhile to have a reference point for the model you'll even...

2020-05-07
2

CS224W-6-message passing and node classification 第2部分

第一种方案 relational classifiers 仅仅根据标签进行迭代,完全浪费了节点的属性信息,显然如果节点之间的属性非常相似,那么节点的标签也很可能是一样的,所以iterative classification 的思路就是 同时利用节点的属性(特征...

2020-04-07
2

python 去掉重复元素 学到再添加

set(可迭代对象) 返回无重复元素的集合。如在分类中,classification为类别数组

2020-01-16
2