最新 最热

XGBoost算法原理小结

作为GBDT的高效实现,XGBoost是一个上限特别高的算法,因此在算法竞赛中比较受欢迎。简单来说,对比原算法GBDT,XGBoost主要从下面三个方面做了优化:

2019-12-20
0

随机森林 – Random forest

随机森林属于 集成学习 中的 Bagging(Bootstrap AGgregation 的简称) 方法。如果用图来表示他们之间的关系如下:

2019-12-18
0

决策树 – Decision tree

决策树是一种解决分类问题的算法,想要了解分类问题和回归问题,可以看这里《监督学习的2个任务:回归、分类》。

2019-12-18
0

过拟合现象及解决方案

每迭代几次就对模型进行检查它在验证集上的工作情况,并保存每个比以前所有迭代时都要好的模型。此外,还设置最大迭代次数这个限制,超过此值时停止学习。...

2019-12-18
0

监督学习 – Supervised learning

监督学习需要有明确的目标,很清楚自己想要什么结果。比如:按照“既定规则”来分类、预测某个具体的值…

2019-12-18
0

AI算法领域常用的39个术语(下)

生成对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是最近两年十分热门的一种无监督学习算法。生成对抗网络(GAN)由两个重要部分构成:生成器和判别器。...

2019-12-13
1

性能分析之分析决策树3与4

当物理内存不够时,linux 触发oom,将进程杀掉;可以使用vmstat可以展现给定时间间隔的服务器的状态值,包括Linux的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况,用于分析磁盘的压力在哪里,在swap,还是在load文件等...

2019-12-11
0

NRFI:网络结点不会指数增加的「神经随机深林模拟」

在过去几年,由于CIFAR-10和ImageNet这样的大数据集的涌现,卷积神经网络在一系列计算机视觉任务中取得了巨大的成功。然而现实世界中的很多问题缺乏大量的带有标签的数据集,卷积神经网络容易在小样本数据上过拟合。另一方...

2019-12-09
0

100天搞定机器学习|Day56 随机森林工作原理及调参实战(信用卡欺诈预测)

前文对随机森林的概念、工作原理、使用方法做了简单介绍,并提供了分类和回归的实例。本期我们重点讲一下:

2019-12-06
0

2019年字节跳动招聘算法岗,他们最看重哪些新技术能力?

【导读】合格的算法工程师真正应该具备什么技能?在面试时,面试官又会如何验证你具备这些新技能?毕业仅一年,相继拿下头条、阿里、腾讯等offer的本文作者,为你绘制了一幅面试技能雷达图。...

2019-12-06
0