最新 最热

【技术分享】L-BFGS算法

设f(x)是二次可微实函数,又设$x^{(k)}$是f(x)一个极小点的估计,我们把f(x)在$x^{(k)}$处展开成Taylor级数, 并取二阶近似。

2020-01-15
0

【技术分享】隐式狄利克雷分布

LDA是一种概率主题模型:隐式狄利克雷分布(Latent Dirichlet Allocation,简称LDA)。LDA是2003年提出的一种主题模型,它可以将文档集中每篇文档的主题以概率分布的形式给出。通过分析一些文档,我们可以抽取出它们的主题(分布),根...

2020-01-03
0

【技术分享】五:搜索排序-特征分析

数据决定了任务的上限,模型方法决定达到上限的能力。在这里想借助信息熵的一些概念来对数据的重要性做一些分析,将数据的分布差异度量出来,并据此得到特征对于分类的重要性度量。 对于特征的重要性的分析不适合放到特征...

2019-11-06
0

【技术分享】四:搜索排序—数据的采集与构造

导语:数据决定了任务的上限,模型方法决定达到上限的能力。在机器学习三要素里面,经验数据是极其重要的一环,直接决定了该机器学习任务的最终能达到的效果。尤其是在进入大数据时代,数据获取上面会比以往容易许多,选取数据集...

2019-11-06
0

【技术分享】一:搜索排序—概述

搜索排序:在一次会话中,用户在交互界面输入需要查询的query,系统给返回其排好序的doc例表的过程。

2019-11-06
0

【技术分享】GBDT算法-原理篇

GBDT是常用的机器学习算法之一,因其出色的特征自动组合能力和高效的运算大受欢迎。

2019-10-30
0

【技术分享】Spark机器学习的加速器:Spark on Angel

Spark的核心概念是RDD,而RDD的关键特性之一是其不可变性,来规避分布式环境下复杂的各种并行问题。这个抽象,在数据分析的领域是没有问题的,它能最大化的解决分布式问题,简化各种算子的复杂度,并提供高性能的分布式数据处理...

2019-10-30
0

【技术分享】怎么理解凸优化及其在SVM中的应用

导语:本文先介绍了凸优化的满足条件,然后用一个通用模型详细地推导出原始问题,再解释了为什么要引入对偶问题,以及原始问题和对偶问题的关系,之后推导了两者等价的条件,最后以SVM最大间隔问题的求解来说明其可行性。...

2019-09-12
0

【技术分享】机器学习之SVM - 理论知识

导语:本文用一些简单的例子来解释了SVM是什么,然后通过SVM中最大间隔、核函数、软间隔、SMO四个关键部分,依次进行数学推导和解释。

2019-09-12
0

【技术分享】机器学习之回归(二)---广义线性模型(GLM)

导语:本文在上篇线性回归的基础上,延伸到广义线性模型,并把广义线性模型目的、假设条件来源,指数族分布、连接函数等各个函数的关系都进行详细地解释。最后用两个常见的GLM特例Logistics回归、Softmax模型进行了推导。...

2019-09-12
0