最新 最热

不仅仅是双11大屏—Flink应用场景介绍

实时报表分析是近年来很多公司采用的报表统计方案之一,其中最主要的应用就是实时大屏展示。利用流式计算实时得出结果直接被推送到前端应用,实时显示出重要指标的变换情况。最典型的案例便是淘宝双十一活动,每年双十一购...

2020-02-11
1

稠密特征加入CTR预估模型的方法

稠密特征一般是相对稀疏特征来说的,我们知道类别特征经过独热编码之后比较稀疏,比如类别 [‘小猫’,‘小狗’,‘小熊’,‘小猴’] 被独热编码后的数据结构为[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]],可以看到这种数据很...

2020-01-20
0

CTR预估模型有怎样的发展规律

在深度学习还没有引入到点击率(Click-Through Rate,CTR)预估之前,CTR预估的模型大概经历了三个阶段:逻辑回归(Logistic Regression,LR),因子分解机(Factorization Machine,FM)、梯度提升树(Gradient Boosting Decision Tree,......

2020-01-20
0

序列特征的处理方法之一:基于注意力机制方法

之前两篇讲过稠密特征和多值类别特征加入CTR预估模型的常用处理方法,这篇介绍一下针对序列特征采用的最基本的注意力机制方法。

2020-01-20
0

多值类别特征加入CTR预估模型的方法

我们都知道一般单值类别特征加入到CTR预估模型的方法是先对单值类别特征进行one-hot,然后和embedding 矩阵相乘转换成多维稠密特征,如下图 1 所示:

2020-01-17
0

数据分析小白必看,一种通用的数据分析思路

数据分析是一个庞大的工程,有的时候过于抽象且依赖经验。本文是笔者对学习和实践数据分析的一个总结,希望提供一种通用的数据分析思路,并在分析思路的每个步骤中介绍相关的分析算法及其应用场景,对于算法只做浅层次的介绍...

2020-01-16
0

亚马逊畅销书的NLP分析——推荐系统、评论分类和主题建模

与所有其他零售公司一样,亚马逊努力解决客户评论中存在的欺诈和质量差的问题,并开发系统来识别公正和可靠的信息,以获得更好的客户体验。该分析试图将自然语言处理、情感分析和主题建模领域的现有工作应用到从 Amazon 检...

2020-01-16
1

快速上手关键词抽取的算法

在自然语言处理领域,我们有一种类型的问题是如何在一堆文本中提取出核心词/句子。而无论是对于长文本还是短文本,往往几个关键词就可以代表整个文本的主题思想。同时,在很多推荐系统中,由于无法直接就整体文本进行利用,往...

2020-01-15
0

推荐系统技术演进趋势:从召回到排序再到重排

推荐系统技术,总体而言,与NLP和图像领域比,发展速度不算太快。不过最近两年,由于深度学习等一些新技术的引入,总体还是表现出了一些比较明显的技术发展趋势。这篇文章试图从推荐系统几个环节,以及不同的技术角度,来对目前推...

2020-01-13
0