最新 最热

Embedding在腾讯应用宝的推荐实践

作者:carloslin,腾讯 PCG 应用研究员 Embedding 技术目前在工业界以及学术界中应用非常广泛,关于 Embedding 的探索和应用从未停歇。Embedding 的训练方法主要分成 DNN 的端到端的方法以及序列学习的非端到端的方法,其中...

2020-08-19
0

CS224N 课程笔记之一:词向量(上)

从处理的对象来看,NLP 与其他机器学习任务有很大区别:NLP 处理的对象是人类语言,而人类的语言是一种特定的用于传达意义的系统,并不由任何形式的物理表现产生,大部分词语只是一个表达某种意义的符号。语言通过各种方式编码...

2020-08-17
0

必看!一文了解信息抽取(IE)【命名实体识别NER】

信息抽取(information extraction),简称IE,即从自然语言文本中,抽取出特定的事件或事实信息,帮助我们将海量内容自动分类、提取和重构。这些信息通常包括实体(entity)、关系(relation)、事件(event)。信息抽取主要包括三个子任务:...

2020-08-17
1

一文了解信息抽取(Information Extraction)【关系抽取】

信息抽取(information extraction),简称IE,即从自然语言文本中,抽取出特定的事件或事实信息,帮助我们将海量内容自动分类、提取和重构。这些信息通常包括实体(entity)、关系(relation)、事件(event)。例如从新闻中抽取时间、地点...

2020-08-17
1

为什么要停止过度使用置换重要性来寻找特征

数据分析师通常为了某些任务需要计算特征重要度。特征重要度可以帮助使用者了解数据中是否存在偏差或者模型中是否存在缺陷。并且特征重要度可用于理解底层流程和做出业务决策。模型最重要的特性可能会给我们进一步的...

2020-08-17
0

[吴恩达机器学习笔记]14降维3-4PCA算法原理

上式的 U 是一个具有与数据之间最小投射误差的方向向量构成的矩阵 。如果我们希望 将数据从 N 维降至 K 维 ,我们只需要从 U 中选取前 K 个向量即上图中的...

2020-08-14
1

坚持一下只需要一个理由就够了

大家好,我是 silent_grass,一名刚完成(专升本学业)毕业的职场菜鸟。有幸参与到信安之路的小白成长计划,在我努力克服拖延症后终于完成 100 分的目标,中间什么大小原因不用说大家都懂。...

2020-08-14
0

2020最新文本综述:从浅层到深度学习(附PDF下载)

文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重...

2020-08-13
1

读书笔记:第二章机器学习

机器学习(Machine Learning,ML)就是让计算机从数据中进行自动学习,得到某种知识(或规律)。

2020-08-10
1

「Workshop」第十一期:降维

前言:主要是从理解降维和用R实现降维这两个层面上来阐述,具体的算法还需要感兴趣的小伙伴另外了解。

2020-08-10
0