NLP_字节宝

conceptnet-numberbatch: 结合常识知识的词向量 - 概述及使用

在NLP领域，常识知识的使用越发成为热点，因为其有希望帮助克服现有模型的局限：它们仅从训练数据中学到的有偏的、浅薄的知识，而并不擅长像人一样进行真正的推理。...

nlp text uri word2vec

2020-12-01

一作解读NLPCC最佳学生论文：1200万中文对话数据和预训练模型CDial-GPT

在2020年初开始的新冠病毒蔓延影响下，NLPCC 2020采取线上+线下的会议方式，线上线下共缴费注册496人，其中现场参会总人数达372人，线上参会人数124人，另有15个赞助单位参展。汇聚了众多国内外NLP领域的知名学者。...

embedding gpt nlp

2020-11-06

pycaret模型分析

解释复杂模型在机器学习中至关重要。模型可解释性通过分析模型真正认为的重要内容来帮助调试模型。在PyCaret中解释模型就像编写interpret_model一样简单。该函数将训练有素的模型对象和图的类型作为字符串。解释...

classification fold model nlp

2020-10-27

【NLP保姆级教程】手把手带你fastText文本分类(附代码)

继续NLP保姆级教程系列，今天的教程是基于FAIR的Bag of Tricks for Efficient Text Classification[1]。也就是我们常说的fastText。

Github layer nlp text word2vec

2020-08-26

ALBERT详解

BERT 发布后，在排行榜上产生了许多 NLP 任务的最新成果。但是，模型非常大，导致了一些问题。"ALBERT"论文将这些问题分为两类：

embedding hidden nlp prediction self

2020-08-19

GPT-3说：马斯克是世界最强的人，但没有他人类会更好

一位叫 Spencer Greenberg （以下简称S先生）的数学家，最近和GPT-3做了一番交谈，内容实属精彩，先来一睹为快。

google gpt nlp

2020-08-19

CS224N 课程笔记之二：词向量（下）

之前我们介绍了两种表示词向量的方法：「基于数量」的矩阵分解方法（HAL & LSA）和「基于窗口」的概率方法（word2vec）。第二种方法明显优于第一种，但其只考虑了一个较小窗口内的词语信息，没有利用好全局的词语共现数据。...

nlp word2vec

2020-08-14

【信息抽取】NLP中关系抽取的概念，发展及其展望

事物、概念之间的关系是人类知识中非常重要的一个部分，但是他们通常隐藏在海量的非结构文本中。为了从文本中抽取这些关系事实，从早期的模式匹配到近年的神经网络，大量的研究在多年前就已经展开。...

iphone apple models nlp product

2020-07-01

Word2Vec的PyTorch实现（乞丐版）

根据论文所述，我这里设定window size=2，即每个中心词左右各取2个词作为背景词，那么对于上面的list，窗口每次滑动，选定的中心词和背景词如下图所示...

dataset list nlp rows word2vec

2020-06-15

读博难，大神来支招：DeepMind科学家Sebastian Ruder提出十条实用建议

机器之心曾经报道过多篇和读博相关的文章，最近我们发现 DeepMind 研究科学家 Sebastian Ruder 也发布了一篇博客，介绍自己的读博建议。

nlp twitter 博客论文

2020-06-01

19 20 21 22 23