最新 最热

创新工场两篇论文入选ACL 2020,将中文分词数据刷至新高

数据猿报道 2020年7月5日至7月10日,第58届自然语言处理领域(NLP)顶级学术会议 ACL 2020 在线上成功举行。

2020-07-10
0

创新工场提出中文分词和词性标注模型,性能分别刷新五大数据集| ACL 2020​

中文分词和词性标注是中文自然语言处理的两个基本任务。尽管以BERT为代表的预训练模型大行其道,但事实上,中文中基于全词覆盖 (whole word masking)的预训练模型比直接使用单字编码的效果更好,所以引入词信息可能会达到更...

2020-07-10
0

关于语义分析的方法(上)

本文主要由以下四部分组成:文本基本处理,文本语义分析,图片语义分析,语义分析小结。先讲述文本处理的基本方法,这构成了语义分析的基础。接着分文本和图片两节讲述各自语义分析的一些方法,值得注意的是,虽说分为两节,但文本和...

2020-07-08
0

018.Elasticsearch分词器原理及使用

默认分词器:按照非字母和非数字字符进行分隔,单词转为小写 测试文本:a*B!c d4e 5f 7-h 分词结果:a、b、c、d4e、5f、7、h

2020-07-06
0

Elasticsearch从入门到放弃:分词器初印象

Elasticsearch 系列回来了,先给因为这个系列关注我的同学说声抱歉,拖了这么久才回来,这个系列虽然叫「Elasticsearch 从入门到放弃」,但只有三篇就放弃还是有点过分的,所以还是回来继续更新。...

2020-07-03
0

Elasticsearch 的分词运用

每个全文索引都是一个倒排索引,ES 在进行检索操作时,会建立倒排索引,将拆分的词进行处理,提高索引命中率。

2020-06-18
0

轻松搞懂中文分词的评测

你呀,你别再关心灵魂了,那是神明的事。你所能做的,是些小事情,诸如热爱时间,思念母亲,静悄悄地做人,像早晨一样清白。

2020-06-16
0

5分钟_SpringBoot集成ES实现存储、查询

spring-boot-starter-data-elasticsearch:是springboot整合es的一个快速开发包。用过JPA的朋友应该知道,springdata是通过解析方法名来实现查询数据库的。同样的这个快速开发包也是大大简化了Java使用es的流程。...

2020-06-12
0

简单易懂的字典树

字典树是一个比较简单的数据结构,字典树可以利用字符串的公共前缀减少查询字符串的时间,因此字典树常常用在需要大量查询字符串的操作任务中。本文主要从最基本的字典树入手,介绍什么是字典树以及字典树的增删改查,着重介...

2020-06-04
0

Elasticsearch构建商品搜索系统

搜索这个特性可以说是无处不在,现在很少有网站或者系统不提供搜索功能了,所以,即使你不是一个专业做搜索的程序员,也难免会遇到一些搜索相关的需求。搜索这个东西,表面上看功能很简单,就是一个搜索框,输入关键字,然后搜出来想...

2020-05-27
0