最新 最热

HashMap实现中文分词器

今天下午部门内部技术分享是分词器算法。这次的主讲是大名鼎鼎的Ansj分词器的作者-孙健。 作者简介: Ansj分词器作者elasticsearch-sql(elasticsearch的sql插件)作者,支持sql查询nlp-lang自然语言工具包发起人NLPCN(自然语...

2018-05-18
0

Centos7服务器用户和权限管理配置

前言    要限制服务器用户的权限,是一个服务器运行良好的重要内容。之前因为需要搭建elasticsearch服务,所以必须要创建一个elasticsearch用户(当然,只要不是root用户就成)。因为这个用户存在的意义只是来启动和维护elas...

es2
2018-05-17
0

如何在Elasticsearch里面使用索引别名

在elasticsearch里面给index起一个aliases(别名)能非常优雅的解决两个索引无缝切换的问题,这个功能在某些场景下非常使用。比如电商的核心商品索引库,除了实时增量数据外,每天都要重建一遍索引,避免index里面的数据和db里面...

2018-05-15
0

如何在elasticsearch里面使用深度分页功能

前面的文章提到过es默认的from+size的分页方式返回的结果数据集不能超过1万点,超过之后返回的数据越多性能就越低。这是因为es要计算相似度排名,需要排序整个整个结果集,假设我们有一个index它有5个shard,现在要读取1000...

es2
2018-05-15
0

elasticsearch的查询流程分析

我们都知道es是一个分布式的存储和检索系统,在存储的时候默认是根据每条记录的_id字段做路由分发的,这意味着es服务端是准确知道每个document分布在那个shard上的。相对比于CURD上操作,search一个比较复杂的执行模式,因为...

2018-05-15
0

elasticsearch里面的关于批量读取mget的用法

es的api除了提供了基本的curd操作外,还有两个针对批量的操作分别是:1,批量的读取操作(mget)2,批量的写入操作(bulk)本篇文章先介绍mget的用法Multi Get api 简称(mget)它允许我们一次get大量的document,与get单条数据的api get方...

2018-05-15
0

elasticsearch里面bulk的用法

上篇文章介绍了在es里面批量读取数据的方法mget,本篇我们来看下关于批量写入的方法bulk。bulk api可以在单个请求中一次执行多个索引或者删除操作,使用这种方式可以极大的提升索引性能。bulk的语法格式是:action and met...

es2
2018-05-15
0

Elasticsearch如何检索数据

我们都知道Elasticsearch是一个全文检索引擎,那么它是如何实现快速的检索呢?传统的数据库给每个字段都存储成一个单个值,对于全文检索而言,这样的存储是低效的。举个例子,我有一个大文本字段,存到数据库里面只能是一个值,如...

2018-05-15
0

Elasticsearch如何动态维护一个不可变的倒排索引

上一篇文章中介绍了Elasticsearch中是如何搜索文本的,同时也简述了在es里面索引数据结构的特点不可变性。索引不可变性的缺点限制了单个索引存储的最大数据量以及更新的频次,所以es面临的问题是如何解决倒排索引不可更...

2018-05-15
0

为什么说Elasticsearch搜索是近实时的?

通过前面两篇文章的介绍,我们大概已经知道了 Elasticsearch处理数据的流程,其中在Elasticsearch和磁盘之间还有一层称为FileSystem Cache的系统缓存,正是由于这层cache的存在才使得es能够拥有更快搜索响应能力。我们都知...

2018-05-15
0