最新 最热

Apache Solr SSRF (CVE-2021-27905)复现

Apache solr是一个开源的搜索服务,使用java编写,运行在serblet容器的一个独立的全文搜索服务器,是apache luncene项目的开源企业搜索平台。

2022-09-22
2

大数据ELK(三):Lucene全文检索库介绍

倒排索引是一种建立索引的方法。是全文检索系统中常用的数据结构。通过倒排索引,就是根据单词快速获取包含这个单词的文档列表。倒排索引通常由两个部分组成:单词词典、文档。...

2022-09-17
1

Lucene学习-深入Lucene分词器,TokenStream获取分词详细信息

在此回复牛妞的关于程序中分词器的问题,其实可以直接很简单的在词库中配置就好了,Lucene中分词的所有信息我们都可以从TokenStream流中获取.

2022-09-15
2

Lucene源码解析–TokenStream和AttributeSource

转 http://blog.itpub.net/28624388/viewspace-765691/

2022-09-15
1

Lucene.net(4.8.0) 学习问题记录二: 分词器Analyzer中的TokenStream和AttributeSource[通俗易懂]

前言:目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作,不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ,PanGu分词也是对应Lucene3.6.0版本的。不...

2022-09-15
2

Elasticsearch 简介[通俗易懂]

Elasticsearch 是一个非常强大的搜索引擎。它目前被广泛地使用于各个 IT 公司。Elasticsearch 是由 Elastic 公司创建。它的代码位于 GitHub – elastic/elasticsearch: Free and Open, Distributed, RESTful Search ...

2022-09-09
1

分布式--solr搜索引擎

搜索是项目中常用的功能,对于大数据量的搜索,查询关系型数据库是非常低效的,好在有三方专门用于搜索的工具,常用的搜索解决方案为:

2022-09-08
1

大数据之Atlas元数据管理「建议收藏」

Atlas 是一个可伸缩且功能丰富、开源的元数据管理系统,深度对接了 Hadoop 大数据组件。

2022-09-01
1

浅析分布式搜索引擎

Lucene是一套用于全文检索和搜索的开放源码程序库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口,能够做全文索引和搜索,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论...

2022-08-27
1

Solr数据迁移ES

作者介绍yinanwu(吴沂楠),腾讯云 Elasticsearch 高级开发工程师本文介绍通过开源社区提供的solr-to-es迁移工具,将Solr节点中的文档迁移到腾讯云ES中的方法。使用限制solr-to-es迁移工具仅支持迁移到腾讯云ES 6.4.3、6.8....

2022-08-26
1