最新 最热

01 、Solr7.3.1 在Win10平台下使用jetty的部署及配置

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化...

2022-07-05
1

仿照博客园搜索功能 找找看的实现 发现问题 杂谈

我记得在园子里有园友提出博客园的搜索功能是采用的Lucene.net,具体是不是我也不确定,但是宁可信其是,所以我在仿照博客园 搜索功能的时候采用的也是Lucene.net,有园友给我提意见,就是我以前的博客中提到的那些框架,例如l...

2022-07-05
0

使用Lucene对预处理后的文档进行创建索引(可运行)

import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;

2022-07-04
1

利用Lucene的IndexWriter建立索引(详解)

/* * 建立索引,然后把建立后的文档添加到索引中去 * 提示先使用Document和Field把Field加入到Document中去, * 接着把Document建立成为一个索引 * */package comThree;...

2022-07-04
1

Solr配置中文分词器mmseg4j详解

针对Solr的分词器比较多,其中最常用的的两个是mmseg4j和ik-analyzer,至于他们的区别可以网上查找比较下,这两个分词器都挺好用。我搭建的Solr环境(上一篇 http://www.linuxidc.com/Linux/2015-01/112393.htm)是4.10.3的最...

2022-07-04
1

搜索引擎Solr环境搭建实例

Solr服务器采用java5开发的,是基于Lucene全文搜索的。要想搭建Solr,首先进行java环境的配置,安装对应的jdk以及tomcat,在此就不多讲。

2022-07-04
0

全文检索引擎Solr系列——入门篇

Solr采用Lucene搜索库为核心,提供全文索引和搜索开源企业平台,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那么就和我一起来入门吧!本教程以solr4.8作为测试环境,jdk版本需要1.7及以上版本。...

2022-07-03
0

全文检索引擎Solr系列—–全文检索基本原理

场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“坑爹”二字为止。这种搜索方法叫做顺序扫描法。对于少量...

2022-07-03
0

Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)

CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1

2022-07-01
1

Lucene的几点索引建设优化

现如今越来越多的人使用Lucene来开发自己的搜索引擎,在数据量不大的情况下,我们一般不会太关注创建索引的效率,但是,当数据达到一定的数量时候,我们就必须要考虑如何的去提高创建索引的性能,以减少创建索引的时间。...

2022-07-01
0