Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)

2022-07-01 16:03:01 浏览数 (2)

1、环境准备

CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1

2、配置步骤

(1)下载IK Analyzer分词包,解压缩

(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下

cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar

/usr/local/tomcat6/webapps/solr/WEB-INF/lib/

(3)将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下(和schemal.xml同一目录)

(4)修改schema.xml,加入如下配置:

<fieldType

name="text_ik" class="solr.TextField">

<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

如上表示加入"text_ik"类型的分词器(即:IKAnalyzer)

最后配置field通过name使用text_ik分词

<field name="text_ik"      type="text_ik"  indexed="true"  stored="true"  multiValued="false" />

3、中文分词测试

4、OK搞定!

0 人点赞