2.索引 (正向索引 -> like %key% ; 反向索引 -> 先建关键词列表)
前面我们介绍了Centos安装elasticsearch 6.4.2 教程,elasticsearch内置的分词器对中文不友好,只会一个字一个字的分,无法形成词语,别急,已经有大拿把中文分词器做好了,elasticsearch配套的ik-analyzer,我们一起来看看如何安...
在 lucene 的开发过程中,常常会遇到分词时中文识别的问题,lucene提供了 lucene-analyzers-common-5.0.0.jar包来支持分词,但多的是对英语,法语,意大利语等语言的支持,对中文的支持不太友好,因此需要引入中文分词器。...
这样我们古诗就变成 床、前、明、月、光了。加入我们搜索“月光”,就很尴尬只能通过合并集来得到”月光”这个词汇。下图就是相关的分词结果: