这周项目要做一个搜索引擎系统,于是,我看看了看上下左右,看来只有我来弄了~~
代码其中参考了@红薯的Lucene 早年分享的代码,与一些朋友的精华博客。算是入门了,这个入门花了我40篇日志。
需求
项目中会用到搜索,需求不复杂:根据关键字,搜索出文章,公司,产品。
技术
Java(Spring)用于查询数据源,用的是,JDK7。
Lucene 做的是搜索,存储功能,用的是,Lucene5。
IKAnalyzer做的是分词功能,用的是,IKAnalyzer5。
关键点
1.Lucene的多个索引目录的近实时搜索。
因为涉及到公司,产品,文章,所以建立了多个索引,需要在多个索引之间进行查询,如果索引发生变更,则需要立马查询到最新数据。
2.分页与文章段落标红显示。
Lucene的分页功能,一定要优化~
关键字标红功能,特别是文章某一段匹配了关键字,然后只显示那一段前后的文字,效果图里有效果,详情里前后有"..."的就是,不是整个内容全部显示,而是某一部分前后标红显示。
3.查询公司名称时只输入公司名一个字搜索不到公司。
这时就需要扩展词典,将useSmart关闭。
效果图
未完待续~~~
(adsbygoogle = window.adsbygoogle || []).push({});