Solr 企业级搜索引擎简介
Solr 是一个独立的企业级搜索引擎服务器,并提供类似web-service 的API接口。可以通过http协议把文档以xml格式的方式放入索引库。同样通过HTTP的GET协议接收XML格式的文档。
看到这里我想起了车东主持开发的WebLucene,早在3年前车东就为lucene提供了XML接口,后来吕克让也在此基础上添加了很多功能,大大方便了后继的维护工作。那么Solr有什么特别的呢?
首先,Solr 师出名门,apache的孵化项目:http://incubator.apache.org/solr/
具体功能看看下表吧:
- 高级全文搜索功能 ;
- 为高Web负载做了特别的优化;
- 基于XML和HTTP的标准开放接口 ;
- 功能完善的HTML的管理界面;
- 可伸缩,可以高效复制到其它Solr服务器;
- 基于XML的灵活性和可适配性;
- 提供支持插件的架构;
Solr 使用的是Lucene包,并对其进行了扩展
- 支持实用数据Schema, 比如:动态字段和唯一键等
- 对Lucene 查询语言的强大扩展;
- 支持动态搜索结果分组和过滤
- 高级的可配置文本分析功能;
- 高可配置性和用户可扩展的缓存服务;
- 提供性能优化参数;
- 使用XML在服务器外部进行配置;
- 提供服务器管理接口;
- 提供服务器监视日志
- 支持快速的索引增长升级和快照发布
看到这里,真想和Solr来个亲密接触呀。
另外,Solr有一个非常有意思的功能,支持 IndexUpdateListener ,这可是我梦寐以求的呀。
详情见这里:关于 IndexUpdateListener 的讨论
相关阅读:
中文分词和二元分词综合对比
关于lucene发展和多语言实现的方向