Apache Solr 简介
一、Apache Solr 说明
Apache Solr 是Apache 基金会组织下的一个开源子项目,他是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口,使用 Java5 语言开发,主要基于 HTTP 和 Apache Lucene 实现的一款流行的、快速的开源企业搜索平台。
Apache Solr 中存储的资源是以 Document 为对象进行存储的,每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用 id 进行描述。
Document 文档 通过HTTP 利用 XML加到一个搜索集合中。查询该集合也是通过HTTP 收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。
二、Apache Solr 特性
Apache Solr 具有高度可靠、可伸缩和容错能力,提供分布式索引、复制和负载平衡查询、自动故障转移和恢复、集中配置等功能。Solr 为世界上许多最大的互联网站点的搜索和导航功能提供了动力。
Apache Solr 由来
Apache Lucene 和Apache Solr 的目标是提供世界一流的搜索功能,由Apache软件基金会进行开发并维护。
Apache Solr 最新版
Apache Solr 7.7.3 已发布,主要更新内容如下:
- SOLR-13779: 使用 simple-xml 的安全分叉来为聚类贡献代码
- SOLR-13718: 修复 SPLITSHARD (async) 底层子操作出现故障会导致数据丢失的问题
- SOLR-12291: 当集合的副本至少在一个节点上拼接了一个副本时,提前报告尚未完成的 async Collections API 调用为已完成
- SOLR-13828: 改进 ExecutePlanAction 错误处理
- SOLR-13472: 修复转发的请求会跳过接收节点授权的问题
- SOLR-13793: HttpSolrCall 现在维护远程查询的内部请求计数(_forwardedCount),并将其限制在副本数量内。这避免了对远程服务器进行过多的级联调用,如果不加以限制,可能会导致包含上述集合的节点崩溃
- SOLR-13971: Velocity response writer 的资源加载现在只能通过启动参数来实现。同时,从 _default configset 中删除 Velocity response writer
- SOLR-14025: 增强 VelocityResponseWriter —— 只有被信任的 configsets 才能渲染 configset 提供的模板,并且从请求参数中渲染模板的功能已被移除
- SOLR-13158: DataImportHandler: 添加 enable.dih.dataConfigParam 系统属性,以在是否允许使用 dataConfig param 时进行切换
- SOLR-14259: 来自 SOLR-14013 的后端端口 javabin 性能回归错误修复
详情查看:https://lucene.apache.org/solr/7_7_3/changes/Changes.html#v7.7.3.bug_fixes
下载地址:https://lucene.apache.org/solr/downloads.html