Apache Lucene 简介
Apache Lucene 是 Apache软件基金会 旗下一个开源子项目,它是一个开源的全文搜索组件,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是给文件中的每一个词和词组作索引,索引让搜寻的效率比传统的逐词比较起来效率倍增,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使 使用者可以随时根据自已的需要 进行二次开发。
Apache Lucene 是一个开放源代码的全文检索引擎工具包,它并不是一个完整的全文检索引擎框架,而是一个全文检索引 擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现 全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Apache Solr 是使用 Apache Lucene Core 构建的高性能搜索服务器。Apache Solr 具有高度可扩展性,可提供完全容错的分布式索引,搜索和分析。它通过易于使用的JSON / HTTP接口或Java和其他语言的本机客户端公开了Lucene的功能。
Apache Lucene 由来
Apache Lucene 的原作者是Doug Cutting,他是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些Internet底层架构的研究。早先他讲源码 发布在作者自己的网站上:http://www.lucene.com/,后来发布在SourceForge,2001年年底成为apache软件基金会jakarta的一个子项目。 现在则是apache的顶级项目。
Apache Lucene 最新版
Apache Lucene 最新版 7.7.3 修复了一个 bug:
- LUCENE-9300:修复当 doc 值更新应用于外部创建的 segment 上并使用 IndexWriter#addIndexes(Directory) 添加到索引中时,新的 gen 字段信息损坏的问题
最新版下载地址:https://lucene.apache.org/core/downloads.html