索引类(Indexing Classes)
优质
小牛编辑
133浏览
2023-12-01
索引过程是Lucene提供的核心功能之一。 下图说明了索引过程和类的使用。 IndexWriter是索引过程中最重要和最核心的组件。
我们将包含Field(s) Document(s)添加到IndexWriter,它使用Analyzer分析Document(s) ,然后根据需要创建/打开/编辑索引,并在Directory存储/更新它们。 IndexWriter用于更新或创建索引。 它不用于读取索引。
索引类
以下是索引过程中常用类的列表。
S.No. | 类和描述 |
---|---|
1 | IndexWriter 此类充当核心组件,在索引过程中创建/更新索引。 |
2 | Directory 此类表示索引的存储位置。 |
3 | Analyzer 该类负责分析文档并从要编制索引的文本中获取标记/单词。 如果没有完成分析,IndexWriter无法创建索引。 |
4 | Document 此类表示带有Fields的虚拟文档,其中Field是一个对象,可以包含物理文档的内容,元数据等。 分析器只能理解文档。 |
5 | Field 这是索引过程的最低单位或起点。 它表示键值对关系,其中键用于标识要编制索引的值。 让我们假设用于表示文档内容的字段将具有作为“内容”的键,并且该值可以包含文档的部分或全部文本或数字内容。 Lucene只能索引文本或数字内容。 |