当前位置: 首页 > 知识库问答 >
问题:

Apache Jackrabbit Oak 1.8索引-Lucene不索引聚合节点中的二进制属性

韩阳飙
2023-03-14
oak:index
      jcr:primaryType = nt:unstructured
      dms-lucene-fulltext-index
         compatVersion = 2
         async = async
         jcr:primaryType = oak:QueryIndexDefinition
         evaluatePathRestrictions = true
         type = lucene
         tags = fulltext
         aggregates
            jcr:primaryType = nt:unstructured
            nt:file
               jcr:primaryType = nt:unstructured
               include0
                  path = jcr:content
                  jcr:primaryType = nt:unstructured
folder
   jcr:created = 2018-02-24T14:32:09.550+01:00
   jcr:createdBy = 
   jcr:primaryType = nt:folder
   jcr:uuid = 5c3e4689-84e9-4e34-8b14-029f62172812
   test.txt
      jcr:created = 2018-02-24T14:32:09.674+01:00
      jcr:createdBy = 14
      jcr:primaryType = nt:file
      jcr:content
         jcr:encoding = utf-8
         jcr:lastModifiedBy = 14
         jcr:mimeType = text/plain; charset=utf-8
         jcr:data = the quick brown fox
         jcr:lastModified = 2018-02-24T14:32:09.673+01:00
         jcr:primaryType = nt:resource
         jcr:uuid = 52f224e8-db57-4879-9d6a-94862f65fb8d
SELECT * FROM [nt:file] WHERE ISDESCENDANTNODE('/folder') AND CONTAINS(*,'plain')
SELECT * FROM [nt:file] WHERE ISDESCENDANTNODE('/folder') AND CONTAINS(*,'fox')

共有1个答案

柯捷
2023-03-14

经过长时间的调查,我终于找到了解决问题的办法。

我在pom.xml中添加了以下依赖项:

<dependency>
    <groupId>org.apache.tika</groupId>
    <artifactId>tika-parsers</artifactId>
    <version>RELEASE</version>
</dependency>

然后我的自定义tika配置也被加载,二进制属性被索引!

 类似资料:
  • 在基于UNIX的操作系统中,每个文件都由一个Inode索引。 Inode是创建文件系统时创建的特殊磁盘块。 文件系统中的文件或目录数量取决于文件系统中的Inode数量。 Inode包含以下信息 - 文件的属性(权限,时间戳,所有权详细信息等) 包含指向文件的前12个块的指针的多个直接块。 指向索引块的单个间接指针。 如果文件不能被直接块完全索引,则使用单个间接指针。 指向磁盘块的双重间接指针,该磁

  • 索引节点 在SFS文件系统中,需要记录文件内容的存储位置以及文件名与文件内容的对应关系。sfs_disk_inode记录了文件或目录的内容存储的索引信息,该数据结构在硬盘里储存,需要时读入内存。sfs_disk_entry表示一个目录中的一个文件或目录,包含该项所对应inode的位置和文件名,同样也在硬盘里储存,需要时读入内存。 磁盘索引节点 SFS中的磁盘索引节点代表了一个实际位于磁盘上的文件。

  • 在测试此文本时,我在要在文本中搜索的列上创建了lucene(3.0.1)索引: 如果我按关键字搜索,它会给出结果,但按 我正在使用standardAnalyzer: 因为已设置,它应创建令牌,并且应存在$GLD。Analyzer将从文本中删除停止字,因为word也将在该过程中删除。

  • bugu-mongo 2.x版本集成了Lucene的功能。当往MongoDB中新增一个Document时,能自动为该Document建立Lucene索引。相应的,当MongoDB中的Document被修改、删除时,对应的Lucene索引也会修改、删除。 另外,bugu-mongo还提供了对Lucene搜索的支持。根据Lucene索引进行搜索的时候,搜索结果能自动转换成对应的Entity对象。 在L

  • 问题内容: 在不使索引离线的情况下备份Lucene索引的最佳实践是什么(热备份)? 问题答案: 您不必停止IndexWriter即可备份索引。 只需使用SnapshotDeletionPolicy,它就可以“保护”给定的提交点(及其包含的所有文件),以免被删除。然后,将该提交点中的文件复制到您的备份中,最后释放该提交。 如果备份需要一段时间才能运行,这很好- 只要您不使用SnapshotDelet

  • 假设我有两组对象“Questions”和“Users”,它们共享一个关系。 什么是最好的方法索引我的对象,以允许最新的变化反映在lucene IDEX? 是否应该为用户和问题提供单独的文档,并让lucene根据需要获取所需的问题/用户详细信息? 还是,走数据传输对象的方式?当发生更改时,只需删除这些文档并重新索引?