当前位置: 首页 > 知识库问答 >
问题:

从Lucene索引读取文件内容

史淳
2023-03-14

你好,我是新来的卢森我已经创建了使用卢森索引。但是当我从索引中搜索时,我能够得到一个查询词和文件名的出现,这些文件包含查询词。我无法查看我创建了索引的文件的内容,有人能帮忙吗,请提前感谢

Directory directory = FSDirectory.open(indexDir);
IndexSearcher searcher = new IndexSearcher(directory,true);
QueryParser parser = 
    new QueryParser(Version.LUCENE_30,"contents", new SimpleAnalyzer());
Query query = parser.parse(queryStr);
query.setBoost((float)1.5);
TopDocs topDocs = searcher.search(query, maxHits);
ScoreDoc[] hits = topDocs.scoreDocs;
arr= new String[hits.length];
for ( i = 0; i <hits.length; i++) {
    int docId = hits[i].doc;
    Document d = searcher.doc(docId);
    arr[i]=d.get("filename");
}

我正在使用此代码读取索引。

共有1个答案

许昆
2023-03-14

简而言之,有两个属性与将字段提供给Lucene索引有关。

1) 索引:仅可搜索,但无法恢复丢失,即无法从索引中读取内容。

2) 存储:可以检索这些字段中的内容而不会丢失。

我想,你的“文件名”字段是“索引”

在为数据编制索引时指定了上述内容。

您可以参考:1.3将文档/对象添加到索引

 类似资料:
  • 我是lucene的新用户,现在正试图获得一些基础知识。 null 这就是我如何将文档添加到索引中的方法: 如何让lucene索引也文件名?

  • 注意: 我只使用“luceneresults”.ascx和.cs。 ----问题更新了,因为我缩小了问题的范围---- 我试图创建一组特定项的索引,用于Lucene搜索。 在web.config中,我指定了一个索引,该索引包含: 完整索引:

  • 我试图创建一个简单的java程序,从zip文件中读取并提取文件内容。Zip文件包含3个文件(txt、pdf、docx)。我需要阅读所有这些文件的内容,为此我正在使用ApacheTika。 有人能帮我实现这个功能吗。到目前为止,我已经试过了,但没有成功 代码片段

  • 假设我有一个文本文件,每行有一个数字代码和一个字符串标签: 我如何打印前面的非零数字和每行的前两个单词的总和?假设数字总是4位数,单词与数字之间用一个空格隔开。例如,我会得到: 我试图初始化这个,但我不知道从这里去哪里

  • 问题内容: 我正在尝试创建一个简单的Java程序,该程序从zip文件中的文件读取和提取内容。压缩文件包含3个文件(txt,pdf,docx)。我需要阅读所有这些文件的内容,并且为此使用了Apache Tika。 有人可以帮我实现此功能。到目前为止,我已经尝试过了,但是没有成功 代码段 问题答案: 如果你想知道如何从每个文件中获取文件内容,ZipEntry那实际上很简单。这是一个示例代码: 一旦拥有