当前位置: 首页 > 面试题库 >

如何在Lucene中索引pdf,ppt,xl文件(基于Java或python或php的任何一种都可以)?

庄萧迟
2023-03-14
问题内容

我也想知道如何在建立索引的同时添加元数据,以便提高一些参数


问题答案:

Lucene索引文本而不是文件-您需要其他一些过程来从文件中提取文本并在其上运行Lucene。



 类似资料:
  • 问题内容: 我有三个食物类型索引:“意大利”,“西班牙”,“美国”。当用户搜索“奶酪”时,“意大利”文档似乎出现在顶部。如果我偏爱说“西班牙语”,是否可以“增强”结果?(我仍然应该获得意大利语的结果,但是基于索引类型“ Spanish”的一些数值提升值,结果中返回的文档的顺序将优先使用“ Spanish”索引。在用户输入的lucene和/或ES查询? 问题答案: 添加带有字词查询或字段(或两者都有

  • 我是lucene的新用户,现在正试图获得一些基础知识。 null 这就是我如何将文档添加到索引中的方法: 如何让lucene索引也文件名?

  • 本文向大家介绍如何基于R中的名称获取行索引或列索引?,包括了如何基于R中的名称获取行索引或列索引?的使用技巧和注意事项,需要的朋友参考一下 我们可能更喜欢在分析期间使用行索引或列索引,而不是使用它们的数字,因此,我们可以借助grep函数获得它们。在处理大型数据集时,这很有用,因为大型数据集具有大量的行和列,因此更容易用索引而不是数字来调用它们。具体来说,需要列索引,另一方面,仅在特殊情况下(例如分

  • 问题内容: 我是Lucene的新手,在创建 用于查询文本文件集合的 简单代码时遇到一些问题。 我尝试了此示例,但与新版本的Lucene不兼容。 UDPATE: 这是我的新代码,但是仍然无法使用。 问题答案: Lucene是一个相当大的主题,涉及很多类和方法,通常您必须至少了解一些基本概念才能使用它。如果您需要快速可用的服务,请改用Solr。如果您需要对Lucene的完全控制,请继续阅读。我将介绍一

  • 我正在尝试从Lucene索引中删除文档。我只想从lucene索引中删除指定的文件。 我下面的程序是删除可以使用关键字分析器搜索的索引,但是我需要的文件名只能使用标准分析器搜索。因此,它是任何方式设置标准分析器在我的任期或代替任期如何使用QueryParser从Lucene索引删除文档。

  • 我正在尝试将pdf或doc文件上传到由laravel组成的网站上。这是我的刀片页面。 这是我的控制器 我得到一个错误说非静态方法Illumate\Http\Request::file()不应该被静态调用来修复这个问题 使用照明\支持\外观\请求 而不是 使用照明\Http\Request; 但是后来我收到一个错误,说我不能使用验证。任何形式的帮助都将不胜感激。