当前位置: 首页 > 知识库问答 >
问题:

Lucene QueryParser与TermQuery

姜卜霸
2023-03-14

我目前不确定Lucene中QueryParser与TermQuery的行为;我用的是Lucene3.6。

在我的示例中,我将在同一索引上尝试以下示例,其中所讨论的字段设置在field.store.nofield.index.not_analyzed_no_norms处。

Query q1 = new TermQuery(new Term("names", "test three"));

QueryParser q2p = new QueryParser(GenericIndexer.LUCENE_VERSION, "names", someAnalyzer);
Query q2 = q2p.parse("names:test three");
Query q3 = q2p.parse("names:\"test three\"");

在这两种情况下,Q2Q3都无法再现与Q1相同的语法;通过打印查询,我可以看到:

  • Q1=名称:测试三
  • Q2=名称:测试名称:三
  • Q3=名称:“test three”

由于这种差异,查询Q2Q3不返回任何结果,而查询Q1返回预期的结果。

问题:有没有一种方法让查询解析器重现与TermQuery相同的查询,还是我在这里遗漏了一些Lucene的基本概念?

共有1个答案

鲍国兴
2023-03-14

使用TermQuery,您将生成单个术语Test Three。由于不分析该字段,因此生成单个项是正确的。

在q2中,由于查询解析器的语法,您将看到两个独立的术语。是真正在做的,是对一个查询一样;names:test defaultfield:three,但这并不明显,因为您的默认字段也是“names”

在q3中(您注意到,这里确实非常相关!),您生成了一个短语查询,它与q1中提供的termquery不完全相同,但是使用正确的分析器,它可以是等价的。对PhraseQueries进行了分析,我猜查询解析器使用的分析器是standardanalyzer或类似的东西。区别在于术语看起来是什么:

  • StandardAnalyzer分析的术语:测试-
  • 未分析字段中的术语:测试三

因此,这两种表述之间没有相同的术语可供匹配。相反,尝试使用keywordanalyzer,这实际上与使用未分析字段相同。

您通常希望确保在QueryParser中使用与分析文档相同的分析器,KeywordAnalyzer是未分析字段的事实上等效的分析器。

 类似资料:
  • 在C语言中,假设每个算法被赋予完全相同的一组进程,那么先到先得、最短作业优先和循环之间的周转时间是否相等?还是调度算法不同?

  • 问题内容: 为了为 HTML5 Doctype 定义字符集,我应该使用哪种表示法? 短: 长: 问题答案: 在HTML5中,它们是等效的。使用较短的一个,更容易记住和键入。浏览器支持很好,因为它是为向后兼容而设计的。

  • 连接的多个输入都相当于Yes的时候才会输出Yes。 用法 Your browser does not support the video tag. 案例:小闹钟 功能:今天15:10:00,响起猫叫声小闹钟 工作原理 当所有的输入都是Yes的时候,与节点才输出Yes。

  • 问题内容: 似乎有三种 相同的 方法可以独立于平台获取依赖于平台的“文件分隔符”: 我们如何决定何时使用哪个? 它们之间甚至有什么区别吗? 问题答案: 可以通过调用命令行参数或使用命令行参数覆盖 获取默认文件系统的分隔符。 获取默认文件系统。 获取文件系统的分隔符。请注意,作为一种实例方法,在需要代码在一个JVM中对多个文件系统进行操作的情况下,可以使用该方法将不同的文件系统传递给代码(而不是默认

  • 问题内容: 我今天刚刚与一些同事讨论了python的db-api fetchone vs fetchmany vs fetchall。 我确定每个应用程序的用例都取决于我正在使用的db-api的实现,但是总的来说,fetchone,fetchmany,fetchall的用例是什么? 换句话说,以下等效项是什么?还是其中之一比其他人更受青睐?如果是这样,在哪些情况下? 问题答案: 我认为这确实取决于