问题：

精确字符串匹配

居星阑

2023-03-14

我正在尝试创建一个Lucene4.10索引。我只想在索引中保存我放入文档的确切字符串，witout标记化。

我在用StandardAnalyzer。

    Directory dir = FSDirectory.open(new File("myDire"));
    Analyzer analyzer = new StandardAnalyzer();
    IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_4_10_0, analyzer);
    iwc.setOpenMode(OpenMode.CREATE);
    IndexWriter writer = new IndexWriter(dir, iwc);
    StringField field1 = new StringField("1", content1, Store.YES);
    StringField field2 = new StringField("2", content2, Store.YES);
    StringField field3 = new StringField("3", content3, Store.YES);
    doc.add(field1);
    doc.add(field2);
    doc.add(field3);
    writer.addDocument(doc, analyzer);
    writer.close();

    stored,indexed,tokenized,omitNorms,indexOptions=DOCS_ONLY<3:"Fuel Tank Capacity"@en>

    IndexSearcher searcher = new IndexSearcher(reader);
    Analyzer analyzer = new StandardAnalyzer();
    QueryParser parser = new QueryParser("3", analyzer);
    String queryString = "\"\"Fuel Tank Capacity"\@en\"";
    Query query = parser.createPhraseQuery("3", QueryParser.escape(queryString));
    TopDocs docs = searcher.search(query, null, 20);

我试图搜索术语“燃料箱容量”@en（包括引号），所以我试图省略它们，并在术语周围添加了另外几个引号，以便让lucene理解我正在搜索整个文本。

如果我打印查询，我会得到：3：“燃料箱容量en”，但我不想拆分@符号上的文本。

我认为我的第一个问题是StandardAnalyzer，因为如果我没有弄错的话，它似乎是tokenize。然而，我无法理解如何查询索引以准确获得“油箱容量”@en（包括引号）。

谢谢。

共有1个答案

西门经国

2023-03-14

您可以简化问题，只需将QueryParser完全从等式中删除即可。由于您使用的是StringField，该字段的全部内容是一个术语，因此简单的TermQuery应该能很好地工作：

Query query = new TermQuery(new Term("3","\"Fuel Tank Capacity\"@en"));

类似资料：

如何匹配精确字符串和通配符字符串

比如说我有这个：我想做两件事： 1）使其成为当且仅当用户准确键入<代码>时！测试和其他内容，它将在通道中打印出测试 2）使其成为如果用户键入首先后跟空格和至少一个其他字符串字符，它将打印出——例如：a）不会打印出任何东西，b）（后跟一个空格）不会打印出任何东西，c）不会打印出任何东西，d）不会打印出任何东西，但是e）将打印出， f）将打印出， g）将打印出， and h）将打印出等。我只知道
如何使用Java匹配字符串中的精确匹配

我试图检查字符串是否包含完全匹配。例如： String str="这是我的字符串，具有-Policy和-p" 我怎样才能做到以下几点：
如何在Oracle中的字符串中查找精确的字符串匹配

问题内容：我有一个oracle表，该表具有名为system_access的列，该列具有以下数据：基于上述示例数据，我不确定我的查询仅检索与“只读”和/或“只读”的确切单词匹配的记录我不需要具有“只读（否）”，后接空格或方括号的记录，或“只读（请参阅mgr）”，其后或接续无空格和括号的记录。因此，根据以上示例数据，我只会返回两行，即：如前所述，只有与字符串“ Read Only”或“ re
正确匹配Java字符串文字

问题内容：我正在寻找一个正则表达式来匹配Java源代码中的字符串文字。可能吗？我的意图是用其他东西替换另一个字符串中的所有字符串。使用：这样的事情。问题答案：好。那么，您想要在字符串中搜索以双引号开头和结尾的一系列字符吗？注意非贪婪模式。
从字符串精确分配给Float

问题内容：我有以下代码，我想为浮点数指定一个十进制值而又不损失精度。输出： 5.88 预期输出： 525.880005 问题答案：仅具有7-8位有效数字。您的示例中的“ 5”是第9位数字。即使它具有足够的精度，我也不知道525.880005是否可以精确表示为二进制浮点数。大多数十进制值不是:) 如果确切的十进制表示形式对您很重要，则应使用。
匹配字符串

问题你想要匹配两个或多个字符串。解决方案计算把一个字符串转换成另一个字符串所需的编辑距离或操作数。 levenshtein = (str1, str2) -> l1 = str1.length l2 = str2.length prevDist = [0..l2] nextDist = [0..l2] for i in [1..l1] by 1

精确字符串匹配

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档