当前位置: 首页 > 面试题库 >

带有前缀查询的Elastic Search不区分大小写查询

郭乐意
2023-03-14
问题内容

我是elasticsearch的新手。我有以下查询

GET deals2/_search 
{
  "size": 200,
  "_source": ["acquireInfo"],
   "query": {
    "bool": {

      "must": [
        {

         "query_string": {
           "fields": ["acquireInfo.company_name.keyword"],
           "query": "az*"
         }
        }
      ]
    }
  }

}

在这里我希望Elastic应该给出不区分大小写的结果,例如字符串开头如下

"Az" 
"AZ" 
"az"
"aZ"
"Az"

但是我并没有像这样得到所有结果。所以任何人都可以帮助我。

示例:-我有4个文档

1)Aziia Avto Ust-Kamenogorsk OOO 
2)AZ Infotech Inc 
3)AZURE Midstream Partners LP 
4)State Oil Fund of the Republic of Azerbaijan

现在搜索az,应该只返回前3个文档,因为它们从az 此处忽略大小写开始,而不是第4 个文档,而第4个文档也包含az但不包含开头。


问题答案:

这是在您使用关键字字段company_name在应用程序中建立索引时发生的。

关键字分析器是一个“空操作”分析仪,它返回整个输入串作为一个单一令牌
例如,公司名称,包括fooFoofOo将存储有情况下,只有和搜索foo,将只匹配foo作为elasticsearch最终工作在令牌匹配(区分大小写)。

您需要使用标准分析器或其他自定义分析器,该分析器也可以解决您的其他用例,并在字段上使用小写标记过滤器,并使用被分析的匹配查询,并使用用于索引的同一分析器字段,这样您的搜索查询将生成相同的令牌,这些令牌存储在索引中,并且您的搜索将不区分大小写。

编辑: 在聊天中与用户进行了讨论,并更新了答案以满足他的要求,如下:

步骤1:-定义索引的设置和映射。

端点:-http:// {{hostname}}:{{port}} / {{index}}

{
  "settings": {
    "analysis": {
      "normalizer": {
        "my_normalizer": {
          "type": "custom",
          "char_filter": [],
          "filter": "lowercase"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "company_name": {
        "type": "keyword",
        "normalizer": "my_normalizer"
      }
    }
  }
}

步骤2:为所有文件建立索引

端点:http:// {{hostname}}:{{port}} / {{index}} / _doc /-> 1,2,3,4等

{
    "company_name" : "State Oil Fund of the Republic of Azerbaijan"
}

步骤3:-搜索查询

端点:-http:// {{hostname}}:{{port}} / {{index}} / _search

{ "query": {
    "prefix" : { "company_name" : "az" }
  }
}

这将带来以下预期结果:

{
    "took": 870,
    "timed_out": false,
    "_shards": {
        "total": 1,
        "successful": 1,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 3,
            "relation": "eq"
        },
        "max_score": 1,
        "hits": [
            {
                "_index": "prerfixsearch",
                "_type": "_doc",
                "_id": "2ec9df0fc-dc04-47bb-914f-91a9f20d09efd15f2506-293f-4fb2-bdc3-925684a930b5",
                "_score": 1,
                "_source": {
                    "company_name": "AZ Infotech Inc"
                }
            },
            {
                "_index": "prerfixsearch",
                "_type": "_doc",
                "_id": "160d01183-a308-4408-8ac1-a85da950f285edefaca2-0b68-41c6-ba34-21bbef57f84f",
                "_score": 1,
                "_source": {
                    "company_name": "Aziia Avto Ust-Kamenogorsk OOO"
                }
            },
            {
                "_index": "prerfixsearch",
                "_type": "_doc",
                "_id": "1da878175-7db5-4332-baa7-ac47bd39b646f81c1770-7ae1-4536-baed-0a4f6b20fa38",
                "_score": 1,
                "_source": {
                    "company_name": "AZURE Midstream Partners LP"
                }
            }
        ]
    }
}

说明:
,正如早期的OP一样;在搜索结果中没有提到排除第4个文档,这就是我建议创建一个文本字段的原因,以便生成单个标记,但是现在只要求前缀搜索,所以我们不需要单个标记,我们只需要1个标记,但是应该将其小写以支持不区分大小写的搜索,这就是我在company_name字段上应用自定义规范化器的原因。



 类似资料:
  • 问题内容: 我正在使用Flask-SQLAlchemy从用户数据库中查询;但是,虽然 will return doing returns 我想知道是否有一种以不区分大小写的方式查询数据库的方法,以便第二个示例仍然返回 问题答案: 你可以使用过滤器中的或功能来完成此操作: 另一种选择是使用而不是进行搜索:

  • 问题内容: 有谁知道如何使用Postgres 7.4进行不区分大小写的搜索/查询? 我在考虑RegEx,但不确定如何执行此操作,或者不确定是否有函数/标志或可以添加查询的内容? 我正在使用PHP连接并执行查询。 因此,我正在寻找匹配地址信息的方法。 例子: 有什么想法吗? 问题答案: 使用,例如: 文件资料。 或者,您可以使用或,例如:

  • 问题内容: 我有这个json文件: 我使用以下Go代码搜索数据: 它会查找是否通过“板球”之类的相同字符串进行搜索,但是如果我搜索此“板球”之类的字符串,则不会找到它。 问题答案: 添加到您的RegEx。

  • 我有一个Spring Data Neo4j(3.4.0.RELEASE)实体,它带有一个

  • 我有一个字段,使用空白标记器和小写和asciifolding过滤器进行分析。我试图运行一个同时包含前缀和通配符的查询。我们正在用ElasticSearch取代一个使用纯Lucene的本土搜索引擎,类似的查询确实使用Lucene语法,但在ElasticSearch中不起作用。 例如,该查询将查找在“name”字段中有“Smith John”的所有文档。 如果我省略引号,我会得到结果,但这包括在同一文

  • 我从这里学了一个例子 索引的映射为 索引的文档是 在对“full_text”字段使用简单的匹配查询时,我注意到如下所示 我看到文件是匹配的。另外,如果我使用大写字母,也就是“quick”作为搜索词,它显示文档是匹配的。 为什么会这样?。默认情况下,标记器会将“full_text”字段中的文本拆分为“quick”、“foxes”。那么,匹配查询如何与文档匹配大小写值呢?