问题：

Elasticsearch“keep\u types”过滤器不适用于“pattern”标记器

艾望

2023-03-14

我在使用带有“模式”标记器的“keep\u types”过滤器时遇到问题，下面是一个示例：

    {
        "tokenizer": {
            "type": "pattern",
            "pattern": "[()., _-]"
        },
        "filter": [
            "lowercase",
            "asciifolding",
            {
                "type": "keep_types",
                "types": [
                    "<ALPHANUM>"
                ]
            }
        ],
        "text": [
            "7002982065_8031949292_Bomba (Vácuo,pressão) - Suryha.pdf"
        ]
    }

针对_analyze API的结果是：

  {
    "tokens": []
  }

如果我移除keep_types它按预期工作。

我还注意到，如果我使用“标准”分析器，它可以很好地工作，但在这种情况下，它不会以所需的方式标记文本。

我使用的是6.8版本，但在7.5版本中也尝试了相同的结果。。。

有什么想法吗？

共有1个答案

冯霖

2023-03-14

我能够使用“字母”标记器获得预期结果，它删除数字和引号，而不需要过滤器。

{
    "tokenizer": {
        "type": "letter"
    },
    "filter": [
        "lowercase",
        "asciifolding"
    ],
    "text": [
        "7002982065_8031949292_Bomba (\"Vácuo,pressão) - Suryha.pdf"
    ]
}

结果是

[
  "bomba",
  "vacuo",
  "pressao",
  "suryha",
  "pdf"
]

但我仍然认为这是值得回答的主要问题所以我会保持开放

类似资料：

HiberNate过滤器不适用于加入实体

我试图理解Hibernate过滤器，我认为即使查询不是从过滤的实体开始，也可以应用过滤器，如果我只是加入它。我的实体：过滤器通过拦截器启用，为了安全起见，从数据库中获取参数列表。当我执行这样的查询时：过滤器被应用了。但是我也希望当我的查询从模块部分开始时应用过滤器：在上述查询中，没有应用筛选器。 ModuleSect实体中的学术类为null，但我也有其他实体不为空，其中上述情况不起作用。
弹性搜索过滤器不适用于多值json
Elasticsearch不同的过滤器值

问题内容：我在elasticsearch中拥有大型文档存储，并希望检索不同的过滤器值以显示在HTML下拉列表中。一个例子是像下拉列表应包含部门列表，即IT，客户和管理部门。请问有什么好心的人向我指出正确的方向，以便从Elasticsearch检索不同的部门列表吗？谢谢问题答案：这是聚合（文档）的工作。您可以使用以下不同的值：在您的示例中，输出：另外两个注意事项：设置为0会将最
Elasticsearch过滤查询与过滤器

问题内容： “过滤后的查询和过滤器”与“根查询和过滤器”之间有什么区别吗？例如情况1：情况2：我在http://elasticsearch-users.115913.n3.nabble.com/Filtered-query-vs-using- filter-outside-td3960119.html中找到了此讨论，但所引用的URL是404，并且解释过于简洁我。请示教或提供指出这些区别的
用过滤器记录

问题内容：我正在使用日志记录（）记录消息。在1个单一模块中，我正在调试级别记录消息；其中一些调试消息来自于其他消息; 我希望能够基于它们是来自a还是来自b来启用/禁用日志记录；我猜想我必须使用日志记录的过滤机制。有人可以告诉我下面的代码如何被执行我想要的工作吗？如果将这个简单的示例扩展到更多模块和每个模块更多的功能，我会担心很多记录器；是否可以将每个模块的记录器数量限制为1个？请注意
使用短语（而不是单个单词/标记）的ElasticSearch布尔过滤器

在弹性搜索中，此过滤器正确返回标题中带有“Google”的文章。然而，不返回任何结果，尽管事实上有些文章的标题中有“Google Earth”的确切字样。我希望它这样做。完整查询： FWIW，我在“filter”字段中有此条件的原因是（与使用标准查询相反），有时我希望使用“must_not”而不是“must_not”，有时我还向查询添加其他元素。

Elasticsearch“keep\u types”过滤器不适用于“pattern”标记器

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档