当前位置: 首页 > 知识库问答 >
问题:

Lucene同义词过滤器行为

应瀚
2023-03-14
    null
    null

共有1个答案

洪弘壮
2023-03-14

通过设置keeporig=true(请参见synonymmap.builder.add()),SynonymFilter可以保留原始单词,并将同义词添加到标记流中。这种行为可能会导致短语等问题,请参见Synonymfilter文档的第一个注意事项。

如果您使用相同的Analyzer进行查询和索引,那么查询和写入索引的文档当然会被以相同的方式处理。Keeporig设置为true的Synonyfilter是少数几个经常在查询和索引之间不协调地应用的分析器之一,但这完全取决于您的实现。

至于它是如何实现的,源代码可供您使用。

 类似资料:
  • 我可以调试这个代码和逻辑路径似乎是正确的。如果我尝试搜索,我会发现带有或的文档,但是没有结果,例如,。 我想念什么?

  • 因此,从本页的文档来看,似乎我可以用令牌生成器、令牌过滤器和字符过滤器构建一个自定义瞬态分析器,并使用Analyze API对我的示例文本进行测试。 目标是,我想看看同义词令牌过滤器是否满足我的需求,即哪些术语被标记为同义词,哪些不满足。 但是当我这么做的时候 curl-XGET'localhost:9200/u分析?char\u filters=html\u条 我得到的不是结果,而是 知道我做错

  • 我试图创建自己的StopFilter实现,它将根据其他字段选择术语。 是否有一种方法可以从标记筛选器访问文档,然后访问其他字段? (我想使用UpdateRequestProcessor来通知我的TokenFilter关于状态的信息,但我没有找到很好的方法) 谢谢,本尼

  • 演示在网关追加一个header public class CustomFilter implements GlobalFilter, Ordered { @Override public Mono<Void> filter(ServerWebExchange exchange, GatewayFilterChain chain) { // 演示在网关追加heade

  • SOFARPC 提供了一套良好的可扩展性机制,为各个模块提供 SPI 的能力。 SOFARPC 对请求与响应的过滤链处理方式是通过多个过滤器 Filter 来进行具体的拦截处理,该部分可由用户自定义 Filter 扩展,自定义 Filter 的执行顺序在内置 Filter 之后。具体方式如下: Bolt Filter 新建自定义 Filter 。 public class CustomFilter

  • 问题内容: 我试图在Log4J2中实现和配置自定义过滤器- 基于ThresholdFilter,但打算做更多。我已经看到了有关自定义追加程序的主题,这些主题遵循相同的插件注释语法,但是还没有找到有关自定义拟合程序的主题。 MyCustomFilter.java (基于ThresholdFilter) log4j2.xml LoggingRunner.java 配置语法似乎与Apache文档中的语法