当前位置: 首页 > 知识库问答 >
问题:

带分隔符的Lucene多字标记

聂和宜
2023-03-14

我的问题是:有没有一个分析器能够检测标记周围的分隔符(在我们的示例中),或者有没有一个分析器能够检测多字结构?

恐怕我们必须创建自己的分析器,但我不太知道该从哪里开始。

共有1个答案

邵星光
2023-03-14

创建分析器非常容易。分析器只是一个标记器,可选地后跟标记筛选器。在您的情况下,您必须创建自己的标记器。幸运的是,您有一个方便的基类:Chartokenizer

实现Istokenchar方法,并确保它对字符返回false,对任何其他字符返回true。其他一切都将被视为令牌的一部分。

一旦有了标记器,分析器就应该很简单,只需查看任何现有分析器的源代码,然后照做。

 类似资料:
  • 我想显示一个项目列表,并使用“.” 我对此进行了研究,发现RecyclerView有一个内置的ItemDecoration功能。然而,我只能找到如何画一条线: 从我所看到的,您必须为此使用可绘制的,并且隐藏最后一个分隔符仍然不是很方便。 我发现的另一个选项是在RecyclerView的适配器内创建异构布局:https://guides.codepath.com/android/Heterogeno

  • 我有一个包含以下两个字段的Lucene 3.6.0索引(每个字段下面都有示例数据): 字段由多个代码字符串组成,例如“CHP-13724”或“RPS-204979”。 所以:在字段中,由于某种原因,它无法找到空格分隔的字符串,除非它是第一个字符串,并且在查询中使用了通配符,但是在company字段中,无论字符串出现在哪里,并且不使用通配符,它都可以找到。 编辑:字段使用not_analysis进行

  • 我想拆分从蓝牙获得的字符串。我正在使用 以前用分裂字符串做过。如果我在没有分隔符的情况下得到了大量的数据,应用程序就会崩溃,同时试图做不可能的事情。 如何检查是否有分隔符,然后继续拆分或跳过它?

  • 如何将过滤器列表拆分为单个过滤器元件?split2String在线程“main”java.util.regex中导致:异常。PatternSyntaxException:索引10或(|和)附近的未闭合组(

  • 我想在没有空格的标题中查找并分隔单词。 之前: 这是一个示例标题黑色-世界2019T.E.S.T.(测试)“测试”“测试”[测试] 之后: 这是一个例题标题HELLO-WORLD 2019 T.E.S.T .(测试)[测试]“测试”'测试' 我正在寻找一个可以执行以下操作的正则表达式规则。 我想我会识别每个以大写字母开头的单词。 但也要保留所有大写单词,以免将它们分隔为。 附加规则: 如果字母与数

  • 我需要验证显示的字符串是否为数字。值的格式为123.345.678,99。即分组分隔符是点,小数分隔符是逗号。 我尝试了设置分隔符的DecimalFormatter: 有什么想法吗? 我想我也可以使用regexp,但如果可能的话,我想首先使用这个。