当前位置: 首页 > 知识库问答 >
问题:

在elasticsearch中从索引数据中提取属性

巴照
2023-03-14

我很难理解ElasticSearch中标记器和分析器的可能性。

假设有一组产品的索引数据。每个产品都有一个带说明文本的字段。在描述中,一种颜色被命名。

是否可以使用内置的分析器或自定义的标记器/分析器来提取颜色信息(例如,基于一组关键字[红、绿、蓝、黄等]),并将新的颜色信息作为一个单独的字段附加到产品上?

这将是一个很好的功能,可以用通用属性(如颜色、材质等)来增加传入数据

共有1个答案

那安宁
2023-03-14

您描述的过程与实体识别有更多的关系。有不同的库可以提供文本:OpenNLP、UIMA等等。

您可能想看一下elasticsearch OpenNLP插件,它完全符合您的要求:检测实体并向传入文档添加相应的字段。

 类似资料:
  • 所以,我遇到了这个奇怪的问题:我正在使用Woocommerce Rest API,我需要从“images”数组中获取src。 我已经尝试将图像数组保存在另一个数组中,但我不知道如何从数组中获取“src”: 输出:〔〕、〔〕、〕、〔〕和〔{id=16.0,date_created=2018-11-08T15:21:14,date _create_gmt=2018-10-08 T15:20:14,日期

  • 我在平均堆栈程序中设置了Mongoostic。除了我从mongodb中删除一个文档外,其他一切都正常工作,它不会在elasticsearch索引中删除。因此,每次我进行包含删除项目的搜索时,都会返回已删除的项目,但当它水合时为空。Mongoostic是否处理从ES索引中删除?是否必须对索引刷新进行编程?

  • 我想知道在java中是否有一种方法可以在数组中的特定索引处提取和找到integer。然后我想把这个整数存储在一个变量中。这是可以做到的吗?

  • 问题内容: 我想做一些类似于此处NumPy数组的操作,更改不在索引列表中的值,但不完全相同。 考虑一个数组: 我知道我可以通过索引列表访问其元素,例如: 但是我还需要访问那些 不在列表中的元素。天真地,这是: 正确的方法是什么? 问题答案: In [170]: a = np.array([0.2, 5.6, 88, 12, 1.3, 6, 8.9]) In [171]: idx=[1,2,5] I

  • 我想从elasticsearch索引中删除一些数据,而不是完整的索引,我的问题是如何找到所有可用碎片的文档id。对此的查询是什么?? 我使用了以下查询来删除特定文档,但它抛出错误,所以我认为我的文档ID是错误的。请让我知道如何获取可用分片的正确文档ID。 我的数据流是postgresql到logstash到elasticsearch到kibana。但问题是索引大小正在增加很多,它进入GB的内存,而

  • 问题内容: 我已经创建了下面的对象,该对象将被映射到ElasticSearch类型。我想从索引中排除该属性: 问题答案: 您应该能够设置属性的值,如下所示: