当前位置: 首页 > 知识库问答 >
问题:

在数据库上执行Drools规则引擎以删除重复项

浦出野
2023-03-14

我的问题不是关于流口水或规则引擎,而是我有一个特定的用例,我计划使用规则引擎。我通读了所有的问题,并在谷歌上搜索,但没有找到最合适的。下面是我的查询

我们有一个爬虫引擎,它以DB的形式输出数据。由于数据量巨大,我们经常会有较少的重复条目。目前,这些规则紧密地绑定在数据库表中,并使用复杂的查询。我曾想过有一个规则引擎,可以在桌面上运行,但我无法通过规则实现它。我错过什么了吗?或者我的理解是错误的。

  1. 第一个问题是,使用规则引擎是正确的方法吗
  2. 第二,是否可以使用规则。我找不到一种在阵列上发射规则的方法

问题可能很幼稚,但我仍然没有找到解决办法。

共有1个答案

商燕七
2023-03-14

因为你所说的流口水真的不合适。然而,取决于你想要达到的目标,你可能会发现它很有用。您可以使用规则引擎来防止插入重复项,而不是删除重复项。为了实现这一点,您需要有一个有状态的会话,其中包含您现有的记录集,并且您可以在Drools中编写自己的评估规则,将传入的条目标记为重复条目。执行后,您可以决定是否将此新条目作为副本保存或丢弃。你应该考虑的是:

  • 你想在这项任务上投入那么多时间/精力吗
  • 例如,您真的需要一个规则引擎吗?您是否希望验证逻辑经常更改
  • 口水的表现会有什么问题吗?(数据量或传入记录的频率可能超过Drools的能力)
 类似资料:
  • 我有这样的情况,在规则文件中的所有规则必须检查执行。如果我的理解是正确的,文档所说的规则将由引擎任意执行。 我有一个或多个疑问。 > 我在许多地方得到了答案,我必须使用显著性功能来按顺序执行它们。如果我使用显著性,并且我有执行所有规则的要求,它真的会大规模地影响性能吗?如果是,它会如何影响性能,甚至规则引擎也会任意执行所有规则,比如一些随机顺序。 提前谢谢。

  • 我正在向drools规则引擎插入数据,但我无法理解它是如何处理插入的数据的。插入数据的代码是:

  • 我在试着处理drools中的列表。我正在传递一个请求,其中包含一个购买列表。我想做几个规则,包括检查大小是否正确,然后如果所有元素都相同,如果所有购买都经过授权。。。我有以下代码,但在使用列表时遇到了问题。这是正确的方法吗?尤其是在检查尺寸时?

  • 有没有什么方法可以动态编辑加载到Drools中的规则,而不需要重新加载新的DRL文件? 我们试图使用Drools作为规则引擎,但在我们的用例中,规则的添加和删除非常频繁,我们希望避免每次发生这种情况时都必须重新加载整个.drl文件。

  • 这是我的用例。我们正在尝试使用Drools实现策略服务器。可能有几十万(~200K)条规则,都是基于数据驱动的。一些示例规则: 注意:我在这里只使用了4个参数,但在任何给定的规则中最多可以有20个参数 策略#1和策略#2看起来简单明了。然而,策略#3很棘手。策略#3的最后一个条件(BORN\u STATE\u supporting=TRUE)表示策略上的状态是“包含的”,这意味着,如果规则匹配,结

  • 我正在从事这个项目,我的角色是开发使用标准健康保险xml的服务。服务必须在不同的xml字段上进行验证,这涉及将xml数据与数据库表中的数据进行比较。目前,我们假设所有保险公司的验证保持不变。但我怀疑它会保持不变,并且每家公司可能有不同的验证要求。在这种情况下,使用Drools规则引擎并为每家公司开发drl文件并使用规则引擎进行xml验证是个好主意吗