我是德鲁伊的新手。我已经读过《Druid VS Elasticsearch》,但是我仍然不知道德鲁伊擅长什么。
以下是我的问题:
我有一个具有70个节点的Solr集群。
我在solr中有一个很大的表,其中有10亿行,每行有100个字段。
用户将使用不同的字段组合范围查询(一次查询至少20个组合)来计算客户ID的不重复数量,但是solr的不重复计数算法非常慢且占用大量内存,因此如果查询结果为超过20万个,solr的查询节点将崩溃。
Druid 在数量上是否比solr更好?
Druid 与特定于搜索的数据库(例如ES / Solr)有很大的不同。它是为分析而设计的数据库,您可以在其中进行汇总,列过滤,概率计算等。
通过使用HyperLogLog(一种概率数据结构),Druid确实具有独特的意义。因此,如果您不担心100%的准确性,则可以肯定地尝试Druid,而我在我的一个项目中看到的响应时间得到了极大的改善。但是,如果您在乎准确性,那么Druid可能不是最佳解决方案(即使在Druid中也有可能实现,但会影响性能并占用更多空间)-在此处查看更多信息:
https:// groups。 google.com/forum/#!topic/druid-
development/AMSOVGx5PhQ