问题：

跨XDB度量查询？

慕朝明

2023-03-14

我在XDB数据库中有3个时间序列指标，类似于：

myservice_processed
myservice_invoked
myservice_error

为了得到一组时间序列值，我有一个grafana图，它映射：

select sum(value) from myservice_processed where $timeFilter GROUP BY time($interval) fill(null)

...对于三个值中的每一个。这提供了一个每分钟发生多少次调用、成功和失败的概念。通常，处理的和错误的总和应等于调用的的值。

现在，我想要得到一个基于上述指标的时间序列值，它给出了失败的百分比。例如，在任何给定的时间间隔内，我可能有1000次调用，900次处理，100次错误；我希望这个指标在这个时间间隔内是10%。

对我来说，我不知道如何做到这一点，我已经开始怀疑这是不可能的，这让我难以置信。有人能告诉我我错了，告诉我怎么做吗？

共有3个答案

南门茂才

2023-03-14

XDB缺乏做这类事情的分析结构。如果您想坚持使用influxdb，您必须在外部层中实现它，并将数据反馈回influx。

谢志文

2023-03-14

 
  
  匿名用户 
  

  
 
   
  这可以通过一组连续查询在XDB中完成。
  XDB的工作原理似乎是存储便宜，而非计划的处理器时间昂贵。设置存储结果的后台连续计算很容易，而且可以让计算在后台安静地搅动。在XDB中进行动态计算很快就会变得笨拙（或者不可能，如果它们跨越测量范围的话）。
  每五分钟，对每个度量进行一次求和，按时间分组，并将求和插入第四个度量，称为myservice\u summary。
  myservice\u summary将有多个字段，而不是一个名为value的字段；一个用于调用的调用，一个用于已处理的调用，另一个用于有错误的调用。我们将字段命名为对读取数据的人有意义的名称，而不是默认名称值。
  请注意，使用GROUP BY time（x）（在本例中，每五分钟一次）压缩数据也减少了存储开销和客户端查询时间（在客户端检索、传输和显示的点更少）。它还降低了存储需求。它是常见的使用至少两种保留策略：原始数据得到修剪在很短的时间内（例如30天），和压缩和处理的数据可以保持更长的时间（例如月，年，...）
  当然，按时间选择过大的组（）间隔意味着粗分辨率可能不利于故障查找。e、 g.当您需要知道在哪一个小时内开始寻找特定更改时，按时间分组（1d）没有多大用处。
  最佳时间分组窗口平衡了问题何时开始/停止的有意义检测与客户端响应速度和存储负载。找到这个最佳值是留作为一个练习。：）
  请注意，使用CLI时，对于下面三个连续查询中的每一个，从CREATE continuous QUERY到END的所有内容可能都需要在一行上，以避免语法错误。我把换行符放进去只是为了提高可读性。
  方括号[]表示可选参数。括号本身不包括在字面上。
  在这种情况下，您将使用额外的标记键来选择哪些键是重要的，并且应该在新的度量中。
  CREATE CONTINUOUS QUERY myservice_processed_sum_5m ON your_db_name
BEGIN
    SELECT sum(value) AS processed_sum_5m 
    INTO myservice_summary 
    FROM myservice_processed GROUP BY time(5m)[, other_tag_keys e.g. vendor_id]
END 

CREATE CONTINUOUS QUERY myservice_invoked_sum_5m ON your_db_name
BEGIN
    SELECT sum(value) AS invoked_sum_5m 
    INTO myservice_summary 
    FROM myservice_invoked GROUP BY time(5m)[, other_tag_keys e.g. vendor_id]
END 

CREATE CONTINUOUS QUERY myservice_error_sum ON your_db_name
BEGIN
    SELECT sum(value) AS error_sum_5m 
    INTO myservice_summary 
    FROM myservice_error GROUP BY time(5m)[, other_tag_keys e.g. vendor_id]
END

  现在我们有了一个新的度量，称为myservice\u summary，它有三个字段：processed\u sum\u 5m，invoked\u sum\u 5m，和error\u sum\u 5m（假设5分钟的总结是您想要的）。
  在此基础上，查询过去24小时的不合格率为：
  SELECT (error_sum_5m / invoked_sum_5m) * 100.0 
    AS error_pct_5m
    FROM myservice_summary
    WHERE time > now() - 1d
    [GROUP BY other_tags e.g. vendor_id]

  或者用表格形式：
  SELECT [vendor_id, etc, ](error_sum_5m / invoked_sum_5m) * 100.0 
    AS error_pct_5m
    FROM myservice_summary
    WHERE time > now() - 1d

  在另一个CQ中使用存储在myservice\u summary中的结果是可能的，但我不能100%确定是否要避免竞争条件，即，如果依赖于myservice\u summary的CQ在填充该度量的查询之前执行，该怎么办？
  希望有帮助。

濮阳鸿卓

2023-03-14

这目前是不可能的，因为Influxdb目前不支持多个系列的聚合功能（Influxdb 1.0）

到目前为止，Grafana不支持时间序列计算，但我们确实有一张票https://github.com/grafana/grafana/issues/3677

跨XDB度量查询？

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档