5.1.1 数据收集相关问题
优质
小牛编辑
138浏览
2023-12-01
Open-Falcon数据收集,分为[绘图数据]收集和[报警数据]收集。下面介绍,如何验证两个链路的数据收集是否正常。
如何验证[绘图数据]收集是否正常
数据链路是:agent->transfer->graph->query->dashboard
。graph有一个http接口可以验证agent->transfer->graph
这条链路,比如graph的http端口是6071,可以这么访问验证:
# $endpoint和$counter是变量
curl http://127.0.0.1:6071/history/$endpoint/$counter
# 如果上报的数据不带tags,访问方式是这样的:
curl http://127.0.0.1:6071/history/host01/agent.alive
# 如果上报的数据带有tags,访问方式如下,其中tags为module=graph,project=falcon
curl http://127.0.0.1:6071/history/host01/qps/module=graph,project=falcon
如果调用上述接口返回空值,则说明agent没有上报数据、或者transfer服务异常。
如何验证[报警数据]收集是否正常
数据链路是:agent->transfer->judge
,judge有一个http接口可以验证agent->transfer->judge
这条链路,比如judge的http端口是6081,可以这么访问验证:
curl http://127.0.0.1:6081/history/$endpoint/$counter
# $endpoint和$counter是变量,举个例子:
curl http://127.0.0.1:6081/history/host01/cpu.idle
# counter=$metric/sorted($tags)
# 如果上报的数据带有tag,访问方式是这样的,比如:
curl http://127.0.0.1:6081/history/host01/qps/module=judge,project=falcon
如果调用上述接口返回空值,则说明agent没有上报数据、或者transfer服务异常。
注意: v0.2.1版本之后judge新增了优化内存使用的功能,如果metric没有对应的strategy或者expression,judge内存中不会存储该metirc的历史数据,所以判断报警数据收集这条链路是否正常时需要先确定metric是否有对应的报警条件
# 检查metric是否有对应的strategy
curl http://127.0.0.1:6081/strategy/$endpoint/$counter
# 检查metric是否有对应的expression
curl http://127.0.0.1:6081/expression/$counter
# $endpoint和$counter是变量
# expression报警条件必须包含tag,当metric上报数据没有携带tag时只检测是否有对应的strategy即可
# 举个例子:
curl http://127.0.0.1:6081/strategy/host01/cpu.idle
# counter=$metric/sorted($tags)
# 如果上报的数据带有tag,需要检测streategy和expression是否存在
# 举个例子: 当上报的metric为qps, tag为module=judge,project=falcon时, 访问方式是这样的:
curl http://127.0.0.1:6081/strategy/host01/qps
curl http://127.0.0.1:6081/expression/qps/module=judge
curl http://127.0.0.1:6081/expression/qps/project=falcon