open-falcon是一个监控系统,里面提供了很多api,可供使用。
公司是做的加速器,用open-falcon来监控调度系统各种信息,便于监控各个节点的调度信息。在服务器安装了falcon-agent,自动采集各项指标,主动上报。
agent
采集机器负载监控指标,每隔60秒push给transfer。agent与transfer建立了长连接,数据发送速度快。
transfer
数据转发服务,接收agent上报的数据,然后按照hash规则进行数据分片,并将分片后的数据push给graph&judge等组件
graph
存储绘图数据的组件。接收transfer组件推送来的监控数据,同时处理query组件的查询请求,返回绘图数据。
query
提供统一的绘图数据查询入口,query接收查询请求,根据一致性hash算法去相应的graph实例查询不同的metric的数据,然后汇总拿到的数据,最后统一返回给用户.
dashbord
面向用户的查询界面。可以看到push到graph中的所有数据,并查看数据发展趋势
邮件短信发送接口
自行提供。监控系统发生报警事件后需要发送报警邮件或者报警短信。
judge
警告判断,agent将数据Push给transfer,transfer不但会转发给graph,还会转发给judge用来判断是否触发警告。
alarm
处理报警event,judge产生的event写入redis,alarm从redis读取
task