翻译自OpenStack1.8.0官方文档第六章,网址:
目录:
Swfit Recon
Swift-Informant
Statsdlog
Swift StatsD Logging
摘抄自Darrell Bishop的博客
OpenStack对象存储监控集群是一个十分复杂的怪物,有很多守护进程在不同的结点同时运行。正式因为有这些“运动的部分”才能清楚的告诉集群运行的情况如何。监控和记录服务器级别的度量,比如CPU使用率、负载、内存消耗,磁盘使用情况和利用率等是必要的,但不是充分的。我们需要知道每台服务器上的不同的守护进程都在做什么。node8上对象复制的体积?使用的多长时间,有没有错误,如果有的话,何时发生。
在这样一个复杂的生态系统中,毫无疑问有多种途径获得这类问题的答案。让我们来看看OpenStack对象存储监控的一些现有的方法。
Swift Recon
Swift Recon中间件可以提供一般的机器统计(平均负载,插座统计 的/ proc / meminfo中的
内容等等),以及SWIFT具体指标:
还有一些不错的对象存储集群统计,但是大多数服务器度量与已有的服务器监控系统重叠,将Swift指定度量纳入系统中,他们必须被轮询。Swift实际充当一个度量收集者的中间人。实际上将度量反馈给你的统计系统的是collectd、gmond等,他们可能已经在存储结点上运行了。因此可以说Swfit Recon就是收集度量本身。
Swift Recon即将有一个更新,将会扩大对account和container server的支持。auditors, replicators和updaters都将可以报告统计数据,但只限于最近期的运行。
Swift-Informant
Florian Hines 开发了Swift-Informant中间件用来实现对象存储客户端请求的实时可视性。它位于proxy server的管道中,在每次对proxy server的请求后都发送三个度量给StatsD服务器:
obj.GET.200
或 cont.PUT.404
。duration.acct.GET.200
,但我没有看到在代码中的“持续时间”。我不知道Etsy的服务器上做什么,但我们的StatsD服务器将定时度量分为5个细分指标,所以它可能为编码工作。第一个度量上面会变成acct.GET.200.lower
,acct.GET.200.upper
,acct.GET.200.mean
acct.GET.200.upper_90
,acct.GET.200.count
】tfer.obj.PUT.201
。未完待续。。。