Cloudinsight 是一个可视化系统监控工具,能够对数据指标进行聚合、分组、过滤、 管理、计算;并提供团队协作功能,共同管理数据和报警事件。而这些的关键,正是 Cloudinsight Agent。
目前探针存在的问题:
各个服务的数据抓取存在强依赖关系,任何一个服务阻塞都可能导致探针进程挂掉。
缺乏对 log 和 json 的支持,用户需要通过 sdk 解析相关数据。
针对 自定义Plugin 的支持不够灵活,用户需要熟悉 Python,并按照探针定义好的接口上传数据。
探针使用 Omnibus 进行打包部署,虽然能解决用户安装上的一些问题,但对于新人来说,上手确实不是件容易的事,况且这个项目本身也有一些 bug,经历过的人自然懂。
用 Golang 重写:
解决以上提到的种种问题。
优化探针架构。
提升探针性能。
开源,接受社区的监督,让深度用户可以参与到探针的版本迭代中来。
目前 Golang 版探针还是 Beta 版,所以现在支持的平台服务还不多,但这正是我们将 Cloudinsight Agent 上的工作推向开源的第一步,也希望有更多的开发者参与进来,让项目能有更快的进展。
项目计划
增加支持的平台和平台服务
目前用 Golang 重写的 Cloudinsight Agengt 仅在 Linux 上进行了测试,未来会逐渐将原有 Python 探针支持的平台和平台服务替换至 Golang 版本,包括但不限于:
加入项目
配置要求:Go 1.5 以上版本
$ mkdir -p $GOPATH/src/github.com/cloudinsight $ cd $GOPATH/src/github.com/cloudinsight $ git clone https://github.com/cloudinsight/cloudinsight-agent $ cd cloudinsight-agent $ make build
使用
首次使用需设置 License Key,可在 https://cloud.oneapm.com/#/settings 中获取
$ cp cloudinsight-agent.conf.example cloudinsight-agent.conf $ vi cloudinsight-agent.conf ... license_key = "*********************"
在前台中运行命令
$ ./bin/cloudinsight-agent
功能特色
使用标签高效管理集群和云主机
Cloudinsight 支持多种操作系统和云主机的监控,在一个平台上对所有基础设施进行集中管理。通过标签,对基础设施进行有效地管理。
仅需一条命令, 30S 即可安装
Cloudinsight Agent 安装只需一条指令,配置数据库监控也只需要打开配置文件即可。
线上支持多达 50 种平台和平台服务
丰富的可视化展现,提高性能指标可读性
Cloudinsight 提供丰富的展现形式,从曲线图、柱状图、区域图,到排行榜、 热点图、HostMap。在自定义仪表盘中也支持自定义 HTML,为展现形式带来了更多发挥空间,也让性能指标拥有更高的可读性。
数据集中处理和计算
Cloudinsight 将所有性能指标作为时间序列数据来处理,提供对数据的聚合、过滤、分组、计算;方便运维人员来组合不同主机的数据,和发现数据之间的关系,以及组合出满足自身业务的抽象性能指标。
协同管理报警
Cloudinsight 可以对每项性能指标来设置报警,并在触发阈值时产生告警 事件,分派到具体责任人。在 Cloudinsight 仪表盘中,支持将任一历史时段的性能指标曲线分享给任 何人;也支持在产品内部分享、评论、提醒团队中的人,来查看某项指标、 处理某项告警事件。
#!/bin/bash # Cloudinsight Agent install script. set -e logfile="ci-agent-install.log" gist_request=/tmp/agent-gist-request.tmp gist_response=/tmp/agent-gist-response.tmp if [ $(command -v curl) ]; t
nmon 说明 官网:http://nmon.sourceforge.net/pmwiki.php 分析工具 nmon analyser:https://www.ibm.com/developerworks/community/wikis/home?lang=en nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与分析工具, nmon所记录的信息是比较全面的,它能在系统运行过程中实时
统计分析是了解数据集中的变量如何相互关联以及这些关系如何依赖于其他变量的过程。可视化是此过程的核心组件,这是因为当数据被恰当地可视化时,人的视觉系统可以看到指示关系的趋势和模式。 我们将在本教程中讨论三个seaborn函数。我们最常用的是relplot()。这是一个relplot()将FacetGrid 与两个 axes-level 函数组合在一起: scatterplot() (kind="sc
可视化监测 为了查看可视化容器背后的原始数据,点击容器左下方 按钮,可视化监测窗口将会打开。可以选中查看原始数据详情。 表格. 分页表格形式呈现的基础数据。可以点击表头每行字段名的上下箭头来按照该列排序。 请求. 服务器原始请求数据,以 JSON 形式呈现。 响应. 服务器原始响应数据,以 JSON 形式呈现。 统计. 请求和响应的统计汇总数据,以表格形式呈现。包括查询周期,请求周期,查询到的记录
业务监控子系统分为单机版和集群版两个版本,单机版只需依赖一个用于存储监控数据的Mysql数据库即可正常运行,而集群版则需要在单机版的基础上,在监控数据收集端部署一个服务端程序进行相关的数据聚合入库处理。 整个业务监控子系统不管是单机版还是集群版,都是基本一个给Java服务的各项指标提供度量工具的包Metrics进行扩展实现的,这样可以有效保证底层监控指标统计算法的性能和正确性,在此基础上,本系统扩
字符云监控系统(xrkmontor), 国产开源监控系统:专注于通过监控系统对软硬件系统进行掌控以及系统相关数据的可视化,通过插件化进制完成对通用项目监控的复用,支持多种开发语言开发接口以便能为各类语言开发者所用,支持在线部署。 登录界面 相比其它开源监控系统优势 支持插件功能, 监控插件无需开发,自由选择监控插件,安装即可使用 集成告警功能, 支持多种告警方式 集成分布式日志系统功能 支持多种部
基于ARM平台开发的 仓储安防监控系统. camera : 摄像头视频采集,JPEG压缩,YUVT转换. serial : 串口,GPRS. Lcd : 绘制字体,绘制图片,绘制摄像录像,触摸屏事件监控. lib : 数据结构库,线程池. gui : button控件,触摸屏事件监听. image : 图像C文件. init : 初始化启动程序. resource: 资源文件. socket :
我正在寻找一个非常好的工具或开源系统来监控我的hadoop生态系统,包括像hadoop,火花,oozie,纱线,hdfs,蜂巢,hbase,Kafka,动物园管理员等组件。 我得到了ambari,但我发现当前的ambari可以用来从头开始部署和管理我的系统,而不是管理我现有的hadoop系统。 有什么建议吗?
iostat是I/O statistics(输入/输出统计)的缩写,用来动态监视系统的磁盘操作活动。 11.1. 命令格式 iostat[参数][时间][次数] 11.2. 命令功能 通过iostat方便查看CPU、网卡、tty设备、磁盘、CD-ROM 等等设备的活动情况, 负载信息。 11.3. 命令参数 -C 显示CPU使用情况 -d 显示磁盘使用情况 -k 以 KB 为单位显示 -m 以 M