目标分析:
所需的监控资源:
1、登陆用户数
2、CPU负载
3、服务探测
4、硬盘空间(根分区、应用分区、备份分区)
5、内存资源
短信接口、邮件接口
格式上传至附件
脚本:
#!/bin/bash #监控用户登录 Usermonitor () { LoginUser=`uptime | awk '{print $6}'` if [ $LoginUser -ge 2 ] then Critical="当前系统登录用户人数超过1人,具体人数为:$LoginUser 个,请确认操作者人数。" status=0 else echo "loginuser ok" status=1 fi 013. } #监控内存 MemMonitor () { MemTotal=`free -m | grep Mem | awk -F: '{print $2}' | awk '{print $1}'` MemFree=`free -m | grep cache | awk NR==2 | awk '{print $4}'` MemFreeB=`awk 'BEGIN{printf "%.2f%\n",'$MemFree/$MemTotal\*100'}'` MemFreeS=`awk 'BEGIN{printf "%.f",'$MemFree/$MemTotal\*100'}'` if [ $MemFreeS -lt 10 ] then Critical="系统可用内存小于10%,实际可用内存为:$MemFreeB ,请处理。" status=0 elif [ $MemFreeS -lt 20 ] then Warning="系统可用内存小于20%,实际可用内存为:$MemFreeB ,请查看。" WarningT="内存报警" status=1 else echo "Mem OK" status=2 fi } #监控分区空间大小 DiskMonitorG () { #根分区 DiskGB=`df -h | awk NR==2 | awk '{print $5}'` DiskGS=`df -h | awk NR==2 | awk '{print $5}' | awk -F% '{print $1}'` if [ $DiskGS -gt 90 ] then Critical="根分区使用率超过90%,实际已使用 $DiskGB ,请处理。" status=0 elif [ $DiskGS -gt 80 -a $DiskGS -lt 90 ] then Warning="根分区使用率超过80%,实际已使用 $DiskGB , 请查看。" WarningT="根分区报警" status=1 else echo "DiskGB Ok" status=2 fi } DiskMonitorA () { #应用分区 ApplyB=`df -h | awk NR==4 | awk '{print $5}'` ApplyS=`df -h | awk NR==4 | awk '{print $5}' | awk -F% '{print $1}'` if [ $ApplyS -gt 90 ] then Critical="应用分区使用率超过90%,实际已使用 $ApplyB ,请处理." status=0 elif [ $ApplyS -gt 80 -a $ApplyS -lt 90 ] then Warning="应用分区使用率超过80%,实际已使用 $ApplyB ,请查看。" WarningT="应用分区报警" status=1 else echo "Apply ok" status=2 fi } #监控CPU负载 CPULoad () { CPULoad1=`uptime | awk '{print $10}' | awk -F. '{print $1}'` CPULoad2=`uptime` if [ $CPULoad1 -gt 5 ] then Critical="CPU负载过高,请即使处理。 $CPULoad2 " status=0 elif [ $CPULoad1 -gt 3 -a $CPULoad1 -lt 5 ] then Warning="CPU负载警告, $Warning " WarningT="CPU负载报警" status=1 else echo "CPU OK" status=2 fi } #监控服务状态 ServerMonitor () { #服务状态监控 timeout=10 makfails=2 fails=0 success=0 while true do /usr/bin/wget --timeout=$timeout --tries=1 http://192.168.20.84/ -q -O /dev/null if [ $? -ne 0 ] then let fails=fails+1 success=0 else fails=0 let success=1 fi if [ $success -ge 1 ] then exit 0 fi if [ $fails -ge 1 ] then Critical="应用服务出现故障,请紧急处理!" echo $Critical | mutt -s "服务down" hao.lulu@chinaebi.com exit -1 fi done } #发送报警短信、报警邮件 for n in Usermonitor MemMonitor DiskMonitorG DiskMonitorA CPULoad ServerMonitor do $n if [ $status -eq 0 ] then curl "http://172.20.36.118/app/tms.do?tranCode=TM0311&;content=$Critical" elif [ $status -eq 1 ] then curl "http://172.20.36.118/app/tms.do?tranCode=TM0310&;title=$WarningT&content=Warning" else echo "ok" fi done
总结
以上所述是小编给大家介绍的shell监控系统资源并通过短信报警的脚本,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对小牛知识库网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
本文向大家介绍Shell脚本实现Linux系统和进程资源监控,包括了Shell脚本实现Linux系统和进程资源监控的使用技巧和注意事项,需要的朋友参考一下 在服务器运维过程中,经常需要对服务器的各种资源进行监控,例如:CPU的负载监控,磁盘的使用率监控,进程数目监控等等,以在系统出现异常时及时报警,通知系统管理员。本文介绍在Linux系统下几种常见的监控需求及其shell脚本的编写。 文章目录:
本文向大家介绍shell脚本实现磁盘监控系统,包括了shell脚本实现磁盘监控系统的使用技巧和注意事项,需要的朋友参考一下 利用shell脚本实现每隔60秒磁盘内存数据监控 效果如图: 以上就是shell脚本实现磁盘监控系统的详细内容,更多关于shell 磁盘监控的资料请关注呐喊教程其它相关文章!
为了全面了解系统状态以及用户使用情况,Talos提供了比较完善的Counter系统,Counter系统设计的初衷为了了解以下方面的信息: 系统性能、负载状况;例如latency,qps等 数据存储情况;例如Topic数据量,Partition当前的offset range情况: [start, end] 数据消费情况;例如consumer group消费记录的checkpoint,消费数据堆积情况
本文向大家介绍Shell脚本编写Nagios插件监控程序资源占用,包括了Shell脚本编写Nagios插件监控程序资源占用的使用技巧和注意事项,需要的朋友参考一下 一般情况下,我们只需要监控程序进程在没在就可以了。但是这次遭遇了这样的事,公司开发的程序,程序进程还在,但是死锁了。导致大范围的影响,更要命的是根本不知道问题出在哪里,还是别的测试部同事帮忙发现的,真是丢尽运维的脸了… 为避免下次再遭遇
本文向大家介绍Shell脚本实现检测某ip网络畅通情况(含短信报警功能),包括了Shell脚本实现检测某ip网络畅通情况(含短信报警功能)的使用技巧和注意事项,需要的朋友参考一下 花了1天的时间写了一个检测某ip是否网络畅通的脚本,只检测网络是否畅通的功能很容易实现,但加了一些限制功能却不好实现。
1. 前言 因为公司开发的项目多、为客户部署的项目实例多。工作中我们都会经常遇到,由于某个客户的项目突然无法访问,一堆研发、售后部门的同事火急火燎处理问题的场景。 所以我非常希望能够实现这样的功能: 能够有一个界面,监控所有关注的项目实例运行状态。 对于某个项目实例来说,可以监控该实例的各项运行参数,例如内存占用情况、磁盘使用情况、数据库连接情况。 项目实例因各种原因关闭时,可以自动报警。 在很长