当前位置: 首页 > 软件库 > 管理和监控 > 系统监控 >

Watchdog

Linux 看门狗
授权协议 GPL
开发语言 C/C++
所属分类 管理和监控、 系统监控
软件类型 开源软件
地区 不详
投 递 者 锺离德庸
操作系统 Linux
开源组织
适用人群 未知
 软件概览

Linux 自带了一个 watchdog 的实现,用于监视系统的运行,包括一个内核 watchdog module 和一个用户空间的 watchdog 程序。

内核 watchdog 模块通过 /dev/watchdog 这个字符设备与用户空间通信。用户空间程序一旦打开 /dev/watchdog 设备,就会导致在内核中启动一个 1分钟的定时器,此后,用户空间程序需要保证在 1分钟之内向这个设备写入数据,每次写操作会导致重新设定定时器。如果用户空间程序在 1分钟之内没有写操作,定时器到期会导致一次系统 reboot 操作。

用户空间程序可通过关闭 /dev/watchdog 来停止内核中的定时器。

用户空间的 watchdog 守护进程:

在用户空间,还有一个叫做 watchdog 的守护进程,它可以定期对系统进行检测,包括:

  • Is the process table full?
  • Is there enough free memory?
  • Are some files accessible?
  • Have some files changed within a given interval?
  • Is the average work load too high?
  • Has a file table overflow occurred?
  • Is a process still running? The process is specified by a pid file.
  • Do some IP addresses answer to ping?
  • Do network interfaces receive traffic?
  • Is the temperature too high? (Temperature data not always available.)
  • Execute a user defined command to do arbitrary tests.

如果某项检测失败,则可能导致一次 soft reboot (模拟一次 shutdown 命令的执行)

它还可以通过 /dev/watchdog 来触发内核 watchdog 的运行。

  • 前言 Watchdog 是 Linux 系统一个很重要的机制,其目的是监测系统运行的情况,一旦出现锁死,死机的情况,能及时重启机器(取决于设置策略),并收集crash dump. watchdog,顾名思义,看门狗。这就说明,有一个被watch的对象,和一个watch它的程序。 无论是内核watchdog,还是userland watchdog,其基本思路都是: 1. 假定某一个对象的状态能表征系

  • 1. 前言 本文主要是学习了Watchdog机制以及问题分析这篇文章,作者详细阐述了Android watchdog的实现机制,并用实际案例说明一次watch dog重启发生的原因,个人认为非常有帮助。 Android在软件层面设计了Watchdog,主要目的是检测各个重要的系统服务,防止出现死锁等问题导致系统服务卡死,如果发现有系统服务长时间无法退出,就会杀死系统服务,导致系统重启。 2. wa

  • 看门狗,又叫 watchdog timer,是一个定时器电路, 一般有一个输入,叫喂狗,一个输出到MCU的RST端,MCU正常工作的时候,每隔一端时间输出一个信号到喂狗端,给 WDT 清零,如果超过规定的时间不喂狗,(一般在程序跑飞时),WDT 定时超过,就回给出一个复位信号到MCU,是MCU复位. 防止MCU死机. 看门狗的作用就是防止程序发生死循环,或者说程序跑飞。 工作原理:在系统运行以后也

  • 一、概述 Android系统中,有硬件WatchDog用于定时检测关键硬件是否正常工作,类似地,在framework层有一个软件WatchDog用于定期检测关键系统服务是否发生死锁事件。WatchDog功能主要是分析系统核心服务和重要线程是否处于Blocked状态。 监视reboot广播; 监视mMonitors关键系统服务是否死锁。 二、WatchDog初始化 2.1 startOtherSer

  • Android Watchdog 机制 早期手机平台上通常是在设备中增加一个硬件看门狗(WatchDog), 软件系统必须定时的向看门狗硬件中写值来表示自己没出故障(俗称“喂狗”), 否则超过了规定的时间看门狗就会重新启动设备. 大体原理是, 在系统运行以后启动了看门狗的计数器, 看门狗就开始自动计数,如果到了一定的时间还不去清看门狗,那么看门狗计数器就会溢出从而引起看门狗中断,造成系统复位。 而

  • 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 好久没写文章了,最近遇到一个蛋疼的问题,Linux内核假死的情况,简而言之就是内核在工作的过程中突然进入一种未知状态,不能正常工作了。watchdog主要有两种:第一种是硬件支持的,第二种是纯软件的。今天我们主要讲第二种,纯软件实现的。 一、watchdog是什么? 1.硬件看门狗 看门狗,又叫 watchdog,从本质上来说

  • 对于系统而言,大家都希望一直不出问题,但是很难保证一点不出问题。一但出问题,重启可以解决大部分的问题,因此最简单的办法是检测到了系统不正常了重启设备就好了。WatchDog 看门狗就是用来监测系统是否出问题而诞生的。工作原理是:软件系统必须定时像看门狗硬件中写入值来表示自己没出故障,俗称喂狗;否则超过了时间没有写入数据则重启设备。Android 的SystemServer 是一个复杂的进程,它启动

 相关资料
  • 本文向大家介绍SpringMvc入门指南(必看),包括了SpringMvc入门指南(必看)的使用技巧和注意事项,需要的朋友参考一下 Spring Web MVC是一种基于Java的实现了Web MVC设计模式的请求驱动类型的轻量级Web框架,即使用了MVC架构模式的思想,将web层进行职责解耦,基于请求驱动指的就是使用请求-响应模型,框架的目的就是帮助我们简化开发,Spring Web MVC也是

  • 本文向大家介绍Javascript 基础---Ajax入门必看,包括了Javascript 基础---Ajax入门必看的使用技巧和注意事项,需要的朋友参考一下 Ajax 是现代Web 应用程序开发的一项关键工具。它让你能向服务器异步发送和接收数据,然后用 Javascript 解析。 Ajax 是 Asynchronous JavaScript and XML (异步JavaScript 与XML

  • cd 命令 change dirname 的缩写形式,进入指定目录 cd /usr/local #进入 /usr/local 目录 cd / #进入 / 目录 cd ~ #进入当前用户家目录 cd - #进入执行上一条命令所在目录 cd ../ #进入当前目录的上一级目录 补充:. 代表当前目录,.. 代表上一级目录,~ 代表当前用户的家目录,/ 代表根目录,根目录的上一级目录指向的还是

  • 问题内容: 嗨,任何人都可以告诉我如何在linux中处理软件看门狗。我有一个程序“ SampleApplication”,该程序连续运行,如果程序异常挂起或关闭,则需要重新启动它。 我正在谷歌上搜索,发现linux在/ dev / watchdog拥有看门狗,但不知道如何使用它。有人可以帮我举个例子。 我的问题是在哪里指定我的应用程序名称和重新启动的延迟间隔。由于我是Linux新手,请尽可能向我介

  • 本文向大家介绍javascript入门之数组[新手必看],包括了javascript入门之数组[新手必看]的使用技巧和注意事项,需要的朋友参考一下 一、定义数组。     定义数组有两个方法:     1、var arr1 = [];  //定义一个空数组     2、var arr2 = [1,2,3,"str1","str2"];  //定义一个有5个元素的数组。     3、var arr3

  • 本文向大家介绍AugularJS从入门到实践(必看篇),包括了AugularJS从入门到实践(必看篇)的使用技巧和注意事项,需要的朋友参考一下 前 言 前端 AngularJS是为了克服HTML在构建应用上的不足而设计的。(引用百度百科) AngularJS使用了不同的方法,它尝试去补足HTML本身在构建应用方面的缺陷。AngularJS通过使用我们称为指令(directives)的结构,让浏览器

  • 本文向大家介绍jQuery基础_入门必看知识点,包括了jQuery基础_入门必看知识点的使用技巧和注意事项,需要的朋友参考一下 jQuery事件的因果关系是怎么样的一个格式: $("button").click(function(){ }) 【正式接触jQuery】 (1)jQuery的书写步骤: 1.引入jQuery文件; 2.新建一对script标签来书写jQuery; 3.用jQuery的方

  • 这串代码后 这个sym的变量我该怎么修改