当前位置: 首页 > 面试题库 >

诊断意外的Redis服务器故障

江天宇
2023-03-14
问题内容

我的一台Redis服务器今天反复停机,没有任何明显的可诊断原因。我所有的用户最终都会遇到Error 111 connecting to unix socket: /var/run/redis/redis2.sock. Connection refused错误。

查看处的日志/var/log/redis,最后几行捕获的内容比计划的备份更为有害:

[8248] 09 Mar 07:48:17.090 * 10 changes in 21600 seconds. Saving...
[8248] 09 Mar 07:48:17.374 * Background saving started by pid 47613
[47613] 09 Mar 07:51:02.257 * DB saved on disk
[47613] 09 Mar 07:51:02.486 * RDB: 526 MB of memory used by copy-on-write
[8248] 09 Mar 07:51:02.920 * Background saving terminated with success

pid文件仍然存在。这意味着服务器没有被正式关闭,redis仍被守护?

我登录到系统,并做了sudo service redis-server restart两次以使其启动并运行。除了这些日志,我还能如何诊断可能出了什么问题?

更新:我注意到在第一次崩溃时,磁盘交换开始发生。这从未发生过。此外,cat /proc/sys/vm/swappiness确认将可交换性设置为2

free -m 显示(正常操作后):

             total       used       free     shared    buffers     cached
Mem:         28136      27015       1120        305         80       6586
-/+ buffers/cache:      20349       7787
Swap:         1023        991         32

free -m 显示(在redis服务器关闭之后):

             total       used       free     shared    buffers     cached
Mem:         28136       8770      19365        305         60        441
-/+ buffers/cache:       8268      19868
Swap:         1023       1022          1

问题答案:

这听起来像是OS的OOM杀手的工作-您可以通过查看来验证/否认该假设/var/log/syslog

在这种情况下,持久性作业的开销触发了杀手er。您需要通过设置maxmemory和分配足够的RAM来满足持久性的需求(包括COW)来进行配置。

请注意,free事实并非如此-您需要连续监视资源。

至于交换,如果您不关心延迟,那么您当然可以这样做。



 类似资料:
  • 如果 Flarum 无法安装或者是没有按照预期运行,第一件需要做的事情就是再次检查你的环境是否达到了系统要求。如果你缺失部分 Flarum 的依赖项(例如 PHP 的 fileinfo 扩展),你将需要先处理这些问题。 接下来,你应该花上几分钟在支持论坛和问题追踪器内检索。有可能有人已经汇报了这个问题,或者解决方案正在讨论,或者已经有解决方案。在检索过后,如果你仍然没有发现关于这个问题的信息的话,

  • 本文对 TiDB 集群在使用中遇到的常见问题及故障提供诊断及处理说明。 各类故障诊断 参阅 TiDB 集群故障诊断常见问题及其他内容。

  • 常见网络故障 我们在开发或者网络管理中,经常碰到各种各样的网络故障。掌握处理常见的网络故障,就成为了网络运维工程师和开发工程师的基础技能。 常见以下两个故障: 服务器无法登录了 服务访问不了 这两个故障背后的原因有很多种,列举如下: 服务器无法登录 你的电脑断网了 服务器关闭了 服务器没关闭,但是访问端口关闭了(例如关闭了远程桌面的3389端口或者ssh的22端口) 服务器没关闭,访问端口也没关闭

  • 如何识别 Photoshop 增效工具问题并进行故障诊断。 注意:在下面的内容中,位于文本旁边的 图标表示 Photoshop CC 2015.5 版本的新信息。 由于增效工具存在缺陷或不兼容而导致的问题概述 如果您遇到以下任何问题,原因可能是增效工具存在缺陷或不兼容: 错误:“无法载入 [增效工具名称] 模块,因为它不能与此版本的 Photoshop 一起使用。” “保存”或“另存为”对话框中缺

  • 我正在开发一个基于Web的工具(名为cloudcopasi),它从用户那里接收作业并将其提交给bosco资源(计算节点)。我在Linux Centos7上使用的是bosco版本(condor 8.8.12)。web界面允许用户添加一个bosco池,用户可以使用该池提交作业。然而,当我试图提交作业时,它失败了。我也尝试使用以下命令测试池: 谢谢你。

  • 本文向大家介绍IBM服务器诊断面板使用方法,包括了IBM服务器诊断面板使用方法的使用技巧和注意事项,需要的朋友参考一下   IBM服务器一般会有一个服务器操作员信息面板(诊断面板),服务器一般的硬件故障都会在诊断面板上提示,但这些提示可能只是一个大概的诊断故障,有助于系统管理员更好的维护。 一、IBM X3650 M3诊断面板位置: 说明:   电源控制按钮和供电指示灯按下此按钮可手动开启和关闭服