当前位置: 首页 > 编程笔记 >

PostgreSQL pg_archivecleanup与清理archivelog的操作

龙新荣
2023-03-14
本文向大家介绍PostgreSQL pg_archivecleanup与清理archivelog的操作,包括了PostgreSQL pg_archivecleanup与清理archivelog的操作的使用技巧和注意事项,需要的朋友参考一下

pg_archivecleanup 和 pg_rewind 是PG 中两个重要的功能,一个是为了清理过期的 archive log 使用的命令,另一个是你可以理解为物理级别的 wal log的搬运工。

我们先说第一个 pg_archivecleanup 命令,这个命令主要是用于使用了archive log 功能的 postgresql 但在 archive log 堆积如山的情况下,你怎么来根据某些规则,清理这些日志呢?

这里面就要使用 pg_archivecleanup 这个命令了,可以定时的来运行它,将已经移动到archivecleanup 的目录的archivelog 根据要求开始清理。

当然我们先的说说如果不定期清理会出什么问题

1 如果不定期清理archive 如果存放archivelog 的位置无法在接受新的日志,则大量WAL日志会滞留在 wal_log 目录中,则整体数据库系统都会受到影响。

2 占用大量的存储空间,存储无效的数据

那一般来说如果没有第三方的备份工具的情况下,怎么来通过pg_archivecleanup 来进行archivelog 的清理。

需要关注几个点

1 清理的时,清理的WAL_LOG 是否已经是包含在最后一次的备份中,保证清理的WAL_LOG 也可以从备份文件中恢复数据库

2 清理的时候,对于保存在非主库的wal_log 怎么办

一般来说,设置自动清理archive_log 可以在配置文件中添加

archive_cleanup_command = 'pg_archivecleanup archivelocation %r'

来操作。

但一般来说这样做好处少,弊病多,我比较喜欢写相关的脚本,定时去运行的方式,并且可以记录相关的LOG 日志等等。

可以写一个脚本,来辅助定时清理相关的archive_log

当然这样的方法也是有弊端的,如果由于备份的原因的故障,而直接使用天数来清理会有因为没有备份而直接将 wal_log 给清理掉,所以更加靠谱的方法是通过某些命令来获得需要截止的清理的Wal_log 名称。

例如 备份后的

会在wal_log 里面有backup 的标记,这说明这个WAL log 以前的数据已经备份了,如果清理这个WAL LOG 之前的log 是安全的。

000000010000000300000030.00000060.backup

使用下面的脚本可以来更安全的清理

#!/bin/bash 
ARCHIVEDIR='/pgdata/archive'
CHK_SAFE=$(find $ARCHIVEDIR -type f -mtime +3 -name '*backup' -printf '%f\n' | sort -r | head -1)
cd $ARCHIVEDIR
/usr/local/postgres/bin/pg_archivecleanup $ARCHIVEDIR $CHK_SAFE 
find $ARCHIVEDIR -type f -mtime +3 -a -name '*backup' -a ! -newer $CHKPOINT -delete

补充:postgresql流日志误删处理(xlog)

今天同事误删postgresql库数据文件下的pg_xlog文件夹,导致所有流日志丢失,数据库无法启动,观察警告日志:

2018-03-12 18:45:54 CST LOG: database system shutdown was interrupted; last known up at 2018-03-12 17:48:27 CST
2018-03-12 18:45:54 CST LOG: could not open file "pg_xlog/000000010000001400000060" (log file 20, segment 96): No such file or directory
2018-03-12 18:45:54 CST LOG: invalid primary checkpoint record
2018-03-12 18:45:54 CST LOG: could not open file "pg_xlog/000000010000001400000060" (log file 20, segment 96): No such file or directory
2018-03-12 18:45:54 CST LOG: invalid secondary checkpoint record
2018-03-12 18:45:54 CST PANIC: could not locate a valid checkpoint record
2018-03-12 18:45:54 CST LOG: startup process (PID 32680) was terminated by signal 6: Aborted
2018-03-12 18:45:54 CST LOG: aborting startup due to startup process failure

用postgresql自带的pg_resetxlog工具可以跳过对WAL log的恢复。不过会丢失一些事务。恢复命令也很简单如下:

pg_resetxlog -f /var/lib/pgsql/9.6/data

然后启动postgrsql ,数据库就可正常进入

参考:pg_resetxlog官方文档

以上为个人经验,希望能给大家一个参考,也希望大家多多支持小牛知识库。如有错误或未考虑完全的地方,望不吝赐教。

 类似资料:
  • 有时,当你在项目的一部分上已经工作一段时间后,所有东西都进入了混乱的状态,而这时你想要切换到另一个分支做一点别的事情。 问题是,你不想仅仅因为过会儿回到这一点而为做了一半的工作创建一次提交。 针对这个问题的答案是 git stash 命令。 储藏会处理工作目录的脏的状态 - 即,修改的跟踪文件与暂存改动 - 然后将未完成的修改保存到一个栈上,而你可以在任何时候重新应用这些改动。 储藏工作 为了演示

  • 问题内容: 我想告诉Node.js无论出于何种原因(+ ,异常或任何其他原因)总是在退出之前总是做一些事情。 我尝试了这个: 我开始了该过程,将其杀死,但没有任何反应。我再次启动它,按+ ,仍然没有任何反应… 问题答案: 更新: 您可以注册一个处理程序,并在任何其他情况下(或未处理的异常)进行调用

  • Clean,清理。把未跟踪的文件清理掉。 练习 1,在项目下面新建一个文件,名字是 demo.md。 touch demo.md 然后查看状态,会返回: On branch master Untracked files: (use "git add <file>..." to include in what will be committed) demo.md nothing a

  • 有时,当你在项目的一部分上已经工作一段时间后,所有东西都进入了混乱的状态,而这时你想要切换到另一个分支做一点别的事情。 问题是,你不想仅仅因为过会儿回到这一点而为做了一半的工作创建一次提交。 针对这个问题的答案是 git stash 命令。 储藏会处理工作目录的脏的状态——即跟踪文件的修改与暂存的改动——然后将未完成的修改保存到一个栈上,而你可以在任何时候重新应用这些改动。 储藏工作 为了演示,进

  • 本文向大家介绍Oracle删除archivelog文件的正确方法,包括了Oracle删除archivelog文件的正确方法的使用技巧和注意事项,需要的朋友参考一下 Oracle在开启了归档模式后,会在指定的archive目录下产生很多的archivelog文件,而且默认是不会定期清除的,时间长久了,该文件夹会占用很大的空间。 问题:如何定期正确删除archivelog文件呢? 很多人直接在arch

  • TCPServer.bind_sockets()会返回一个socket对象的列表,列表中的socket都是用来监听客户端连接的。 列表由TCPServer.add_sockets()处理。在这个函数里我们就会看到IOLoop相关的东西。 def add_sockets(self, sockets): if self.io_loop is None: self.io_loo