当前位置: 首页 > 编程笔记 >

linux下使用rsync同步目录

华宇
2023-03-14
本文向大家介绍linux下使用rsync同步目录,包括了linux下使用rsync同步目录的使用技巧和注意事项,需要的朋友参考一下

本文描述了linux下使用rsync单向同步两个机器目录的问题。 使用rsync同步后可以保持目录的一致性(含删除操作)。

数据同步方式

1、从主机拉数据

备机上启动的流程

同步命令:

rsync -avzP --delete root@{remoteHost}:{remoteDir} {localDir}

参数说明:

  • -a 参数,相当于-rlptgoD(-r 是递归 -l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件);
  • -z 传输时压缩;
  • -P 传输进度;
  • -v 传输时的进度等信息;

示例:

rsync -avzP --delete root@192.168.1.100:/tmp/rtest1 /tmp/

2、向备机推数据

主机上启动的流程

同步命令:

rsync -avzP --delete {localDir} root@{remoteHost}:{remoteDir}

示例:

rsync -avzP --delete /tmp/rtest1 root@192.168.1.101:/tmp/

自动同步配置

描述同步时不输入密码的配置的方法。

1、使用ssh key

该方法可以直接使用rsync命令进行同步,同步过程中无需输入密码。

在主机上产生ssh key :

ssh-keygen -t rsa

在备机上加入pubkey

ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.1.101

或者手动添加:

在主机上执行以下命令获取pubkey:

cat ~/.ssh/id_rsa.pub

在备机上加入key内容:

vi ~/.ssh/authorized_keys

使用pexpect自动输入密码

示例代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import pexpect
import time
import traceback

def doRsync(user,passwd,ip,srcDir,dstDir,timeout=3600):
  cmd = "rsync -azPq --delete {srcDir} {rUser}@{rHost}:{dstDir}".format(
    rUser = user,rHost=ip,srcDir=srcDir,dstDir=dstDir
  )
  try:
    ssh = pexpect.spawn(cmd,timeout=timeout)
    print cmd
    i = ssh.expect(['password:', 'continue connecting (yes/no)?'], timeout=5)
    if i == 0 :
      ssh.sendline(passwd)
    elif i == 1:
      ssh.sendline('yes')
      ssh.expect('password: ')
      ssh.sendline(passwd)
    ssh.read()
    ssh.close()
  except :
    #print traceback.format_exc()
    pass

if __name__ == '__main__':
  doRsync("root","123456","192.168.1.101","/tmp/rtest1","/tmp")

上面是使用python实现的代码,大家可根据情况用其它语言实现该功能。

其它

1、rsync在执行过程中被kill掉会怎么样;

It is safe to kill an rsync process and run the whole thing again; it will continue where it left off. It may be a little inefficient, particularly if you haven't passed --partial (included in -P), because rsync will check all files again and process the file it was interrupted on from scratch.

rsync被kill掉是安全的,下次启动时还可以正常工作。

2、rsync不能指定时间段;

1)该问题可以通过kill来解决

2)或者使用pexpect的timeout参数来控制

3)可以先通过find查找过滤出文件夹的名字,然后使用rsync进行同步 这个可以根据现有业务的特征进行,比如:

find /tmp -name '*' -newermt '2016-03-08' ! -newermt '2016-03-20'

3、rsync在写文件过程中同步(比如录音过程中执行rsync操作)

经测试,rsync会同步部分文件内容,文件写入完成后再执行rsync会保持文件的一致

4、当文件数量达到百万级以上时,rsync同步时扫描改变的文件非常耗时

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持小牛知识库。

 类似资料:
  • 本文向大家介绍linux rsync同步命令(值得收藏),包括了linux rsync同步命令(值得收藏)的使用技巧和注意事项,需要的朋友参考一下  如果你是一位运维工程师,你很可能会面对几十台、几百台甚至上千台服务器,除了批量操作外,环境同步、数据同步也是必不可少的技能。 说到“同步”,不得不提的利器就是rsync,今天就来说说我从这个工具中看到的同步的艺术。 [不带任何选项] 我们经常这样使用

  • 本文向大家介绍rsync 只同步目录结构不同步文件的方法,包括了rsync 只同步目录结构不同步文件的方法的使用技巧和注意事项,需要的朋友参考一下 If you are using an older rsync version, try:

  • 本文向大家介绍Linux下rsync远程数据同步命令的详细介绍,包括了Linux下rsync远程数据同步命令的详细介绍的使用技巧和注意事项,需要的朋友参考一下 介绍 rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。rsync使用所谓的“rsync算法”来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快

  • 本文向大家介绍rsync只同步指定目录的方法(已测),包括了rsync只同步指定目录的方法(已测)的使用技巧和注意事项,需要的朋友参考一下 rsync同步指定目录 rsync使用–include参数与–exclude参数来实现同步指定目录,并且–exclude目录放在后面。 例如: linux上文件目录 只想同步aa,bb,ee这三个目录,其他的不同步。 实现代码: 说明: –include “a

  • 本文向大家介绍Linux下sersync数据实时同步,包括了Linux下sersync数据实时同步的使用技巧和注意事项,需要的朋友参考一下 sersync其实是利用inotify和rsync两种软件技术来实现数据实时同步功能的,inotify是用于监听sersync所在服务器上的文件变化,结合rsync软件来进行数据同步,将数据实时同步给客户端服务器。 工作过程:在同步主服务器上开启sersync

  • 问题内容: 我想使用rsync 在两个方向上 同步 两个目录。 我指的是经典意义上的同步( 不是 rsync手册中的含义): 我想 双向 更新目录,具体取决于哪个 更新 。 可以通过rsync (在Linux方式中更可取) 完成此操作吗? 如果没有,还有哪些其他解决方案? 问题答案: 只需使用“较新”模式(-u或– update标志)加上-t(复制文件修改时间),-r(用于递归文件夹)和-v(用于