git fast-export
名称
git-fast-export - Git 数据导出器
概要
git fast-export [options] | git fast-import
描述
该程序将适当的修订以适合于git fast-import
管理的形式转储。
您可以将其用作人可读的包替换(请参阅 git-bundle [1]),或作为一种交互式git filter-branch
。
Options
--progress=<n>
每个<n>对象插入progress
语句,在导入期间以git fast-import
显示。
--signed-tags=(verbatim|warn|warn-strip|strip|abort)
指定如何处理签名标签。由于导出后的任何转换都可以更改标签名称(排除修订时也可能发生),因此签名将不匹配。
当询问abort
(这是默认值)时,遇到签名标签时该程序将会死亡。使用时strip
,标签将被无声签名,使用warn-strip
,它们将被做成未签名的,但会显示一条警告,使用verbatim
,它们将被静静地导出,使用warn
,并且将被导出,但您会看到警告。
--tag-of-filtered-object=(abort|drop|rewrite)
指定如何处理其标签对象被滤除的标签。由于修改和导出的文件可能会受到路径的限制,因此标记的对象可能会被完全过滤。
当询问abort
(这是默认值)时,遇到这样的标签时该程序将会死亡。因为drop
它会从输出中省略这些标签。使用rewrite
,如果带标签的对象是提交,它将重写标签以标记祖先提交(通过父级重写;请参阅 git-rev-list [1])
-M -C
按照 git-diff [1]手册页中所述执行移动和/或复制检测,并使用它在输出转储中生成重命名和复制命令。
请注意,如果您提供了这些选项,则此命令的早期版本不会发出抱怨并产生不正确的结果。
--export-marks=<file>
完成后将内部标记表转储到<file>。标记每行写成一个:markid SHA-1
。只有修改标记才会被抛弃; 斑点的标记被忽略。后端可以使用此文件在导入完成后验证导入,或跨增量运行保存标记表。由于<file>仅在完成时打开并截断,因此可以将同一路径安全地分配给--import-marks。如果没有新的对象被标记/导出,该文件将不会被写入。
--import-marks=<file>
在处理任何输入之前,请加载<文件>中指定的标记。输入文件必须存在,必须可读,并且必须使用与--export-marks 相同的格式。
任何已经被标记的提交都不会再被导出。如果后端使用类似的--import-marks文件,则允许通过使标记在运行中保持相同来增量式双向导出存储库。
--fake-missing-tagger
一些旧版本库的标签没有标签。快速导入协议对此非常严格,并且不允许这样做。所以假冒一个标签器可以快速导入输出。
--use-done-feature
用feature done
节开始流,并用done
命令终止它。
--no-data
跳过 blob 对象的输出,而是通过其原始 SHA-1散列引用 blob。当重写存储库的目录结构或历史记录而不触及单个文件的内容时,这非常有用。请注意,生成的流只能由已包含必要对象的存储库使用。
--full-tree
此选项将导致快速导出为每个提交发出“deleteall”指令,后跟提交中所有文件的完整列表(而不仅仅列出与提交的第一个父代不同的文件)。
--anonymize
匿名化存储库的内容,同时仍保留历史记录和存储树的形状。请参阅ANONYMIZING
下面的部分。
--refspec
将指定的 refspec 应用于每个导出的 ref。它们中的多个可以被指定。
<git-rev-list-args>…
一个参数的列表,可以接受git rev-parse
和git rev-list
,指定特定对象,并引用到出口。例如,master~10..master
导致当前主引用与自第10个祖先提交后添加的所有对象一起导出。
示例
$ git fast-export --all | (cd /empty/repository && git fast-import)
这将导出整个存储库并将其导入现有的空存储库。除了重新编码未使用UTF-8的提交之外,它将是一对一的镜像。
$ git fast-export master~5..master | sed "s|refs/heads/master|refs/heads/other|" | git fast-import
这使得从master~5..master
一个新的分支调用other
(即如果master
有线性历史记录,它将采取最后5个提交)。
请注意,这假定该修订范围引用的 blob 和提交消息都不包含该字符串refs/heads/master
。
匿名
如果--anonymize
给出该选项,git 将尝试从存储库中删除所有标识信息,同时仍保留足够的原始树和历史记录模式以重现一些错误。目标是在私有存储库中发现的 git 错误将存储在匿名存储库中,后者可以与 git 开发人员共享以帮助解决该错误。
使用这个选项,git 会用匿名数据替换输出中的所有 refnames、路径、blob内容,提交和标记消息,名称和电子邮件地址。相同字符串的两个实例将被等同替换(例如,两个同一作者的提交将在输出中具有相同的匿名作者,但与原作者字符串没有相似之处)。保留提交,分支和标签之间的关系以及提交时间戳(但提交消息和引用名与原始文件不相似)。保留树的相对构成(例如,如果您有一棵具有10个文件和3棵树的根树,输出也是如此),但是它们的名称和文件内容将被替换。
如果你认为你已经发现了一个 git bug,你可以从导出整个存储库的匿名流开始:
$ git fast-export --anonymize --all >anon-stream
然后确认该错误依然存在于从该流创建的存储库中(很多错误不会,因为它们确实取决于确切的存储库内容):
$ git init anon-repo $ cd anon-repo $ git fast-import <../anon-stream $ ... test your bug ...
如果匿名存储库显示该错误,则可能值得anon-stream
与常规错误报告一起共享。请注意,匿名流压缩得很好,所以鼓励它。如果您想检查流以查看它不包含任何私人数据,则可以在发送之前直接仔细阅读它。您可能还想尝试:
$ perl -pe 's/\d+/X/g' <anon-stream | sort -u | less
它显示了所有的独特行(将数字转换为“X”,将“用户0”,“用户1”等折叠为“用户X”)。这会产生更小的输出,并且通常很容易快速确认流中没有私人数据。
限制
由于git fast-import
不能标记树,因此它将不能完全导出 linux.git 存储库,因为它包含引用树而不是提交的标记。