当前位置：首页 > 面试题库 >

在python脚本中读取tar文件内容而不对其进行解压缩

葛兴发

2023-03-14

问题内容：

我有一个tar文件，其中包含许多文件。我需要编写一个python脚本，该脚本将读取文件的内容并提供总数字符的计数，包括字母，空格，换行符的总数，所有内容，而无需解压缩tar文件。

问题答案：

您可以使用 getmembers()

>>> import  tarfile
>>> tar = tarfile.open("test.tar")
>>> tar.getmembers()

之后，您可以extractfile()用来将成员提取为文件对象。只是一个例子

import tarfile,os
import sys
os.chdir("/tmp/foo")
tar = tarfile.open("test.tar")
for member in tar.getmembers():
    f=tar.extractfile(member)
    content=f.read()
    print "%s has %d newlines" %(member, content.count("\n"))
    print "%s has %d spaces" % (member,content.count(" "))
    print "%s has %d characters" % (member, len(content))
    sys.exit()
tar.close()

对于f上面示例中的文件对象，可以使用read()，readlines()等等。

类似资料：

在不解压缩到磁盘的情况下读取tar文件的内容

问题内容：我已经能够遍历一个tar文件中的文件，但是我仍然坚持如何以字符串的形式读取那些文件的内容。我想知道如何将文件内容打印为字符串？这是我的下面的代码问题答案：只需将tar.Reader用作要读取的每个文件的io.Reader。如果您需要整个文件作为字符串：如果您需要逐行阅读，则更好：
读取.tar文件中的.gz文件而不提取

我有一个.tar文件，其中包含文件夹中的许多.gz文件。这些 gz 文件中的每一个都包含一个.txt文件。与此问题相关的其他堆栈溢出问题旨在提取文件。我试图反复阅读每一个的内容。txt文件，因为。焦油很大。首先我阅读了. tar文件的内容：或在Unix中：然后我尝试使用tarfile提取文件方法，但我得到一个错误：“模块'tarfile'没有属性'提取文件'”。此外，我甚至不确定这是正确的
python：从压缩的文本文件中读取行

问题内容：使用python从gz压缩的文本文件中读取一行很容易，而无需完全提取该文件？我有一个大约200mb的text.gz文件。当我提取它时，它变成7.4gb。这不是我必须阅读的唯一文件。对于整个过程，我必须读取10个文件。尽管这将是一个顺序的工作，但我认为在不影响全部信息的情况下做到这一点将是明智之举。我什至不知道有可能。如何使用python完成？我需要逐行阅读文本文件。问题答案：您是否
如何列出gz文件的内容而不在python中解压缩？

问题内容：我有一个文件，我需要使用python获取其中的文件名。这个问题是一样的这一个唯一的区别是我的文件不是，所以库在这里没有帮助我我正在使用库来请求URL。响应是一个压缩文件。这是我用来下载文件的代码例如，此代码以名称下载文件。现在，如果我使用存档管理器打开文件，则该文件将包含以下内容我需要提取文件，输出为。这是我用来提取文件的代码该变量是我在脚本中提供的字符串，但我需要真实
如何在Python中逐行读取大型文本文件而不将其加载到内存中？

问题内容：我需要逐行读取一个大文件。可以说该文件的大小超过5GB，我需要读取每一行，但是显然我不想使用它，因为它将在内存中创建一个非常大的列表。下面的代码在这种情况下将如何工作？自身是否一一读取到内存中？是否需要生成器表达式？另外，与命令一样，我该怎么做才能以相反的顺序阅读？问题答案：我提供此答案是因为Keith的提示虽然简洁，但并未明确关闭文件
在python中读取csv压缩文件

我正试图从压缩的csv文件中获取数据。有没有一种方法可以做到这一点，而不解压整个文件？如果没有，我如何解压文件并有效地读取它们？

相关阅读

在python中获取div的文本内容并和想定结果进行对比详解读取JSON文件并显示其内容 Python读取分割压缩TXT文本文件实例读取JAR文件的内容（在运行时）？Python解析并读取PDF文件内容的方法

相关文章

Python linecache模块用法：随机读取文件指定行 Matlab .m脚本文件 Jsoup 设置文本内容 C++ getline()：从文件中读取一行字符串 Properties解析以及读取文件案例

相关问答

解压缩数据流中的.tar文件？读取文本文件内容Javascript[重复]Python读取文本文件并对控制字符进行拆分利用多核进行tar gzip/bzip压缩/解压缩用Apache Commons Compress解压缩tar文件

相关工具

文件解压和压缩Demo 解压TexturePacker生成的文件 S tar Monster 脚本 system-tar-and-restore

相关文档

Python 取证中文教程 Python 文本处理 Python 进行机器学习 Python XlsxWriter 中文文档 Shell 脚本学习