我正在使用python 2.7和Google Compute Cloud。我想处理上传到gcs数据存储区的gzip文件。在Python上,这将是:
import gzip
with gzip.open('myfile.gz', 'r') as f:
f.read()
由于GCS不允许这样做,因此我在Google Cloud
Storage客户端库函数中
找到的唯一选项是:
import cloudstorage
cloudstorage.open('myfile.gz', 'r'):
f.read()
不会打开gzip文件。关于如何执行此操作的任何提示?
您可以使用GCS客户端lib提供的文件对象,通过文件对象使用备用gzip.GzipFile()访问:
import cloudstorage
import gzip
with cloudstorage.open('myfile.gz', 'r') as f:
content = gzip.GzipFile(fileobj=f).read()
好的,我有一个包含gz文件的zip文件(unix gzip)。 如何使用? 编辑:这不是一个重复,因为我的gzipped文件在一个zipped文件中,我试图避免将该zip文件解压缩到磁盘上。它与zip文件中的zip文件一起工作,就像如何在Python中从zip文件中读取zip文件一样?.
我已经从Kaggle(视频游戏与评级)下载了一个数据库,但我不能用我的木星笔记本打开它。 我从这两行代码开始,但它给了我一个错误。。。 ()1中的UnicodeDecodeError回溯(最后一次调用)作为pd导入---- ~\Anaconda3\lib\site-包\熊猫\io\parsers.pyparser_f(filepath_or_buffer,sep,分隔符,标头,名称,index_c
问题内容: 我有一个叫做html的文件。 我打开test.html并使用以下代码块打印内容: 但它可以打印,为什么会发生这种情况,我该如何解决? 顺便说一句。当我打开文本文件时,效果很好。 编辑:我试过这个: 问题答案: 尝试这样的事情。
问题内容: 如何打开一个Excel文件以便在Python中读取? 例如,我已经使用read命令打开了文本文件。如何为Excel文件执行此操作? 问题答案: 编辑: 在较新版本的pandas中,您可以将工作表名称作为参数传递。 检查文档以获取有关如何通过的示例sheet_name:https : //pandas.pydata.org/pandas-docs/stable/generation/pa
问题内容: 我试过了 它回答: 如何以unicode而不是as形式打开文本文件? 问题答案: 编辑 对于Python 3,使用作为这个答案介绍是最好的选择。以下答案对于2.x可能仍然有用。我认为即使对于3.x,下面的任何内容实际上都不正确,但仍然更好。 如果文件是utf-8,则可以使用: 如果您要遍历可以使用的文件,则无法使用。 请注意,这两种方法对于多字节编码都不一定是安全的。例如,小尾数UTF
我不想使用操作系统命令,因为这使它依赖于操作系统。 这在< code>tarfile、< code > tarfile . is _ tarfile(filename)中可用,用于检查文件是否为tar文件。 我无法在模块中找到任何相关命令。 编辑:为什么我需要这个:我有gzip文件列表,这些文件的大小各不相同(1-10 GB),有些是空的。在读取文件之前(使用),我想检查文件是否为空,因为对于空文