当前位置: 首页 > 知识库问答 >
问题:

如何从熊猫的在线zip链接读取excel文件

穆鸿飞
2023-03-14

我有一个在线链接,每天更新一个zip文件。zip文件包含一个文件夹,在其中我想读取到熊猫的xls文件

我尝试使用zipfile模块。

zf = zipfile.ZipFile('http://xxxxx/xxxx/xxxxx/xxxxx.zip')

但它给出了一个错误:

错误:无效模式(rb)或文件名:超文本传输协议://xxxxx/xxxx/xxxxx/xxxxx.zip

也只读csv似乎有压缩属性

我如何做到这一点?

共有1个答案

谢财
2023-03-14

您可以使用urllibio

import zipfile
from urllib.request import urlopen
# from urllib import urlopen  # for python 2

import io

zipfile.ZipFile(io.BytesIO(urlopen(url).read()))

作为另一个选项,您可以将压缩='gzip'参数传递到pd.read_csv方法中。

 类似资料:
  • 我尝试将xlsx读入数据帧: 我收到这个: 回溯(最近一次调用last):文件“C:\Users\Administrator\eclipse workspace\Reports\GOW\Report.py”,第44行,df=pd。读取excel('C:\Users\Administrator\Downloads\reportdata.xlsx') 文件“C:\Users\Administrator

  • 问题内容: 我必须使用SFTP从ZIP存档(只有一个文件,我知道它的名称)中获取文件内容。我唯一拥有的是ZIP的。大多数示例说明如何使用以下语句获取内容: 但是正如我所说,我的本地计算机上没有ZIP文件,也不想下载它。是够看了? UPD: 这是我的方法: 问题答案: 好吧,我已经做到了: 它可以帮助我阅读ZIP的内容而无需写入另一个文件。

  • 我必须使用SFTP从ZIP存档(只有一个文件,我知道它的名称)获取文件内容。我唯一拥有的是ZIP的InputStream。大多数示例显示了如何使用此语句获取内容: 但正如我所说,我的本地机器上没有ZIP文件,我不想下载它。输入流是否足以读取? UPD:我就是这样做的:

  • 有什么能帮上忙的吗?

  • 问题内容: 我正在查询一个SQL数据库,我想使用熊猫来处理数据。但是,我不确定如何移动数据。以下是我的输入和输出。 问题答案: 答案更简短

  • 我试图读取熊猫泡菜时出错,例如方法,该方法存储在谷歌云存储中。我正在努力做到以下几点: 我得到以下错误: 或者我试着: 它可以在本地工作,但不能在CloudML上工作! 给我一个错误:AttributeError:'bytes'对象没有属性'seek'