我尝试将xlsx读入数据帧:
itut_ir = pd.read_excel('C:\\Users\\Administrator\\Downloads\\reportdata.xlsx')
print(itut_ir.to_string())
我收到这个:
回溯(最近一次调用last):文件“C:\Users\Administrator\eclipse workspace\Reports\GOW\Report.py”,第44行,df=pd。读取excel('C:\Users\Administrator\Downloads\reportdata.xlsx')
文件“C:\Users\Administrator\AppData\Local\Programs\Python37\lib\site packages\pandas\io\excel\u base.py”,第304行,在读取excel io=ExcelFile文件(io,engine=engine)文件“C:\Users\Administrator\AppData\Local\Programs\Python37\lib\site packages\pandages\io\excel\excel\base.py”,第824行,在init self中_读者=自我。引擎引擎文件“C:\Users\Administrator\AppData\Local\Programs\Python37\lib\site packages\pandas\io\excel\u xlrd.py”,第21行,在init super()中。init(filepath\u或\u buffer)文件“C:\Users\Administrator\AppData\Local\Programs\Python37\lib\site packages\pandas\io\excel\u base.py”,第353行,在init self中。书=自我。加载工作簿(文件路径或缓冲区)文件“C:\Users\Administrator\AppData\Local\Programs\Python37\lib\site packages\pandas\io\excel\xlrd.py”,第36行,在加载工作簿返回打开的工作簿(文件路径或缓冲区)文件“C:\Users\Administrator\AppData\Local\Programs\Python37\lib\site packages\xlrd\init.py”,第117行,在打开的工作簿中zf=zipfile。ZipFile(文件名)文件“C:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\ZipFile.py”,第1222行,在init self中_RealGetContents()文件“C:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\zipfile.py”,第1289行,在_realgetcontentsraise BadZipFile(“文件不是zip文件”)zipfile中。BadZipFile:文件不是zip文件
有人有主意吗?文件似乎没有坏,我可以用Excel打开它。
谢谢!
***更新***产生错误的文件正在从FTP下载。打开原始文件工作。。。如果这给了你一个提示:)谢谢
不久前,我在LibreOffice中创建了一个XLSX,我也遇到了同样的问题。
解决方案是检查XLSX以确保它没有损坏。在我的例子中,加载以前版本的XLSX文件纠正了这个问题。
我试图在pandas中使用从FTP服务器读取压缩文件。zip文件只包含一个文件,这是必需的。 这是我的密码: 我得到这个错误: 我在pandas 18.1和19.0中都遇到了这个错误。我是否遗漏了什么,或者这可能是一个错误?
问题内容: 该软件包通过将zip文件视为文件系统,具有处理zip文件的优美方法。这使我们能够像对待普通文件一样对待zip文件内容。因此,仅通过将所有文件复制到zip文件中即可压缩整个文件夹。由于也要复制子文件夹,因此我们需要一个访问者: 这是一个简单的“递归复制目录”访问者。它用于递归复制目录。但是,使用,我们还可以使用它将目录复制到zip文件中,如下所示: 这就是我称为压缩整个文件夹的一种优雅方
我有一个在线链接,每天更新一个zip文件。zip文件包含一个文件夹,在其中我想读取到熊猫的xls文件 我尝试使用zipfile模块。 但它给出了一个错误: 错误:无效模式(rb)或文件名:超文本传输协议://xxxxx/xxxx/xxxxx/xxxxx.zip 也只读csv似乎有压缩属性 我如何做到这一点?
我正在尝试将压缩的csv文件(.bz2)读取为数据帧。我的代码如下 当我在IDE中尝试时,这是可行的。我可以读取数据并对其进行处理,但当我尝试使用maven构建数据并在命令行上运行它时,会出现以下错误 我不确定我是否在这里错过了什么。读取csv文件是否有一些依赖项?根据留档,Spark 2. x. x内置了对此的支持。
我正试图从压缩的csv文件中获取数据。有没有一种方法可以做到这一点,而不解压整个文件?如果没有,我如何解压文件并有效地读取它们?
问题内容: 我有一个csv文件,其中包含数字值。总是精确地有6位小数。 当我通过pandas导入csv文件(和其他列)时,该列会自动获取datatype 。我的问题是这些值显示为实际应有的值。或该值显示为。 在某种程度上,这似乎是一个数据类型问题。我尝试通过将参数指定为来通过显式提供数据类型。问题仍然没有解决。 如何获取导入的值并完全按源csv文件中的值显示? 问题答案: 熊猫使用专用的转换器,会