问题：

从URL压缩的csv文件中的pandas.read_csv出现奇怪的错误

戚宏扬

2023-03-14

pd.read_csv('publicleaderboarddata.zip')
       TeamId           TeamName       SubmissionDate    Score
0      688191  Sergey Mushinskiy  2017-05-24 12:20:34  0.06630
1      688203       DeepVoltaire  2017-05-24 12:25:03  0.06630
2      688237        RakeshNikam  2017-05-24 13:02:31  0.06512
......

this_leaderboard_df = pd.read_csv('https://www.kaggle.com/c/6649/publicleaderboarddata.zip,
                                  compression='zip')

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py中的parser_f(filepath_or_buffer、sep、分隔符、标头、名称imal,lineterminator,quotechar,quoting,doublequote,escapechar,comment,encoding,diquence,error_bad_lines,warn_bad_lines,delim_whitespace,low_memory,memory_map,float_precision）683）684->685 return_read（filepath_or_buffer,kwds）686 687 parser_f.name=name

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in_read(filepath_or_buffer,kwds）455 456#创建解析器。-->457 parser=TextFileReader(fp_or_buf,**kwds)458 459如果chunksize或iterator：

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in init（self,f,engine,**kwds）893 self.options[“has_index_names”]=kwds[“has_index_names”]894->895 self._make_engine（self.engine）896 897 def close（self）：

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in_make_engine（self,engine）1133 def_make_engine（self,engine）：1134如果engine==“c”:->1135 self._engine=CParserWrapper（self.f,**self.options）1136 else：1137如果engine==“python”：

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in init（self,src,**kwds）1915 kwds[“usecols”]=self.usecols 1916->1917 self._reader=parsers.textreader（src,**kwds）1918 self.unnamed_cols=self._reader.unnamed_cols 1919

pandas._libs.parsers.textreader.cinit（）中的pandas/_libs/parsers.pyx

pandas._libs.parsers.textreader._setup_parser_source()中的pandas/_libs/parsers.pyx

/usr/local/cellar/python/3.7.4/frameworks/python.framework/versions/3.7/lib/python3.7/zipfile.py in init（self,file,mode,compression,allowZip64,compresslevel）1223 try：1224 if mode=='r':->1225 self._realgetcontents()1226 elif mode in('w','x'):1227#设置修改后的标志，以便写入中央目录

_realgetContents（self）中的/usr/local/cellar/python/3.7.4/frameworks/python.framework/versions/3.7/lib/python3.7/zipfile.py 1290引发BadZipFile（“文件不是zip文件”）1291如果不是endrec:->1292引发BadZipFile（“文件不是zip文件”）1293如果self.debug>1:1294 print（endrec）

badzipfile：文件不是zip文件

共有1个答案

朱丰

2023-03-14

要下载它，你必须登录到Kaggle。如果你从Kaggle注销并尝试直接从链接下载，那么你会看到登录表单。

pandas无法登录到此页面，因此它获得带有登录表单的HTML而不是zip文件。

您可以使用Selenium控制web浏览器，然后脚本可以使用浏览器登录到Kaggle和下载文件。

类似资料：

使用Python2.7读取压缩的csv文件时出错

我在读取压缩的csv文件时出错。错误如下：“zlib.error：解压缩时错误-3：设置的距离无效” 代码：我在文件上尝试了Gunzip，它没有任何问题。我使用Gunzip-t。它给rc 0。
Julia：解压缩压缩文件中的压缩文件

我正在使用Julia的ZipFile包来提取和处理csv文件。没问题，但是当我遇到zip文件中的zip文件时，我也想处理它，但是遇到了一个错误。 Julia ZipFile文档如下：https://zipfilejl.readthedocs.io/en/latest/ 对如何做到这一点有什么想法吗？
将压缩后的Stata文件从URL读入

能读一本书吗。仅包含来自URL的文件？例如https://www.federalreserve.gov/econres/files/scfp2016s.zip包含一个文件：不适用于它： ValueError：给定Stata文件的版本不是104、105、108、111（Stata 7SE）、113（Stata 8/9）、114（Stata 10/11）、115（Stata 12）、117（Stat
Spark 2.1.0：读取压缩的csv文件

我正在尝试将压缩的csv文件（.bz2）读取为数据帧。我的代码如下当我在IDE中尝试时，这是可行的。我可以读取数据并对其进行处理，但当我尝试使用maven构建数据并在命令行上运行它时，会出现以下错误我不确定我是否在这里错过了什么。读取csv文件是否有一些依赖项？根据留档，Spark 2. x. x内置了对此的支持。
Matplotlib轴标签出现奇怪的错误

问题内容：我一般对Python和编程都不熟悉，所以如果我遗漏了一些明显的东西，请提前道歉。我正在尝试绘制图形并标记轴，但是每次尝试标记y轴时都会引发异常。我在下面的新脚本中编写了代码，以确保问题不是来自模块中的其他地方。我正在使用Python 3.4。每次，我在最后一行收到错误“ TypeError：’str’对象不可调用”。如果我将y更改为x，一切都很好。如果将x更改为ay，则会收到相同的错
C#实现的文件压缩和解压缩类

本文向大家介绍C#实现的文件压缩和解压缩类，包括了C#实现的文件压缩和解压缩类的使用技巧和注意事项，需要的朋友参考一下本文实例讲述了C#实现的文件压缩和解压缩类。分享给大家供大家参考。具体分析如下：这个C#代码包含了几个类，封装了文件压缩和解压缩常用的方法，包括直接通过代码进行压缩，也有调用winrar对文件进行压缩的希望本文所述对大家的C#程序设计有所帮助。

从URL压缩的csv文件中的pandas.read_csv出现奇怪的错误

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档