当前位置: 首页 > 知识库问答 >
问题:

从URL压缩的csv文件中的pandas.read_csv出现奇怪的错误

戚宏扬
2023-03-14
pd.read_csv('publicleaderboarddata.zip')
       TeamId           TeamName       SubmissionDate    Score
0      688191  Sergey Mushinskiy  2017-05-24 12:20:34  0.06630
1      688203       DeepVoltaire  2017-05-24 12:25:03  0.06630
2      688237        RakeshNikam  2017-05-24 13:02:31  0.06512
......
this_leaderboard_df = pd.read_csv('https://www.kaggle.com/c/6649/publicleaderboarddata.zip,
                                  compression='zip')

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py中的parser_f(filepath_or_buffer、sep、分隔符、标头、名称imal,lineterminator,quotechar,quoting,doublequote,escapechar,comment,encoding,diquence,error_bad_lines,warn_bad_lines,delim_whitespace,low_memory,memory_map,float_precision)683)684->685 return_read(filepath_or_buffer,kwds)686 687 parser_f.name=name

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in_read(filepath_or_buffer,kwds)455 456#创建解析器。-->457 parser=TextFileReader(fp_or_buf,**kwds)458 459如果chunksize或iterator:

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in init(self,f,engine,**kwds)893 self.options[“has_index_names”]=kwds[“has_index_names”]894->895 self._make_engine(self.engine)896 897 def close(self):

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in_make_engine(self,engine)1133 def_make_engine(self,engine):1134如果engine==“c”:->1135 self._engine=CParserWrapper(self.f,**self.options)1136 else:1137如果engine==“python”:

~/.virtualenvs/py3/lib/python3.7/site-packages/pandas/io/parsers.py in init(self,src,**kwds)1915 kwds[“usecols”]=self.usecols 1916->1917 self._reader=parsers.textreader(src,**kwds)1918 self.unnamed_cols=self._reader.unnamed_cols 1919

pandas._libs.parsers.textreader.cinit()中的pandas/_libs/parsers.pyx

pandas._libs.parsers.textreader._setup_parser_source()中的pandas/_libs/parsers.pyx

/usr/local/cellar/python/3.7.4/frameworks/python.framework/versions/3.7/lib/python3.7/zipfile.py in init(self,file,mode,compression,allowZip64,compresslevel)1223 try:1224 if mode=='r':->1225 self._realgetcontents()1226 elif mode in('w','x'):1227#设置修改后的标志,以便写入中央目录

_realgetContents(self)中的/usr/local/cellar/python/3.7.4/frameworks/python.framework/versions/3.7/lib/python3.7/zipfile.py 1290引发BadZipFile(“文件不是zip文件”)1291如果不是endrec:->1292引发BadZipFile(“文件不是zip文件”)1293如果self.debug>1:1294 print(endrec)

badzipfile:文件不是zip文件

共有1个答案

朱丰
2023-03-14

要下载它,你必须登录到Kaggle。如果你从Kaggle注销并尝试直接从链接下载,那么你会看到登录表单。

pandas无法登录到此页面,因此它获得带有登录表单的HTML而不是zip文件。

您可以使用Selenium控制web浏览器,然后脚本可以使用浏览器登录到Kaggle和下载文件。

 类似资料:
  • 我在读取压缩的csv文件时出错。错误如下:“zlib.error:解压缩时错误-3:设置的距离无效” 代码: 我在文件上尝试了Gunzip,它没有任何问题。我使用Gunzip-t。它给rc 0。

  • 我正在使用Julia的ZipFile包来提取和处理csv文件。没问题,但是当我遇到zip文件中的zip文件时,我也想处理它,但是遇到了一个错误。 Julia ZipFile文档如下:https://zipfilejl.readthedocs.io/en/latest/ 对如何做到这一点有什么想法吗?

  • 能读一本书吗。仅包含来自URL的文件? 例如https://www.federalreserve.gov/econres/files/scfp2016s.zip包含一个文件:不适用于它: ValueError:给定Stata文件的版本不是104、105、108、111(Stata 7SE)、113(Stata 8/9)、114(Stata 10/11)、115(Stata 12)、117(Stat

  • 我正在尝试将压缩的csv文件(.bz2)读取为数据帧。我的代码如下 当我在IDE中尝试时,这是可行的。我可以读取数据并对其进行处理,但当我尝试使用maven构建数据并在命令行上运行它时,会出现以下错误 我不确定我是否在这里错过了什么。读取csv文件是否有一些依赖项?根据留档,Spark 2. x. x内置了对此的支持。

  • 问题内容: 我一般对Python和编程都不熟悉,所以如果我遗漏了一些明显的东西,请提前道歉。我正在尝试绘制图形并标记轴,但是每次尝试标记y轴时都会引发异常。我在下面的新脚本中编写了代码,以确保问题不是来自模块中的其他地方。我正在使用Python 3.4。 每次,我在最后一行收到错误“ TypeError:’str’对象不可调用”。如果我将y更改为x,一切都很好。如果将x更改为ay,则会收到相同的错

  • 本文向大家介绍C#实现的文件压缩和解压缩类,包括了C#实现的文件压缩和解压缩类的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了C#实现的文件压缩和解压缩类。分享给大家供大家参考。具体分析如下: 这个C#代码包含了几个类,封装了文件压缩和解压缩常用的方法,包括直接通过代码进行压缩,也有调用winrar对文件进行压缩的 希望本文所述对大家的C#程序设计有所帮助。