当前位置: 首页 > 知识库问答 >
问题:

正在以块形式加载csv文件[副本]

杨赞
2023-03-14
 %%time
 import pandas as pd
 data=pd.read_csv('C:\\Users\\mahes_000\\Desktop\\yellow.csv',iterator=True,
                  chunksize=50000)

在那里我得到了多个chunksize部分,我试图做一些操作,比如

 %%time
 data.get_chunk().head(5)
 data.get_chunk().shape
 data.get_chunk().drop(['Rate_Code'],axis=1)

对于操作,它选择任意一个块体部分,并执行它的所有操作。那剩下的部分呢?如何在没有内存错误的情况下对完整的数据进行操作。

共有1个答案

爱乐邦
2023-03-14

在参数chunksize的文档中:

返回TextFileReader对象进行迭代

因此,通过将对象放置在循环中,您将以chunksize中指定的块迭代读取数据:

chunksize = 5e4
for chunk in pd.read_csv(filename, chunksize=chunksize):
    #print(chunk.head(5))
    #print(chunk.shape())
 类似资料:
  • fgets() 有局限性,每次最多只能从文件中读取一行内容,因为 fgets() 遇到换行符就结束读取。如果希望读取多行内容,需要使用 fread() 函数;相应地写入函数为 fwrite()。 对于 Windows 系统,使用 fread() 和 fwrite() 时应该以二进制的形式打开文件,具体原因我们已在《 文本文件和二进制文件到底有什么区别》一文中进行了说明。 fread() 函数用来从

  • 问题内容: 我是PostgresSQL的新手,我正尝试加载以下格式的数据: 记录超过1万,某些列可能包含NULL数据。当我尝试这样做时: 我收到以下错误:ERROR:最后一个预期的列SQL状态之后的多余数据:22P04 我已经检查了列,它们还可以。这意味着不会遗漏任何列。 希望有人能帮忙。提前谢谢。 问题答案: 应该是 对我有用

  • 可以用干净的java编写spring boot配置,以干净的文本形式加载整个资源文件。 这是我到现在为止的距离: 应用yml 配置类: 文件内容(src/资源/test-of-file/file.txt): 那我要

  • 我是Spark的新手,我正在尝试使用Spark从文件中读取CSV数据。以下是我正在做的: 我希望这个调用会给我一个文件前两列的列表,但我遇到了以下错误: 索引器中第1行的文件“”:列表索引超出范围 虽然我的CSV文件不止一列。

  • 问题内容: 以Redux-Form中的InitializationFromState为例,我试图动态地进行设置。这是在书籍列表中编辑特定书籍,并使用在express.js中设置的简单api。 完整的容器在下面。我不知何故需要在函数中传递。在示例中,这是通过静态对象完成的,但我无法弄清楚如何使用通过提取的信息并将其传递给。 容器: 谢谢。 问题答案: 您的表单值不是吗?我认为这就是您要寻找的全部:

  • 如何确认我的JAR文件已加载到Coldfusion中?我在CF10上。 我目前得到这个错误: 我的网站结构如下: 在我的申请中。cfc,我有以下代码: 这是我调用一切的代码: 更新#1 我在检查administor时发现了设置摘要,其中列出了服务器Java类路径。我添加了jar文件的位置并重新启动了服务器。即使路径存在于Administrator中的类路径中,我仍然会遇到相同的错误。 更新2 添加