当前位置: 首页 > 知识库问答 >
问题:

熊猫操作数据帧在位与不在位(在位=真vs假)[重复]

储嘉悦
2023-03-14

我想知道当我们选择就地操作数据帧(与不就地操作相比)时,内存使用是否会显著减少。

我在Stack Overflow上做了一些搜索,发现了这篇文章,其中的答案是,如果操作没有就地完成,则返回数据框的副本(我想当有一个名为“就地”的可选参数时,这有点明显: P)...

如果我不需要保留原始的数据帧,只修改数据帧是有益的(也是合乎逻辑的),对吗?

背景:

我试图在按数据框中的特定“列”排序时获取顶部元素。我想知道这两种方法中哪一种更有效:

到位:

df.sort('some_column', ascending=0, inplace=1)
top = df.iloc[0]

vs.

副本:

top = df.sort('some_column', ascending=0).iloc[0]

对于复制的情况,即使我没有将副本分配给变量,它仍然会在排序时分配内存。如果是这样,从内存中释放该副本需要多长时间?

感谢您提前提供的任何见解!

共有1个答案

景恩
2023-03-14

一般来说,inplace=True和返回显式副本之间没有区别——在这两种情况下,都会创建一个副本。碰巧的是,在第一种情况下,副本中的数据被复制回原始df对象,因此不需要重新分配。

此外,请注意,从v0开始。21df。sort已弃用,请改用sort\u值。

 类似资料:
  • 我想知道如何获取日期列的值。键入df时,“日期”列不显示。柱。我正试图用df将这个df转换成一个Json文件。to_json(),它获取除日期以外的所有值。谢谢大家。 输入[49]:输入(df)输出[49]:熊猫。果心框架数据帧

  • 我有一个数据框架,myDF,其中一列我希望使用来自其他列的条件和索引与第二个数据框架,标准DF的组合设置为零。 myDF.head(): 标准DF: 然后通过以下for循环运行myDF: 这会产生以下错误: 回溯(最近一次调用): 文件 “”, 第 1 行, in runfile('myscript.py', wdir='C:myscript') 文件“C:\ program data \ ana

  • 我有两个Pandas Dataframe和,其中是的一部分,我想创建一个Dataframe,其中包含中的code>。 以下是一个例子: 注: 我的DataFrame可能有多个列,但是必须仅在列上进行匹配。

  • 通过np.bitwise_and()函数对输入数组中的整数的二进制表示的相应位执行位与运算。 例子 输出如下: 13 和 17 的二进制形式: 0b1101 0b10001 13 和 17 的位与: 1 你可以使用下表验证此输出。 考虑下面的位与真值表。 通过np.bitwise_or()函数对输入数组中的整数的二进制表示的相应位执行位或运算。 import numpy as np a,b = 1

  • 求子集[M]

  • 这似乎是非常基本的知识,但我还是卡住了,尽管我有一些数据处理的理论背景(通过其他软件)。值得一提的是,我是蟒蛇和熊猫图书馆的新手。 我的任务是将系列名称列的值作为单独的列(从长到宽转换)。我花了很长时间尝试不同的方法,但只有错误。 例如: 我犯了一个错误: ...很多短信...通过值的长度是2487175,索引暗示2 有谁能指导我完成这个过程吗?谢谢 它用于代码“mydata=mydata”。pi