当前位置：首页 > 面试题库 >

在Pandas中分配列时处理SettingWithCopyWarning [重复]

梁新觉

2023-03-14

问题内容：

这个问题已经在这里有了答案 ：

如何在熊猫中处理SettingWithCopyWarning （15个答案）

1年前关闭。

我有一个DataFrame要扩展的列，其中包含上一行的数据。

此脚本可以完成以下任务：

#!/usr/bin/env python3

import numpy as np
import pandas as pd

n = 2

df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [0,1,1,0,0]}, columns=['A', 'B'])

df2 = df[df['B'] == 0]
print(df2)

for i in range(1, n+1):
    df2['A_%d' % i] = df2['A'].shift(i)

print(df2)

它输出：

   A  B
0  1  0
3  4  0
4  5  0

   A  B  A_1  A_2
0  1  0  NaN  NaN
3  4  0  1.0  NaN
4  5  0  4.0  1.0

这正是我想要的。在DataFrame现在有两个附加列A_1和A_2包含列的值A 1 点 2 之前的行。

但是，我也得到警告：

./my_script.py:14: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  df2['A_%d' % i] = df2['A'].shift(i)

问题肯定来自我创建之前的过滤df2。如果我df直接工作，则不会发生此问题。在我的应用程序中，我需要分别处理原始DataFrame的多个部分，因此绝对需要进行过滤。df2稍后将所有不同部分（如此处）连接起来。

我在如何处理Pandas中的SettingWithCopyWarning中发现了类似的问题？和Pandas
SettingWithCopyWarning，
但那里的解决方案无法解决问题。

写作例如

df2[:, 'A_%d' % i] = df2['A'].shift(i)

仍然出现相同的警告。

我正在使用Python 3.5.2和Pandas 0.19.2

问题答案：

我认为您需要copy：

df2 = df[df['B'] == 0].copy()

如果df2稍后再修改值，您会发现修改不会传播回原始数据（df），并且Pandas会发出警告。

类似资料：

如何处理Pandas中的SettingWithCopyWarning

问题内容：背景我刚刚将熊猫从0.11升级到0.13.0rc1。现在，该应用程序会弹出许多新警告。其中之一是这样的：我想知道这到底是什么意思？我需要改变什么吗？如果我坚持使用该如何警告quote_df[‘TVol’] = quote_df[‘TVol’]/TVOL_SCALE？产生错误的功能更多错误讯息问题答案：在SettingWithCopyWarning被创造的标志可能造成混淆的
Python中如何处理Pandas中的SettingWithCopyWarning？

问题内容：背景我刚刚将Pandas从0.11升级到0.13.0rc1。现在，该应用程序弹出许多新警告。其中之一是这样的：我想知道到底是什么意思？我需要改变什么吗？如果我坚持使用该如何警告产生错误的函数更多错误讯息问题答案：在被创造的标志可能造成混淆的“链接”的任务，比如下面这并不总是如预期的工作，特别是当第一选择返回一个副本。[ 有关背景讨论，请参见GH5390和GH5597。]
pandas：同时分配多个* new *列

问题内容：我有一个DataFrame，其中的一列包含每行的标签（除了每行的一些相关数据）。我有一本字典，其键等于可能的标签，而值等于与该标签相关的信息的2元组。我想在框架上添加两个新列，每个对应于标签的2元组的每一部分。这是设置：我可以通过运行获得想要的东西：但是，如果我不想手动在作业左侧键入两列，该怎么办？即，如何动态创建多个新列。例如，如果我有10个元组而不是2个元组，那么这将是当前所
如何处理熊猫的SettingWithCopyWarning

我想知道它到底是什么意思？我需要改变什么吗？如果坚持使用,应如何挂起警告？
NumPy分配中重复索引的处理

问题内容：我正在设置2D数组中多个元素的值，但是我的数据有时包含给定索引的多个值。似乎总是分配了“更高”的值（请参见下面的示例），但是是否可以保证此行为，或者是否有机会获得不一致的结果？我怎么知道我可以按照我在矢量化分配中想要的方式来解释“稍后”？也就是说，在我的第一个示例中，肯定会始终包含该内容，而在第二个示例中，它将打印吗？很简单的例子：另一个例子问题答案：在NumPy 1.9和
如何在Java流中处理时将列表细分为多个列表？[重复]

我有以下API调用失败是因为现在我明白了，我必须多次调用以删除Cloud watch的Insight规则，每20个块。所以从概念上来说，我在寻找现在，我在java 8 streams api中找不到任何允许我将列表分块处理的东西。有点像scala分组功能将列表拆分为多个元素数目固定的列表。有人能帮我解决这个问题吗？谢谢当然，我可以使用命令式样式和子列表，但如果可以的话，我宁愿避免这样做。

相关阅读

在pandas数据框中分组重复的列ID 分配pandas数据框列dtypes 在pandas中跨列替换重复值在Pandas中处理NaN值的方法使用Pandas DataFrame的处理时间

相关文章

HttpClient重定向处理示例 Selenium WebDriver处理下拉列表 PyTorch Convent进行序列处理批处理日期时间 Pandas数据重采样

相关问答

在Pandas DataFrame Python中添加新列[重复]当时间戳在源分配时，flink如何处理延迟？Python Pandas：拆分列并在当前[重复]旁边添加新列 pandas - 如何在导出到Excel时处理Pandas DataFrame的多级列索引，避免空白行和列？在分解中分配选项 [重复]

相关工具

Pandas Sklearn-pandas pandas-profiling Pandas AI 数据库处理框架

相关文档

十分钟搞定 pandas Python 和 Pandas 数据分析教程怎样优化 Pentium 系列处理器的代码 Python 文本处理 Python Pandas 中文教程