当前位置: 首页 > 知识库问答 >
问题:

替换熊猫多索引数据帧中的值

武嘉祥
2023-03-14

我想更改我的熊猫数据框架中的一个值,我想我误解了索引的工作方式。

将熊猫导入pd idx=pd.IndexSlicedf.loc[idx[(0,2006.0,'01019_13055_01073_01009_01055')], idx[('moment_25','P517')]

我得到输出

Out[376]: 
moment_25  P517    0.665873
Name: (0, 2006.0, 01019_13055_01073_01009_01055), dtype: float64

我想将df中的值0.665873更改为1。我试过了

df.ix[idx[(0, 2006.0,'01019_13055_01073_01009_01055')],idx[('moment_25','P517')]]=1

但我得到了错误

Exception: cannot handle a non-unique multi-index!

我试图用示例数据帧复制该问题,但无济于事。

arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index)
df.loc[idx['A'],idx[('baz','one')]]

Out[391]: -0.17935592549360641

我认为问题在于,当我使用实际数据时,我得到了一系列的输出,但当我使用实践数据时,得到了一个浮点。为什么我得到的是这个系列而不是浮点0.665873?

共有1个答案

邰德业
2023-03-14

使用< code>set_value更改数据帧中的值。下面的例子:

import pandas as pd
import numpy as np
dfp = pd.DataFrame({'A' : [np.NaN,np.NaN,3,4,5,5,3,1,5,np.NaN], 
                    'B' : [1,0,3,5,0,0,np.NaN,9,0,0], 
                    'C' : ['Pharmacy of IDAHO','Access medicare arkansas','NJ Pharmacy','Idaho Rx','CA Herbals','Florida Pharma','AK RX','Ohio Drugs','PA Rx','USA Pharma'], 
                    'D' : [123456,123456,1234567,12345678,12345,12345,12345678,123456789,1234567,np.NaN],
                    'E' : ['Assign','Unassign','Assign','Ugly','Appreciate','Undo','Assign','Unicycle','Assign','Unicorn',]})
print(dfp)


  A    B                         C            D           E
0  NaN  1.0         Pharmacy of IDAHO     123456.0      Assign
1  NaN  0.0  Access medicare arkansas     123456.0    Unassign
2  3.0  3.0               NJ Pharmacy    1234567.0      Assign
3  4.0  5.0                  Idaho Rx   12345678.0        Ugly
4  5.0  0.0                CA Herbals      12345.0  Appreciate
5  5.0  0.0            Florida Pharma      12345.0        Undo
6  3.0  NaN                     AK RX   12345678.0      Assign
7  1.0  9.0                Ohio Drugs  123456789.0    Unicycle
8  5.0  0.0                     PA Rx    1234567.0      Assign
9  NaN  0.0                USA Pharma          NaN     Unicorn
   #                      ^^Check HEERE^^

变化和输出:

dfp.set_value(9, 'C', 10)
print(dfp)

     A    B                         C            D           E
0  NaN  1.0         Pharmacy of IDAHO     123456.0      Assign
1  NaN  0.0  Access medicare arkansas     123456.0    Unassign
2  3.0  3.0               NJ Pharmacy    1234567.0      Assign
3  4.0  5.0                  Idaho Rx   12345678.0        Ugly
4  5.0  0.0                CA Herbals      12345.0  Appreciate
5  5.0  0.0            Florida Pharma      12345.0        Undo
6  3.0  NaN                     AK RX   12345678.0      Assign
7  1.0  9.0                Ohio Drugs  123456789.0    Unicycle
8  5.0  0.0                     PA Rx    1234567.0      Assign
9  NaN  0.0                        10          NaN     Unicorn
#                             ^^The CHANGE^^

如果您专门询问有关索引的问题,请查看此处

使用上面链接的方法:

dfp.ix[0, 'C'] = 'x'
#                         vv Check Below vv
     A    B                         C            D           E
0  NaN  1.0                         x     123456.0      Assign
1  NaN  0.0  Access medicare arkansas     123456.0    Unassign
2  3.0  3.0               NJ Pharmacy    1234567.0      Assign
3  4.0  5.0                  Idaho Rx   12345678.0        Ugly
4  5.0  0.0                CA Herbals      12345.0  Appreciate
5  5.0  0.0            Florida Pharma      12345.0        Undo
6  3.0  NaN                     AK RX   12345678.0      Assign
7  1.0  9.0                Ohio Drugs  123456789.0    Unicycle
8  5.0  0.0                     PA Rx    1234567.0      Assign
9  NaN  0.0                        10          NaN     Unicorn
 类似资料:
  • 我有两个数据帧:df1和df2。df1有列['UserId'、'company'、'deg'],有100个观察值。df2有列['UserId','deg',],有10个观察值。df1和df2中的索引与“userId”完全匹配。 我想用df2中的更新df1。df2中的“UserId”列是df1中“UserId”列的子集……因此,没有任何附加内容。仅基于“userId”(和/或普通索引)。 df1 d

  • 我有一个多索引数据框,看起来像 uid tid文本 abc x t1 bcd y t2 uid 和 tid 是索引。我有一个 uid 列表,并希望获取与该列表中的 uid 相对应的行,但保留第 2 级索引值 (tid)。我想在不运行任何显式循环的情况下执行此操作。这可能吗?

  • 这是一个与这个问题非常相似的问题,但有一个关键的区别:我选择的数据我想改变的不是它的索引,而是一些标准。 如果我应用的条件返回一行,我希望能够以一种简单的方式设置该行中某一列的值,但是我的第一次尝试不起作用: 因此,与其将2009年周日的香蕉销量设定为100,还不如什么都不发生!做这件事最好的方法是什么?理想情况下,解决方案应该使用行号,因为您通常事先不知道!

  • 获取相应列内容满足条件的索引范围的最有效方法是什么。。类似于以标记开始并以“body”标记结束的行。 例如,数据框如下所示 我要得到行索引1-3 有人能提出最具蟒蛇风格的方法来实现这一点吗?

  • 假设我有一个数据帧 我从我的数据子集创建另一个数据帧: 是否保存了中这些元素的副本?有没有办法创建该数据的?如果是这样,如果我尝试修改此视图中的数据会发生什么情况?Pandas是否提供任何类型的写时拷贝机制?

  • 问题内容: 因此,我了解到可以使用DataFrame.groupby而不用使用MultiIndex进行子采样/横截面。 另一方面,当我在DataFrame上具有MultiIndex时,仍然需要使用DataFrame.groupby进行子采样/横截面。 那么,除了在打印时非常有用和漂亮地显示层次结构之外,MultiIndex有什么好处? 问题答案: 在pandas 0.4版本中引入了分级索引(也称为