我想更改我的熊猫数据框架中的一个值,我想我误解了索引的工作方式。
将熊猫导入pd idx=pd.IndexSlicedf.loc[idx[(0,2006.0,'01019_13055_01073_01009_01055')], idx[('moment_25','P517')]
我得到输出
Out[376]:
moment_25 P517 0.665873
Name: (0, 2006.0, 01019_13055_01073_01009_01055), dtype: float64
我想将df中的值0.665873更改为1。我试过了
df.ix[idx[(0, 2006.0,'01019_13055_01073_01009_01055')],idx[('moment_25','P517')]]=1
但我得到了错误
Exception: cannot handle a non-unique multi-index!
我试图用示例数据帧复制该问题,但无济于事。
arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index)
df.loc[idx['A'],idx[('baz','one')]]
Out[391]: -0.17935592549360641
我认为问题在于,当我使用实际数据时,我得到了一系列的输出,但当我使用实践数据时,得到了一个浮点。为什么我得到的是这个系列而不是浮点0.665873?
使用< code>set_value更改数据帧中的值。下面的例子:
import pandas as pd
import numpy as np
dfp = pd.DataFrame({'A' : [np.NaN,np.NaN,3,4,5,5,3,1,5,np.NaN],
'B' : [1,0,3,5,0,0,np.NaN,9,0,0],
'C' : ['Pharmacy of IDAHO','Access medicare arkansas','NJ Pharmacy','Idaho Rx','CA Herbals','Florida Pharma','AK RX','Ohio Drugs','PA Rx','USA Pharma'],
'D' : [123456,123456,1234567,12345678,12345,12345,12345678,123456789,1234567,np.NaN],
'E' : ['Assign','Unassign','Assign','Ugly','Appreciate','Undo','Assign','Unicycle','Assign','Unicorn',]})
print(dfp)
A B C D E
0 NaN 1.0 Pharmacy of IDAHO 123456.0 Assign
1 NaN 0.0 Access medicare arkansas 123456.0 Unassign
2 3.0 3.0 NJ Pharmacy 1234567.0 Assign
3 4.0 5.0 Idaho Rx 12345678.0 Ugly
4 5.0 0.0 CA Herbals 12345.0 Appreciate
5 5.0 0.0 Florida Pharma 12345.0 Undo
6 3.0 NaN AK RX 12345678.0 Assign
7 1.0 9.0 Ohio Drugs 123456789.0 Unicycle
8 5.0 0.0 PA Rx 1234567.0 Assign
9 NaN 0.0 USA Pharma NaN Unicorn
# ^^Check HEERE^^
变化和输出:
dfp.set_value(9, 'C', 10)
print(dfp)
A B C D E
0 NaN 1.0 Pharmacy of IDAHO 123456.0 Assign
1 NaN 0.0 Access medicare arkansas 123456.0 Unassign
2 3.0 3.0 NJ Pharmacy 1234567.0 Assign
3 4.0 5.0 Idaho Rx 12345678.0 Ugly
4 5.0 0.0 CA Herbals 12345.0 Appreciate
5 5.0 0.0 Florida Pharma 12345.0 Undo
6 3.0 NaN AK RX 12345678.0 Assign
7 1.0 9.0 Ohio Drugs 123456789.0 Unicycle
8 5.0 0.0 PA Rx 1234567.0 Assign
9 NaN 0.0 10 NaN Unicorn
# ^^The CHANGE^^
如果您专门询问有关索引的问题,请查看此处
使用上面链接的方法:
dfp.ix[0, 'C'] = 'x'
# vv Check Below vv
A B C D E
0 NaN 1.0 x 123456.0 Assign
1 NaN 0.0 Access medicare arkansas 123456.0 Unassign
2 3.0 3.0 NJ Pharmacy 1234567.0 Assign
3 4.0 5.0 Idaho Rx 12345678.0 Ugly
4 5.0 0.0 CA Herbals 12345.0 Appreciate
5 5.0 0.0 Florida Pharma 12345.0 Undo
6 3.0 NaN AK RX 12345678.0 Assign
7 1.0 9.0 Ohio Drugs 123456789.0 Unicycle
8 5.0 0.0 PA Rx 1234567.0 Assign
9 NaN 0.0 10 NaN Unicorn
我有两个数据帧:df1和df2。df1有列['UserId'、'company'、'deg'],有100个观察值。df2有列['UserId','deg',],有10个观察值。df1和df2中的索引与“userId”完全匹配。 我想用df2中的更新df1。df2中的“UserId”列是df1中“UserId”列的子集……因此,没有任何附加内容。仅基于“userId”(和/或普通索引)。 df1 d
我有一个多索引数据框,看起来像 uid tid文本 abc x t1 bcd y t2 uid 和 tid 是索引。我有一个 uid 列表,并希望获取与该列表中的 uid 相对应的行,但保留第 2 级索引值 (tid)。我想在不运行任何显式循环的情况下执行此操作。这可能吗?
这是一个与这个问题非常相似的问题,但有一个关键的区别:我选择的数据我想改变的不是它的索引,而是一些标准。 如果我应用的条件返回一行,我希望能够以一种简单的方式设置该行中某一列的值,但是我的第一次尝试不起作用: 因此,与其将2009年周日的香蕉销量设定为100,还不如什么都不发生!做这件事最好的方法是什么?理想情况下,解决方案应该使用行号,因为您通常事先不知道!
获取相应列内容满足条件的索引范围的最有效方法是什么。。类似于以标记开始并以“body”标记结束的行。 例如,数据框如下所示 我要得到行索引1-3 有人能提出最具蟒蛇风格的方法来实现这一点吗?
假设我有一个数据帧 我从我的数据子集创建另一个数据帧: 是否保存了中这些元素的副本?有没有办法创建该数据的?如果是这样,如果我尝试修改此视图中的数据会发生什么情况?Pandas是否提供任何类型的写时拷贝机制?
问题内容: 我有以下熊猫数据框: 我想将日期时间索引转换为数据框的列。我尝试过,但结果没有改变。任何想法? 问题答案: 需要分配输出或参数: