问题：

熊猫.at对.loc

石喜

2023-03-14

所以我运行了一些示例：

import pandas as pd
import numpy as np
from string import letters, lowercase, uppercase

lt = list(letters)
lc = list(lowercase)
uc = list(uppercase)

def gdf(rows, cols, seed=None):
    """rows and cols are what you'd pass
    to pd.MultiIndex.from_product()"""
    gmi = pd.MultiIndex.from_product
    df = pd.DataFrame(index=gmi(rows), columns=gmi(cols))
    np.random.seed(seed)
    df.iloc[:, :] = np.random.rand(*df.shape)
    return df

seed = [3, 1415]
df = gdf([lc, uc], [lc, uc], seed)

print df.head().T.head().T

DF类似于：

            a                                        
            A         B         C         D         E
a A  0.444939  0.407554  0.460148  0.465239  0.462691
  B  0.032746  0.485650  0.503892  0.351520  0.061569
  C  0.777350  0.047677  0.250667  0.602878  0.570528
  D  0.927783  0.653868  0.381103  0.959544  0.033253
  E  0.191985  0.304597  0.195106  0.370921  0.631576

让我们使用.at和.loc并确保得到相同的内容

print "using .loc", df.loc[('a', 'A'), ('c', 'C')]
print "using .at ", df.at[('a', 'A'), ('c', 'C')]

using .loc 0.37374090276
using .at  0.37374090276

%%timeit
df.loc[('a', 'A'), ('c', 'C')]

10000 loops, best of 3: 180 µs per loop

%%timeit
df.at[('a', 'A'), ('c', 'C')]

The slowest run took 6.11 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 8 µs per loop

# small df
sdf = gdf([lc[:2]], [uc[:2]], seed)

print sdf.loc[:, :]

          A         B
a  0.444939  0.407554
b  0.460148  0.465239

这就是说，谁能提供关于.at方法可以做什么和不能做什么的指导呢？

共有1个答案

郎恺

2023-03-14

更新:df.get_value从版本0.21.0起就不推荐使用。使用df.at或df.iat是今后推荐的方法。

df.at一次只能访问一个值。

df.loc可以选择多行和/或列。

In [25]: %timeit df.loc[('a', 'A'), ('c', 'C')]
10000 loops, best of 3: 187 µs per loop

In [26]: %timeit df.at[('a', 'A'), ('c', 'C')]
100000 loops, best of 3: 8.33 µs per loop

In [35]: %timeit df.get_value(('a', 'A'), ('c', 'C'))
100000 loops, best of 3: 3.62 µs per loop

类似资料：

熊猫SettingWithCopyWarning

问题内容： Python 3.4和Pandas 0.15.0 df是一个数据框，而col1是一列。使用下面的代码，我正在检查是否存在值10，并将此类值替换为1000。这是另一个例子。这次，我将基于索引更改col2中的值。这两种都会产生以下警告：最后，这会产生类似的警告，并带有以下建议：我不确定我是否理解警告中指出的讨论。编写这三行代码的更好方法是什么？请注意，该操作有效。问题答案：
熊猫：SettingWithCopyWarning

问题内容：我想将大于任意数（在这种情况下为100）的值替换为（因为如此大的值表示实验失败）。以前，我使用它来替换不需要的值：但是，出现以下错误：从这个StackExchange问题来看，有时似乎可以忽略此警告，但是我不能很好地跟踪讨论，无法确定这是否适用于我的情况。警告基本上是让我知道我将覆盖我的某些值吗？编辑：据我所知，一切都按其应有的方式进行。作为后续措施，我的替换值方法是否非标
大熊猫

我有一个数据帧，如：所以我想通过两个“for循环”添加一些列，如：新的类似数据帧的图片：我的代码不起作用：如何编写代码来获得像第二张图片这样的数据帧？
熊猫逆json_normalize

问题内容：我刚刚发现了json_normalize函数，该函数在获取JSON对象并给我一个熊猫Dataframe时效果很好。现在，我想要反向操作，该操作采用相同的Dataframe并给我一个与原始json具有相同结构的json（或类似json的字典，我可以轻松地将其转换为json）。这是一个示例：https : //hackersandslackers.com/json-into-pandas
熊猫：数事

问题内容：在下面，male_trips是一个大熊猫数据帧，station是一个小熊猫数据帧。对于每个车站ID，我想知道有多少次男性旅行。以下工作可以完成，但是需要很长时间：我应该怎么做呢？更新！因此，有两种主要方法：其次是和更简单的方法。我很快完成了，这种方法大获全胜！这是代码：结果如下：请注意，以这种速度，用于探索数据键入 value_counts的速度稍微快一些，而且记不起来了！
大熊猫read_csv

我正在读取一个包含多个datetime列的csv文件。我需要在读取文件时设置数据类型，但datetimes似乎是个问题。例如：运行时出现错误：不理解数据类型"datetime" 通过pandas在事实之后转换列。to_datetime（）不是一个选项，我不知道哪些列将成为datetime对象。这些信息可以更改，并且来自于通知我的数据类型列表的任何信息。或者，我尝试用numpy.genfrom

熊猫.at对.loc

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档