当前位置：首页 > 面试题库 >

大熊猫：DataFrame行上的复杂过滤器

奚英朗

2023-03-14

问题内容：

我想通过每行的功能来过滤行，例如

def f(row):
  return sin(row['velocity'])/np.prod(['masses']) > 5

df = pandas.DataFrame(...)
filtered = df[apply_to_all_rows(df, f)]

或者再举一个更复杂，人为的例子，

def g(row):
  if row['col1'].method1() == 1:
    val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4'])
  else:
    val = row['col2'].method5(row['col6'])
  return np.sin(val)

df = pandas.DataFrame(...)
filtered = df[apply_to_all_rows(df, g)]

我该怎么办？

问题答案：

您可以使用来执行此操作DataFrame.apply，该功能会沿给定轴应用功能，

In [3]: df = pandas.DataFrame(np.random.randn(5, 3), columns=['a', 'b', 'c'])

In [4]: df
Out[4]: 
          a         b         c
0 -0.001968 -1.877945 -1.515674
1 -0.540628  0.793913 -0.983315
2 -1.313574  1.946410  0.826350
3  0.015763 -0.267860 -2.228350
4  0.563111  1.195459  0.343168

In [6]: df[df.apply(lambda x: x['b'] > x['c'], axis=1)]
Out[6]: 
          a         b         c
1 -0.540628  0.793913 -0.983315
2 -1.313574  1.946410  0.826350
3  0.015763 -0.267860 -2.228350
4  0.563111  1.195459  0.343168

类似资料：

在熊猫的DataFrame上插值

问题内容：我有一个DataFrame，说一个波动率表面，索引为时间，列为行权。如何进行二维插值？我可以，但是我该如何处理？我知道我们可以，但是甚至不是线性插值。有没有办法插入我们自己的方法进行插值？问题答案：您可以用来获取线性插值。对于更复杂的事情，您需要推出自己的函数来处理一个对象并根据需要填充值并返回另一个对象。
熊猫DataFrame性能

问题内容： Pandas确实很棒，但令我惊讶的是，从Pandas.DataFrame检索值的效率低下。在下面的玩具示例中，即使DataFrame.iloc方法也比字典慢100倍以上。问题：这里的教训仅仅是字典是查找价值的更好方法吗？是的，我知道那正是他们的目的。但是我只是想知道是否缺少有关DataFrame查找性能的信息。我意识到这个问题比“提问”更“有趣”，但是我会接受一个提供洞察力或观点的
熊猫：过滤多个条件

问题内容：我正在尝试使用Pandas在几个条件下进行布尔索引。我原来的DataFrame称为。如果执行以下操作，将得到预期的结果：但是，如果我这样做（我认为应该是等效的），则不会返回任何行：知道导致差异的原因是什么？问题答案：使用是因为运算符优先级：或者，在单独的行上创建条件：样品：
通过包含str过滤熊猫数据框行

问题内容：我有很多行的python pandas数据框。从这些行中，我想切出并且仅使用“ body”列中包含单词“ ball”的行。为此，我可以这样做：问题是，我希望它不区分大小写，这意味着如果出现Ball或bAll一词，我也希望它们。进行不区分大小写的搜索的一种方法是将字符串转换为小写，然后以这种方式搜索。我想知道如何去做。我试过了但这是行不通的。我不确定是否应该在此等性质上使用lambd
熊猫：求和给定列的DataFrame行

问题内容：我有以下DataFrame：我想增加一列是列的总和，和。在各个论坛上，我认为这样会起作用：但事实并非如此。我想知道适当的操作与列的列表和作为输入。问题答案：您可以设置参数以对行求和，这将不忽略任何数字列：如果您只想汇总特定的列，则可以创建列的列表并删除您不感兴趣的列：
大熊猫：在DataFrame中合并两列

问题内容：我有一个熊猫，其中有多个列：其中和是包含相同数据但名称不同的列。有没有一种方法可以将组成行的行移动到理想状态，同时保持名称？最后，DataFrame应该显示为：那就是构成bar的NaN值被替换为的值。问题答案：尝试这个：如果您希望该数据成为新列，只需将结果分配给即可。

相关阅读

熊猫：求和给定列的DataFrame行大熊猫：在DataFrame中合并两列熊猫过滤特定年份的数据框行熊猫DataFrame的条件逻辑熊猫使用多个字段一起过滤行

相关文章

过滤器链 jQuery 过滤过滤器模式 GWT 复杂组件 jQuery Mobile 过滤

相关问答

如何在熊猫read_csv功能中过滤负载行？熊猫：设置最大行数类型函数的熊猫过滤参数不可迭代[重复]嵌套字典到熊猫DataFrame 熊猫选择没有重复[重复]的行

相关工具

熊猫Flash播放器乱码过滤器 dataframe-js 猫国建设者红猫软路由

相关文档

复杂性思维变现猫接入文档 v1.4 JackySummer 技术学习记录、随笔、总结、杂记 C++大学教程大话WEB开发