当前位置: 首页 > 知识库问答 >
问题:

基于多种条件,如何在Python中获取数据帧的子组?[副本]

景正文
2023-03-14

下面我有一个数据框,我只想得到数据框的一个子类,它只包括那些列(“day”)为“friday”的记录,并且只针对非吸烟者。基本上,我想计算一个星期五非吸烟者的总账单的箱线图。但我需要从整个df中获得一个样本,因为我还需要计算其他条件,甚至可能需要指定更多的条件。

df.head()

     total_bill     tip   sex    smoker  day    time    size
 0   16.99          1.01  Female    No  Sun    Dinner   2
 1   10.34          1.66    Male    No  Sun    Dinner   3
 2   21.01          3.50    Male    No  Sun    Dinner   3
 3   23.68          3.31    Male    No  Sun    Dinner   2
 4   24.59          3.61  Female    No  Sun    Dinner   4

共有1个答案

桓瀚
2023-03-14

您可以使用。loc使用您的两个条件访问数据帧,并根据需要添加其他条件。

df[(df.day =="Fri") & (df.smoker == "No")]
 类似资料:
  • 如何获得熊猫的行标签列表? 我有一个带有列标签和行标签的表。要返回列标签,我使用dataframe“column”属性。可以返回带有属性列的列标签列表,但我找不到行的类似属性。

  • 基于“SC”代码,我需要将SRCTable与RefTable-1或RefTable-2连接起来 条件:如果SC为“D”,则SRCTable在KEY=KEY1上与RefTable-1连接以获得值。否则,如果SC为“U”,则SRCTable与键=键2上的RefTable-2连接 这是输入spark数据帧。 预期产出: 注意:输入表将有数百万条记录,因此需要一个优化的解决方案

  • 我有以下数据框: 我想根据以下条件对其进行过滤: 创建的角度=范围(87-92) GDT 1和GDT 2之间的距离 到目前为止我尝试了这个(最后一个方法): 此代码的输出是一个没有错误的空数据库。

  • 我有一个如下所示的数据框,我必须准备“目标列” 如果同一列下的两个单词之间有逗号,则必须按第2行所示标记两次。如果没有逗号但有空格,则必须将其视为同一个单词,即必须标记一次。另外,请注意顺序也很重要(第3行和第6行)。忽略任何内容(即没有单词,因此没有标签) 我已经使用了迭代(即使用iloc,for循环),但是它需要大量的时间,因为数据点超过200k,标签的数量也超过20个。我希望有一个有效的代码

  • 我有一个数据集,包含以下各列: 现在,我需要添加一个新的column类,并根据以下条件将其赋值为或: 我只在一个条件下完成了它,但我不知道如何在多个条件下完成它。 这里的wIat我已经尝试过: 我查看了所有其他类似的问题,但找不到解决问题的任何方法。我尝试了上述所有帖子,但仍坚持这个错误:

  • 我从excel中读取了如下数据: 我想把列'10V'和'11V'成两个数组。以便用滤波系数处理数据。但是我不知道如何将列复制到数组,或者如何直接访问/操作DataFrame中的元素? 谁能给我一个提示吗?非常感谢。