下面我有一个数据框,我只想得到数据框的一个子类,它只包括那些列(“day”)为“friday”的记录,并且只针对非吸烟者。基本上,我想计算一个星期五非吸烟者的总账单的箱线图。但我需要从整个df中获得一个样本,因为我还需要计算其他条件,甚至可能需要指定更多的条件。
df.head()
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
您可以使用。loc
使用您的两个条件访问数据帧,并根据需要添加其他条件。
df[(df.day =="Fri") & (df.smoker == "No")]
如何获得熊猫的行标签列表? 我有一个带有列标签和行标签的表。要返回列标签,我使用dataframe“column”属性。可以返回带有属性列的列标签列表,但我找不到行的类似属性。
基于“SC”代码,我需要将SRCTable与RefTable-1或RefTable-2连接起来 条件:如果SC为“D”,则SRCTable在KEY=KEY1上与RefTable-1连接以获得值。否则,如果SC为“U”,则SRCTable与键=键2上的RefTable-2连接 这是输入spark数据帧。 预期产出: 注意:输入表将有数百万条记录,因此需要一个优化的解决方案
我有以下数据框: 我想根据以下条件对其进行过滤: 创建的角度=范围(87-92) GDT 1和GDT 2之间的距离 到目前为止我尝试了这个(最后一个方法): 此代码的输出是一个没有错误的空数据库。
我有一个如下所示的数据框,我必须准备“目标列” 如果同一列下的两个单词之间有逗号,则必须按第2行所示标记两次。如果没有逗号但有空格,则必须将其视为同一个单词,即必须标记一次。另外,请注意顺序也很重要(第3行和第6行)。忽略任何内容(即没有单词,因此没有标签) 我已经使用了迭代(即使用iloc,for循环),但是它需要大量的时间,因为数据点超过200k,标签的数量也超过20个。我希望有一个有效的代码
我有一个数据集,包含以下各列: 现在,我需要添加一个新的column类,并根据以下条件将其赋值为或: 我只在一个条件下完成了它,但我不知道如何在多个条件下完成它。 这里的wIat我已经尝试过: 我查看了所有其他类似的问题,但找不到解决问题的任何方法。我尝试了上述所有帖子,但仍坚持这个错误:
我从excel中读取了如下数据: 我想把列'10V'和'11V'成两个数组。以便用滤波系数处理数据。但是我不知道如何将列复制到数组,或者如何直接访问/操作DataFrame中的元素? 谁能给我一个提示吗?非常感谢。