在执行groupby(’name’)并在其他列上使用过mean()函数后,我得到了这样的系列
name
383 3.000000
663 1.000000
726 1.000000
737 9.000000
833 8.166667
谁能告诉我如何过滤出平均值为1.000000的行?谢谢,我非常感谢您的帮助。
In [5]:
import pandas as pd
test = {
383: 3.000000,
663: 1.000000,
726: 1.000000,
737: 9.000000,
833: 8.166667
}
s = pd.Series(test)
s = s[s != 1]
s
Out[0]:
383 3.000000
737 9.000000
833 8.166667
dtype: float64
问题内容: 给个喜欢 我想获得一个“子系列” ,其中所有值都是字符串。我已经尝试过像这样的布尔索引: 但这给了 KeyError:错误 到目前为止,在寻找合适的方法时,我遇到了select,但这在标签上强加了一个标准,而不是值。在这种情况下,如何基于值的类型进行过滤? 问题答案: 使用或列出理解: 一样,谢谢: 全部返回: 编辑: 不推荐这样做,谢谢cᴏʟᴅsᴘᴇᴇᴅ:
问题内容: 我正在做熊猫分析。 我的表有700万行* 30列。单元格值的范围从-1到3随机。现在,我想根据列的值过滤掉行。 我了解如何根据多个条件进行选择,写下条件并通过“&”“ |”组合。 但是我有30列要过滤,并按相同的值过滤。例如,需要选择最后12列的值等于-1 上面的代码给了我一个布尔值。我需要实际的数据框。 这里的逻辑是“或”,表示如果任何列的值为-1,则需要选择该行。另外,很高兴知道我
问题内容: 我有一个csv文件,当我使用过滤列并使用多个索引时,该文件输入不正确。 我希望df1和df2除了丢失的虚拟列外应该相同,但这些列的标签错误。日期也被解析为日期。 使用列号而不是名称给我同样的问题。我可以通过在read_csv步骤之后删除虚拟列来解决此问题,但是我试图了解出了什么问题。我正在使用熊猫0.10.1。 编辑:修复错误的标头用法。 问题答案: @chip的答案完全错过了两个关键
问题内容: 我正在尝试使用三列阈值过滤pandas数据框 但是,我想在一个函数中执行此操作,在字典中将列名及其阈值提供给我。这是我的第一次尝试,可以。本质上,我将过滤器放入变量中,然后运行它: 现在,最后我将所有内容都放到了函数中,并且它停止了工作(也许函数不喜欢在函数中使用!): 我知道函数在函数内部使用时的行为会有所不同,但不确定如何解决该问题。另外,我想知道在给定两个输入的情况下,必须有一种
问题内容: 我有一个sql文件,其中包含以下数据,我将这些数据读入pandas中。 输出量 下一行代码是获取上周的日期 我所试图做的是,比较有并打印出所有行小于 显然,这会返回一个错误 我应该怎么做? 问题答案: 我会做一个面具,像: 如果为,则返回:
本文向大家介绍Pandas的数据过滤实现,包括了Pandas的数据过滤实现的使用技巧和注意事项,需要的朋友参考一下 作者|Amanda Iglesias Moreno 编译|VK 来源|Towards Datas Science 从数据帧中过滤数据是清理数据时最常见的操作之一。Pandas提供了一系列根据行和列的位置和标签选择数据的方法。此外,Pandas还允许你根据列类型获取数据子集,并使用布尔