当前位置: 首页 > 知识库问答 >
问题:

如何筛选数据集以仅包含特定关键字?[副本]

苏磊
2023-03-14

我有一个包含多个国家的数据集。如何对其进行筛选,使其仅包含特定国家/地区?

例如,现在它包含英国、比利时、法国等

我想过滤它,使它只显示法国和比利时。

到目前为止,我已经尝试过:

dataset = dataset.loc[dataset.Country == "France"].copy()
dataset.head()

它是有效的,因为它只过滤法国的数据,但如果我加上比利时

dataset = dataset.loc[dataset.Country == "France","Belgium"].copy()
dataset.head()

它不再工作了。我得到以下错误:

'the label [Belgium] is not in the [columns]'

我们将非常感谢您的帮助。

共有1个答案

任昊苍
2023-03-14

您尝试的方法失败了,因为它将'比利时'视为要查找的列,而该列不存在。如果你想过滤多个值,然后使用isin

dataset = dataset[dataset['Country'].isin([ "France","Belgium"])].copy()

当您使用loc时,逗号后的参数被视为要查找的标签,在本例中是在列轴中

 类似资料:
  • 问题内容: 我有一个dict包含大量条目的条目。我只对其中几个感兴趣。有没有一种简单的方法可以将其他所有元素都修剪掉? 问题答案: 构建一个新的字典: 使用字典理解。 如果使用缺少它们的版本(例如,Python 2.6和更早版本),请使其成为。一样,尽管丑陋。 请注意,这与jnnnnn的版本不同,对于任何大小的,都具有稳定的性能(仅取决于your_keys的数量)。在速度和内存方面。由于这是一个生

  • 我有一个实体,其中一个字段是 我需要得到所有的时间表项目,其中的集合包含一个特定的组(集合可以有很多不同的组也。如果“我的组”是其中之一-它是我需要的)。 如果在没有任何条件的情况下运行代码,我可以在调试器中看到我的包含数据库中的所有项,并且每个项都包含中的组。 截图 当然,我可以“手动”找到我需要的项(例如,使用.stream()),但我肯定有一些方法可以使用谓词来获得它。

  • 问题内容: 我正在寻找一种选择SQL服务器上所有数据库的方法,这些数据库仅包含表“ dbo.mytable” 我怎样才能做到这一点 ? 我已经有了这两个sql查询: 和 第一个查询列出我的sql服务器上的所有数据库,第二个查询检查dbo.mytable是否存在。我想将它们合并。 谢谢 问题答案: 一种将它们全部归还到一个结果集中的简洁方法是

  • 我试图根据某个字符串是否是列中值的子字符串来对dataframe应用筛选器。 例如:让我们调用子字符串'x',我想检索所有行,其中'x'是名为'a'的列中值的子字符串。 或者这个: 或者类似的东西。有没有人对我如何实现这一点有个想法?

  • 问题内容: 有没有一种方法可以选择其中一列仅包含,但包含任意数量的预定义值的行? 我一直在使用它,但是它返回的行中我的列至少包含一个值(我知道这正是它应该做的)。 但我正在寻找一种方法,仅选择在关键字列中仅包含我的关键字的行。 关键字示例: 使用上述关键字,我希望返回前两个结果,而不是后两个: 我的专栏包含用逗号分隔的适用于该产品行的所有关键字的列表。 问题答案: 由于您将列表存储为包含逗号分隔列

  • 我正在尝试用Angular 7建立一个动态研究。我正在用多个键从API中获取一个数组:[_id= 我用ngFor显示我所有的结果,我已经用我找到的教程创建了一个过滤管道… 这是我的研究部分: 这是我的过滤管功能: 但是这只会过滤这样的数组:[