当前位置: 首页 > 知识库问答 >
问题:

如何删除Python数据框[重复]中部分包含字符串的行

韦辰钊
2023-03-14

我已经使用熊猫导入了一个csv,现在我想删除包含某些通配符的行,可能是dev或test-dashboard-这些是字段中较大字符串的一部分。

我已经尝试了各种方法来这样做我的minus_testing_dashboard变量但没有一个工作

import numpy as np
import pandas as pd

raw_data = pd.read_csv('No License Key.csv', delimiter = ',', keep_default_na=False, low_memory=False)

selected_raw_data = raw_data[['App Config', 'App Name', 'App UUID', 'Machine ID', 'Estimated Company']].reset_index()

print(selected_raw_data.head(25))

minus_testing_dashboard = selected_raw_data.apply(lambda row: row.astype(str).str.contains('testing-dashboard').any(), axis=1).reset_index()

unique_desktops = minus_testing_dashboard['Machine ID'].nunique()
print(unique_desktops)

共有1个答案

边浩波
2023-03-14

IIUCstr.contains后加入您的关键字按位或字符串。

df = pd.DataFrame({'A' : ['dev_testing_123_456',
                         'just a test',
                         'testing-dashboard',
                         'keep me',
                         'and me']})

pat = '|'.join(['testing-dashboard','dev'])
#'testing-dashboard|dev'

print(df[~df['A'].str.contains(pat)])

             A
1  just a test
3      keep me
4       and me
 类似资料:
  • 问题内容: 这个问题已经在这里有了答案 : 在熊猫中的DataFrame上搜索“不包含” (6个答案) 去年关闭。 我在python中有一个非常大的数据框,我想在特定列中删除所有具有特定字符串的行。 例如,我想在数据框的列C中删除所有具有字符串“ XYZ”作为子字符串的行。 可以使用.drop()方法以一种有效的方式来实现吗? 问题答案: pandas具有向量化的字符串操作,因此您可以过滤掉包含不

  • 我有以下格式的CSV数据: 列属于数据类型。我想做的是删除所有具有非数字位置标签的行。因此,根据上表,我的期望输出为: 现在,我可以用以下方式硬编码解决方案: 这是受以下帖子的启发: 如何从特定列中包含特定字符串的数据框中删除行? 然而,我所寻找的是一个通用的解决方案,它将适用于上述任何类型的表。

  • 如何消除罗恩说了一句我不想说的话?我有这个数据框: 我正试图删除带有“esponja”字样的rown 我想要这样的数据帧: 我是新手,我不知道如何解决这个问题

  • 问题内容: 有没有一种简短的方法可以删除包含数字的列表中的所有字符串? 例如 会回来 问题答案: 没有正则表达式:

  • 问题内容: 我正在制作一个基于Java中字符串处理的程序,其中需要从字符串数组中删除重复的字符串。在此程序中,所有字符串的大小均相同。 “数组”是一个字符串数组,其中包含许多字符串,其中两个字符串彼此相似。因此,使用下面的代码,必须删除重复的字符串,但是不能删除。 如何删除重复的字符串? 我正在使用以下代码。 问题答案: 这会工作 或者只使用a 而不是数组。

  • 我正在用Java制作一个基于字符串处理的程序,在这个程序中,我需要从字符串数组中删除重复的字符串。在这个程序中,所有字符串的大小都是相同的。 “数组”是一个字符串数组,包含许多字符串,其中两个字符串彼此相似。因此,使用下面的代码必须删除重复的字符串,但不会删除。 如何删除重复字符串? 我正在使用以下代码。