当前位置: 首页 > 知识库问答 >
问题:

Grep regex在排除关键字列表时查找重复字

魏成济
2023-03-14

我有很多数据在一个目录,我想找到任何实例的双字不是数字。我从这里开始:

\b(\w+) \1\b

并将其扩展到包括我不希望在结果中出现的内容:

(?!(?:one|two|three|four|five|six|seven|eight|nine|oh|zero))\b(\w+) \1\b
 grep -Proh "\b(\w+) \1\b" | grep -Prohv "?(?:one|two|three|four|five|six|seven|eight|nine|oh|zero)"

要忽略的样本数据:
比重1点零零七

共有1个答案

万浩淼
2023-03-14

只要-p-op就足够了。

$ grep -P '(?!(?:one|two|three|four|five|six|seven|eight|nine|oh|zero))\b(\w+) \1\b' file
today to evaluate for possibilities. doubt that that is occurring
$ grep -oP '(?!(?:one|two|three|four|five|six|seven|eight|nine|oh|zero))\b(\w+) \1\b' file
that that
 类似资料:
  • 问题内容: 我有一个人员,我想查找重复的条目,以约束除以外的所有字段。因此,请使用-method(并因此使用),因为它们已考虑在内。 修改和方法以忽略该字段不是一种选择,因为代码的其他部分依赖于此。 如果我想忽略该字段,Java中最有效的方法是对重复项进行分类? 问题答案: 构建一个以实现您的自然键排序,然后使用基于二进制搜索的重复数据删除。即可为您提供这种能力。 请注意,必须满足通常的反对称性,

  • 问题内容: 我希望能够在表的所有列中动态查找特定的关键字。该脚本的目的是仅需更改关键字和表名,而无需知道表的所有列是什么。 这意味着以下代码不是令人满意的解决方案: […]输入“关键字”(字段1,字段2,字段3,字段4,…)[…] 我能够使用子查询动态检索表的所有列名。但是然后,该子查询中的IN语句返回空结果。 然后,我创建了一个新的子查询,该子查询以逗号分隔的列表格式返回列的列表。但是结果也是空

  • 我有一个表,有以下列 我想要一个查询(下面查询的修改版本),如果上面的表中给定的work_date和员工ID(GROUP BYEMP_ID和WORK_DATE)超过1行,它将返回一行。所以我写了如下查询: 例如: 如果我通过1/1/2013 for:p_WorkDate,查询应返回如下: 基本上,我试图找出EMP\u ID和WORK\u DATE是否有超过1行,但还有一个额外的要求,即元素列包含什

  • 问题内容: 我正在编写一个程序,该程序会对python进行一些代码生成,并且如果它是python关键字,则需要以不同的方式对待字符串。打印python关键字和一些其他内容,但是我想知道是否存在一种pythonic的方法来获取包含这些字符串的实际可迭代对象? 问题答案: 您最好使用关键字模块

  • 问题内容: 有一个字典列表,我想删除具有相同键和值对的字典。 对于此列表: 我想退掉这个: 另一个例子: 对于此列表: 我想退掉这个: 问题答案: 尝试这个: 该策略是将字典列表转换为元组列表,其中元组包含字典项。由于可以对元组进行散列,因此你可以使用删除重复项set(在这里使用,这将是更老的python替代品,然后,使用来从元组中重新创建字典dict。 哪里: l 是原始清单 d 是列表中的词典