如何提取Linux(csh)中特定单词之后的单词?更确切地说,我有一个文件,其中只有一行看起来像这样:
_[some useless data]_ --pe_cnt **100** --rd_cnt 1000 _[some more data]_
我想提取单词 100
后面的数字--pe_cnt
。我不能使用sed,因为仅当您要提取整行时才可以使用sed。也许我可以使用awk?
另外,我有多个具有不同值的文件,100
所以我需要一些提取值但不依赖于值的文件。
与awk
:
awk '{for(i=1;i<=NF;i++) if ($i=="--pe_cnt") print $(i+1)}' inputFile
基本上循环遍历该行的每个单词。当您找到要查找的第一个单词时,抓住下一个单词并打印出来。
与grep
:
grep -oP "(?<=--pe_cnt )[^ ]+" inputFile
在我的数据框架中,有一列名为“teams”。它包括城市和球队名称。我想把这个城市拉进另一个纵队。这是数据帧:数据帧示例 我可以使用正则表达式轻松提取列: 然而,在“名称”栏中,对于纽约尼克斯队,它只给了我“New”的值,我想得到“New York”: 结果 那么,我该怎么做呢?如果单元格有2个单词,我该如何从开头只提取一个单词?如果单元格有3个单词,我该如何使用正则表达式从中提取2个单词?
问题内容: 我有大量的实际文本,需要将单词拉出来以输入到拼写检查器中。我想尽可能多 地 提取 有意义的 单词,而不会产生太大干扰。我知道这附近有很多正则表达式忍者,所以希望有人可以帮助我。 目前,我正在使用提取所有字母序列。这是一个很好的近似值,但是它却拖走了很多垃圾。 理想情况下, 我想要一些正则表达式(不一定漂亮或高效),该正则表达式提取由自然词分隔符(例如,等等)定界的所有字母序列,并忽略任
问题内容: 在Swift中提取字符串中最后一个单词的方式是什么?因此,如果我有“ Lorem ipsum dolor坐在amet”,请返回“ amet”。最有效的方法是什么? 问题答案: 您可以使用String方法enumerateSubstringsInRange。第一个参数只是传递您的字符串和选项。只需将每个子字符串附加到结果集合中并返回即可。 Swift 5或更高版本 (对于较早的Swift
我想读一个文本文件,打印出已知单词前面的单词,比如Java中的xxx。我使用Scanner类用java编写了这段代码。但是这段代码只打印了“xxx”前面的一半单词,而“xxx”前面的一些单词则丢失了。我想知道是什么问题,你能解决这个代码吗。 测试文件包含类似的内容
我想从中得到一个子字符串。 我想要的子字符串是一个数字字符序列。 输入 通常可以是任何字符串,但它们都有一个共同点: 有一个部分以KD-开头 并以数字结尾 数字之后的所有内容都将消失。 在上面的示例中,这个数字将分别为、、。但它可以是任何数字 现在我有一个子字符串,它包含KD之后的所有数字字符--但我希望只有字符串的0815ish部分。 我目前所拥有的 结果是,但我只想要(它可以是任何长度,但不可
问题内容: 我想使用Java提取某些两个单词之间的子字符串。 例如: 我想提取“ ”和“ ” 之间的所有内容。 到目前为止,我所做的是: 效果很好。 但是我想做另外两件事 如果句子是: 我想提取到第一个“ ”即 有时我想将模式之间的单词数限制为3个单词,即 有什么想法吗? 问题答案: 对于第一个问题,请使其变得懒惰。您可以在问号后面加上一个问号,然后该问号将尽可能少地匹配。 我不知道最后的额外内容