当前位置：首页 > 面试题库 >

在同一行的特定单词之后提取一个单词

顾池暝

2023-03-14

问题内容：

如何提取Linux（csh）中特定单词之后的单词？更确切地说，我有一个文件，其中只有一行看起来像这样：

_[some useless data]_ --pe_cnt **100** --rd_cnt 1000 _[some more data]_

我想提取单词 100 后面的数字--pe_cnt。我不能使用sed，因为仅当您要提取整行时才可以使用sed。也许我可以使用awk？

另外，我有多个具有不同值的文件，100所以我需要一些提取值但不依赖于值的文件。

问题答案：

与awk：

awk '{for(i=1;i<=NF;i++) if ($i=="--pe_cnt") print $(i+1)}' inputFile

基本上循环遍历该行的每个单词。当您找到要查找的第一个单词时，抓住下一个单词并打印出来。

与grep：

grep -oP "(?<=--pe_cnt )[^ ]+" inputFile

类似资料：

如果单元格有2个单词，则只提取第一个单词，如果单元格有3个单词，则提取2个第一个单词-PANDAS/REGEX

在我的数据框架中，有一列名为“teams”。它包括城市和球队名称。我想把这个城市拉进另一个纵队。这是数据帧：数据帧示例我可以使用正则表达式轻松提取列：然而，在“名称”栏中，对于纽约尼克斯队，它只给了我“New”的值，我想得到“New York”：结果那么，我该怎么做呢？如果单元格有2个单词，我该如何从开头只提取一个单词？如果单元格有3个单词，我该如何使用正则表达式从中提取2个单词？
提取整个单词

问题内容：我有大量的实际文本，需要将单词拉出来以输入到拼写检查器中。我想尽可能多地提取有意义的单词，而不会产生太大干扰。我知道这附近有很多正则表达式忍者，所以希望有人可以帮助我。目前，我正在使用提取所有字母序列。这是一个很好的近似值，但是它却拖走了很多垃圾。理想情况下，我想要一些正则表达式（不一定漂亮或高效），该正则表达式提取由自然词分隔符（例如，等等）定界的所有字母序列，并忽略任
使用Swift提取字符串中的最后一个单词

问题内容：在Swift中提取字符串中最后一个单词的方式是什么？因此，如果我有“ Lorem ipsum dolor坐在amet”，请返回“ amet”。最有效的方法是什么？问题答案：您可以使用String方法enumerateSubstringsInRange。第一个参数只是传递您的字符串和选项。只需将每个子字符串附加到结果集合中并返回即可。 Swift 5或更高版本（对于较早的Swift
使用java提取文本文件中特定单词旁边的单词

我想读一个文本文件，打印出已知单词前面的单词，比如Java中的xxx。我使用Scanner类用java编写了这段代码。但是这段代码只打印了“xxx”前面的一半单词，而“xxx”前面的一些单词则丢失了。我想知道是什么问题，你能解决这个代码吗。测试文件包含类似的内容
从特定单词后面的字符串返回一个数字

我想从中得到一个子字符串。我想要的子字符串是一个数字字符序列。输入通常可以是任何字符串,但它们都有一个共同点：有一个部分以KD-开头并以数字结尾数字之后的所有内容都将消失。在上面的示例中，这个数字将分别为、、。但它可以是任何数字现在我有一个子字符串，它包含KD之后的所有数字字符--但我希望只有字符串的0815ish部分。我目前所拥有的结果是，但我只想要（它可以是任何长度，但不可
使用Java中的regex提取两个特定单词之间的子字符串

问题内容：我想使用Java提取某些两个单词之间的子字符串。例如：我想提取“ ”和“ ” 之间的所有内容。到目前为止，我所做的是：效果很好。但是我想做另外两件事如果句子是：我想提取到第一个“ ”即有时我想将模式之间的单词数限制为3个单词，即有什么想法吗？问题答案：对于第一个问题，请使其变得懒惰。您可以在问号后面加上一个问号，然后该问号将尽可能少地匹配。我不知道最后的额外内容

在同一行的特定单词之后提取一个单词

相关阅读

相关文章

相关问答

相关工具

相关文档