当前位置: 首页 > 知识库问答 >
问题:

R 计算短语中以给定字母开头的单词数

景星华
2023-03-14

我想得到给定字符串中一个单词以给定字母开头的计数次数。

例如,在这个短语中:“这个模式很好,但猪喜欢牛奶”,如果我想找到以“g”开头的单词数,只有1个“很棒”,但现在我得到了2个“很棒”和“猪”。

这是我使用的代码:

x <- "that pattern is great but pogintless"
sapply(regmatches(x, gregexpr("g", x)), length)

共有2个答案

皇甫雨华
2023-03-14

也可以用stringr库来做

library(stringr)
str_count(str_split(x," "),"\\bg")
丌官玺
2023-03-14

我们需要一个空格或单词边界来避免字母匹配单词开头以外的字符。此外,使用< code>ignore.case = TRUE可能更好,因为有些单词可能以大写字母开头

lengths(regmatches(x, gregexpr("\\bg", x, ignore.case = TRUE)))

上面可以包装成一个函数

fLength <- function(str1, pat){
       lengths(regmatches(str1, gregexpr(paste0("\\b", pat), str1, ignore.case = TRUE)))
 }

fLength(x, "g")
#[1] 1
 类似资料:
  • 我被分配了一个任务,从数组列表中返回以特定字母开头的单词,但是我选择了字母c;我被告知我可以用另一种方式做到这一点,除了专门返回每个以字母开头的元素和许多println之外,我不知道除了使用ArrayList startswith方法之外,还有什么其他方法可以做到这一点,有人愿意启发我吗? }

  • 我在大学学习Java,我需要写一个静态int countCapitals(String s)方法,返回字符串s中有多少个单词以大写字母开头。 大写字母是UPPERCASE_LETTER类型或TITLECASE_LETTER类型的字符(Character)。单词是由一个或多个空格、字符、符号或标点符号分隔的字母或数字序列。 New.countCapitals("亲爱的朋友们,你们好!这里—以大写字母

  • 问题内容: 这是Hadoop字数统计Java映射并减少源代码: 在map函数中,我已经到了可以输出所有以字母“ c”开头的单词以及该单词出现的总次数的位置,但是我想做的就是输出总数以字母“ c”开头的单词,但我在获取总数上有些停留。任何帮助将不胜感激,谢谢。 例 我得到的输出: 可以2 罐3 猫5 我想要得到的是: 合计10 问题答案: 克里斯·格肯 的答案是正确的。 如果您要输出单词作为关键字,

  • 问题内容: 好的,我试图弄清楚如何在python中制作这样的输入短语。 输出这个… 这将是每个单词的首字母。这和索引有关吗?也许是.upper函数? 问题答案: 这是完成它的最快方法

  • 这是我的浏览方法。我正在尝试通过“dictionaryEntry”对象的哈希图进行搜索,只查看条目的“word”部分。(b.word)。这个想法是您可以搜索整个字典并返回所有以给定方法的字符串开头的单词。例如,您可以返回所有以字符串“sto”开头的单词。我的想法是遍历哈希图,如果单词的子字符串,从位置零开始并以输入字符串的长度结束,它将被添加到数组列表中。然后将返回数组列表。

  • 本文向大家介绍如何计算R中字符串中的单词数?,包括了如何计算R中字符串中的单词数?的使用技巧和注意事项,需要的朋友参考一下 句子中的单词数可以用于文本分析,因此,我们需要对它们进行计数。这可以是单个句子或多个句子。我们可以使用strsplit和sapply查找一个句子或多个句子中的单词数。 示例 请看以下句子作为向量-