当前位置：首页 > 编程笔记 >

如何在R中的字符串向量中找到相似的词？

曾弘扬

2023-03-14

本文向大家介绍如何在R中的字符串向量中找到相似的词？，包括了如何在R中的字符串向量中找到相似的词？的使用技巧和注意事项，需要的朋友参考一下

有时字符串向量中的字符串有拼写错误，我们希望提取相似的单词以避免这种拼写错误，因为相似的单词可能表示单词的正确和不正确形式。这可以通过使用 agrep 和 lapply 函数来实现。

在线示例1

x1<-c("India","United Kingdoms","Indiaa","Egyypt","United
Kingdom","Turkey","Egypt","Belaarus","Belarus")
lapply(x1,agrep,x1,value=TRUE)

输出结果

[[1]]
[1] "India" "Indiaa"
[[2]]
[1] "United Kingdoms" "United Kingdom"
[[3]]
[1] "India" "Indiaa"
[[4]]
[1] "Egyypt" "Egypt"
[[5]]
[1] "United Kingdoms" "United Kingdom"
[[6]]
[1] "Turkey"
[[7]]
[1] "Egyypt" "Egypt"
[[8]]
[1] "Belaarus" "Belarus"
[[9]]
[1] "Belaarus" "Belarus"

在线示例2

x2<-c("Alhadi","Umair","Omar","Alhadi","Shanti","Shant","Umaer","Peter","Rahul","Pattrick","P
eeter","Rahuls")
lapply(x2,agrep,x2,value=TRUE)

输出结果

[[1]]
[1] "Al-hadi" "Alhadi"
[[2]]
[1] "Umair" "Umaer"
[[3]]
[1] "Omar"
[[4]]
[1] "Al-hadi" "Alhadi"
[[5]]
[1] "Shanti" "Shant"
[[6]]
[1] "Shanti" "Shant"
[[7]]
[1] "Umair" "Umaer"
[[8]]
[1] "Peter" "Peeter"
[[9]]
[1] "Rahul" "Rahuls"
[[10]]
[1] "Pattrick"
[[11]]
[1] "Peter" "Peeter"
[[12]]
[1] "Rahul" "Rahuls"

在线示例3

x3<-c("Alabamaa","New Yorky","New
Yok","Alabma","Florida","Illinois","Texas","Illinoise")
lapply(x3,agrep,x3,value=TRUE)

输出结果

[[1]]
[1] "Alabamaa"
[[2]]
[1] "New Yorky"
[[3]]
[1] "New Yorky" "New Yok"
[[4]]
[1] "Alabamaa" "Alabma"
[[5]]
[1] "Florida"
[[6]]
[1] "Illinois" "Illinoise"
[[7]]
[1] "Texas"
[[8]]
[1] "Illinois" "Illinoise"

类似资料：

如何在R中找到字符串的长度

如何找到字符串的长度（字符串中的字符数），而不在R中拆分它？我知道如何计算列表的长度，但不知道字符串的长度。 Unicode字符串呢？如何查找Unicode字符串中的长度（以字节为单位）和字符数（符文、符号）？相关问题：如何在R中查找Unicode字符串中的“真实”字符数
C ++中的相似字符串组

本文向大家介绍C ++中的相似字符串组，包括了C ++中的相似字符串组的使用技巧和注意事项，需要的朋友参考一下假设我们有两个字符串X和Y，如果可以交换X的两个字母，它们是相似的，因此等于Y。另外，如果两个字符串X和Y相等，则它们相似。例如，考虑两个字符串，例如“ tars”和“ rats”相似，如果我们交换t和r，则可以找到另一个，现在“ rats”和“ arts”相似，但是“ star”不同类
C ++中的K相似字符串

本文向大家介绍C ++中的K相似字符串，包括了C ++中的K相似字符串的使用技巧和注意事项，需要的朋友参考一下假设我们有两个字符串A和B。如果我们可以将A中的两个字母的位置恰好交换K次，使得结果字符串为B，那么这两个字符串是K相似的（其中K是一个非负整数）。在两个字谜A和B之间，我们必须找到与A和B类似的最小K。因此，如果输入类似于A =“ abc”，B =“ bac”，则输出将为2。为了解
如何在Java中比较几乎相似的字符串？（字符串距离量度）[关闭]

问题内容：我想比较两个字符串并得到一些分数，它们看起来有多相似。例如 “句子几乎相似” 和 “句子相似” 。我不熟悉Java中的现有方法，但是对于PHP我知道levenshtein函数。 Java中有更好的方法吗？问题答案： Levensthein距离是衡量相似弦长的量度。或者，更确切地说，必须进行几次更改才能使它们相同。该算法在Wikipedia上可用伪代码提供。将其转换为Jav
如何从R中预先存在的字符向量创建修改后的字符向量？

我对R很陌生，我知道这是一个非常简单的问题，但我似乎无法理解。我得到了字符矢量more.colors：我必须用更多的。为向量、rep（）和seq（）添加颜色以创建向量：到目前为止，我只有不使用rep（）或seq（）。任何帮助都将不胜感激！
Java中的相似字符串比较

问题内容：我想将多个字符串相互比较，并找到最相似的字符串。我想知道是否有任何库，方法或最佳实践会返回我哪些字符串与其他字符串更相似的字符串。例如： “The quick fox jumped” -> “The fox jumped” “The quick fox jumped” -> “The fox” 该比较将返回第一个比第二个更相似。我想我需要一些方法，例如：某处有这样的东西吗？编辑：

相关阅读

如何找到R向量中所有值的幂的提升？如何在字符串中找到空格？如何在字符串中查找子字符串（或如何grep变量）？如何在python列表中找到最相似的单词 Python-查找两个字符串之间的相似性度量

相关文章

JavaScript算法-字符串相乘 Java去除字符串中的空格 C语言标准库中的字符串 JavaScript算法-反转字符串中的单词 III 面试题记录 -- 反转字符串中的单词；

相关问答

如何在字符矩阵中找到字符串路径？在R中检测字符串中的一个字如何从结构向量中过滤出字符串向量如何从给定的字符串值中找到java数组中字符串的索引 Java比较字符串中的字符并计算相似之处

相关工具

类似Twitter的登录框 R-OSGi (R)?ex Tinn-R ACT-R

相关文档

格式化字符串漏洞利用 R 统计分析语言中文教程精益研发 2.0：面向中国制造 2025 的工业研发与 TensorFlow 的初次相遇我们如何走到今天：重塑世界的6项创新