当前位置: 首页 > 知识库问答 >
问题:

什么字符串距离算法最适合测量打字精度?

华宣
2023-03-14

我试图写一个函数,检测用户键入特定短语/句子/单词/单词的准确性。我的目标是建立一个应用程序,以训练用户的打字准确性的某些短语。

Jaro-Winkler和Levenshtein距离的差异?

在阅读了所有这些之后,除了各自的维基百科帖子之外,我仍然有点不知道哪种算法最适合我的目标。

共有1个答案

洪高扬
2023-03-14

既然你要对打字的质量进行评分,并且你想训练学生零错误,你应该使用Levenshtein距离,因为它不那么容易原谅。

此外,Levenshtein的分数比Jaro-Winkler的结果更容易直观地理解,也更容易用图形表示。您可以修改Levenshtein算法,以分别报告插入、删除和错误类型,并向最终用户显示更正列表。另一方面,Jaro-Winkler给出了一个很难显示给最终用户的分数,因为中间拼写错误的点球比最后的点球要低。

 类似资料:
  • 我使用Levenshtein算法来查找两个字符串之间的相似性。这是我正在制作的程序的一个非常重要的部分,所以它需要有效。问题是算法没有发现以下示例相似: CONAIR AIRCON 编辑:我还研究了“Damerau-Levenshtein”算法,它增加了换位。问题是这种转换只针对相邻的字符(而不是多个字符)。

  • 问题内容: 在Python + Sqlite中是否有可用的字符串相似性度量,例如与模块有关? 用例示例: 此查询应匹配ID为1的行,但不匹配ID为2的行: 如何在Sqlite + Python中做到这一点? 关于我到目前为止发现的注释: 该Levenshtein距离,即单字符编辑(插入,删除或替换)的最小数量需要改变一个字到另一个,可能是有用的,但我不知道是否SQLite中存在的正式实施(我看到一

  •        LSV可以量算出两个或多个点之间的地表距离、空间距离和投影距离。 测量地表距离        地标距离为两点间在通过地表上相连的长度,其数值与地形有关。在“分析”菜单栏中点击“距离测量”,选择测量地表距离,在地表上连续点击,测量地表距离。图上会显示各分段的长度和地表总长。 测量空间距离        空间距离为两点间不计地形而直接相连的限度长度。在“分析”菜单栏中点击“距离测量”,选

  •        LSV可以量算出两个或多个点之间的地表距离、空间距离和投影距离。 测量地表距离        地标距离为两点间在通过地表上相连的长度,其数值与地形有关。在“分析”菜单栏中点击“距离测量”,选择测量地表距离,在地表上连续点击,测量地表距离。图上会显示各分段的长度和地表总长。 测量空间距离        空间距离为两点间不计地形而直接相连的限度长度。在“分析”菜单栏中点击“距离测量”,选

  • 问题内容: 我想比较两个字符串并得到一些分数,它们看起来有多相似。例如 “句子几乎相似” 和 “句子相似” 。 我不熟悉Java中的现有方法,但是对于PHP我知道levenshtein函数。 Java中有更好的方法吗? 问题答案: Levensthein距离 是 衡量相似弦 长 的量度。或者,更确切地说,必须进行几次更改才能使它们相同。 该算法在Wikipedia上可用伪代码提供。将其转换为Jav

  • 我被一些有趣的任务困住了。我有3个字符串(hello,heavy&word)。需要计算每一个世界的总和并打印最大的世界和总和。用于计算-a=1,z=26。所以hello=50,heavy=61&word=60。最大的字符串是“Heavy”,我需要像“Heavy,61”那样打印出来。我找到了从一个字符串计算字符的代码: