当前位置: 首页 > 知识库问答 >
问题:

法语、俄语等外语的拼写更正

张勇
2023-03-14

我想用javascript/php实现法语、俄语等外语的拼写更正。对于英语拼写检查器,我可以使用编辑距离算法从英语词典中检索单词(词典是使用Trie构建的),并返回最频繁的单词。我还找到了关于这方面的文章,例如。http://stevehanov.ca/blog/index.php?id=114.我认为对于外语来说,同样的方法也是有用的。

我相信必须为不同的语言提供API,但我不想在我的应用程序中引入API的外部依赖性。有人可以建议我的方向,或链接到任何以前在这方面所做的工作。我读了PeterNorvig关于拼写检查器python实现的博客。但那是英语的。

共有1个答案

何峰
2023-03-14

Hunspell可能是世界上最著名的拼写检查工具:
http://hunspell.sourceforge.net/

Hunspill有多个版本,但Aspell是另一个选择:
http://aspell.net/

 类似资料:
  • 拼写检查 1选择 “编辑 ”>“拼写检查 ”。 2若要设置用于单词的查找和忽略的选项,请单击对话框底部的箭头图标,并根据需要设置选项。 3单击 “开始 ”,即可开始进行拼写检查。 4当 Illustrator 显示出拼写错误的单词或其他可能的错误时,请执行下列操作之一: 单击 “忽略 ”或 “全部忽略 ”继续拼写检查,而不更改特定的单词。 从建议单词列表中选择一个单词,或在顶部的框中键入正确的单词

  • 问题内容: 我有一个已编码为UTF-8的俄语字符串 当我在Eclipse控制台中打印字符串时,我得到有人可以建议如何将俄语字符串打印到控制台,或者我在这里做错了什么? 我尝试过使用它将其转换为字节,然后仍然是同样的问题:-( 问题答案: 试试这个: 或这个: 俄语的主要问题是正确设置UTF-8编码。

  • 我正在使用ApacheOpenNLP库。我正在做一个项目,需要用不同的语言执行几个NLP任务,其中俄语是一个非常重要的任务。然而,我不懂俄语,也找不到任何适用于俄语的OpenNLP模型。 因此,我可以可靠地执行句子检测的唯一方法是在俄语文本上训练句子检测器并生成一个我稍后将使用的模型。我必须分析的文本非常具体,并且不够笼统,无法创建有效的模型。 因此,我想问是否有人能为我提供一份俄语参考文本,分为

  • 火狐已经开始相信我的默认拼写检查语言应该是西班牙语。我的全球偏好选择了英文: 优惠─ 在逐页的基础上,我可以通过以下方式重置拼写检查语言: 右击- 但是,对于新打开的页面或新会话,默认拼写检查语言返回西班牙语。我在这里找到了一个变通方法:https://support.mozilla.org/en-US/questions/975459#answer-494574 这表明安装一个新的字典会改变默认

  • Emmet uses syntax similar to CSS selectors for describing elements’ positions inside generated tree and elements’ attributes. Emmet 使用类似于 CSS 选择器的语法来描述元素的结构与属性。 Elements 元素 You can use elements’ names

  • 拼写检查 选择“编辑”>“拼写检查”。 若要设置用于单词的查找和忽略的选项,请单击对话框底部的箭头图标,并根据需要设置选项。 单击“开始”,即可开始进行拼写检查。 当 Illustrator 显示出拼写错误的单词或其他可能的错误时,请执行下列操作之一: 单击“忽略”或“全部忽略”继续拼写检查,而不更改特定的单词。 从建议单词列表中选择一个单词,或在顶部的框中键入正确的单词,然后单击“更改”以只更改