我想检查Python程序中英语词典中是否有单词。
我相信可能会采用nltk wordnet接口,但是我不知道如何将其用于如此简单的任务。
def is_english_word(word):
pass # how to I implement is_english_word?
is_english_word(token.lower())
将来,我可能想检查单词的单数形式是否在字典中(例如,属性->属性->英语单词)。我将如何实现?
要获得更大的功能和灵活性,请使用专用的拼写检查库,例如PyEnchant
。有一个教程,或者您可以直接学习:
>>> import enchant
>>> d = enchant.Dict("en_US")
>>> d.check("Hello")
True
>>> d.check("Helo")
False
>>> d.suggest("Helo")
['He lo', 'He-lo', 'Hello', 'Helot', 'Help', 'Halo', 'Hell', 'Held', 'Helm', 'Hero', "He'll"]
>>>
PyEnchant
带有一些词典(en_GB,en_US,de_DE,fr_FR),但是如果您需要更多语言,可以使用任何OpenOffice。
似乎有一个名为的多元化图书馆inflect
,但我不知道它是否有用。
所以我想检查我的列表中是否有一个词存在于消息中,所以我做了这样的操作: 但现在我还想检查我的列表中是否有一个词不存在,但如果我这样做了,它就不会工作。只是无视黑名单 为什么会这样?
问题内容: 我是编程和处理函数的新手,如果一个句子中存在一个单词,该函数将返回true。我尝试了该方法,但是后来我也遇到了这种方法的一个问题: 假设我的句子是 如果我们看一下这个词用的方法,那么它将返回因为存在而应该是正确的输出为不存在的词,但作为一种模式。 我该如何解决此问题?到目前为止,我正在使用的代码是: 注意: 这个词只是一个例子,显示了我目前的方法中的一个问题,并不是我必须一直工作,这个
例如 在laravel中,我可以用什么函数来解决这个问题?
问题内容: 我正在Java应用程序中处理一些英文文本,因此需要阻止它们。例如,从文本“ amenities / amenity”中,我需要获取“ amenit”。 该函数如下所示: 我已经找到了Lucene Analyzer,但是对于我所需要的来说,它看起来太复杂了。 http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/analysi
问题内容: 我正在寻找一种简单的方法来检查某个字符串是否是正确拼写的英语单词。例如,“ looked”将返回True,而“ hurrr”将返回False。我不需要拼写建议或任何拼写纠正功能。只是一个简单的函数,它需要一个字符串并返回一个布尔值。 问题答案: 两种可能的方法: 有自己的文件,其中包含所有有效的单词。将文件加载到集合中并比较每个单词以查看它是否存在(集合中的单词) (更好的方法)使用P
问题内容: 我正在使用python进行数据清理练习,正在清理的文本包含我要删除的意大利语单词。我一直在网上搜索是否可以使用nltk之类的工具包在Python上执行此操作。 例如给出一些文本: 我想留下: 有人知道如何做到这一点吗?任何帮助将非常感激。 问题答案: 您可以使用NLTK的语料库: 不幸的是, 艾奥 恰好是一个英语单词。通常,可能很难确定一个单词是否为英语。