我现在有一个wordnet中所有名词的列表,我只想保留车辆中的单词,其余的删除。我该怎么做?下面是我要制作的伪代码,但我不知道如何使它工作
for word in wordlist:
if not "vehicle" in wn.synsets(word):
wordlist.remove(word)
from nltk.corpus import wordnet as wn
vehicle = wn.synset('vehicle.n.01')
typesOfVehicles = list(set([w for s in vehicle.closure(lambda s:s.hyponyms()) for w in s.lemma_names()]))
这会给你从每一个同义词集这是一个所有独特的词下义词的名词“车辆”(第一感觉)的。
问题内容: WordNet很棒,但是我很难在nltk中获得同义词。如果您在此处类似地搜索“ small”一词,则会显示所有同义词。 基本上,我只需要了解以下内容: 哪里的选项可以是化名和反义词,但是获取同义词的选择是什么? 问题答案: 如果您想要同义词集中的同义词(又称组成集合的引理),则可以使用以下命令获取它们:
我想为我的搜索引擎从数据库中提取一个基本的同义词列表。这包括通常拼写的名字,如Shaun vs.Shawn,Muhammad的不同变体,命名实体的首字母缩写,如United Nations(UN)或SARS(Severe acute respiratory syndrome)。 在提取之后,这个同义词列表将被放置在服务器中,并以这样的方式存储--相关术语/同义词的字符串。 示例 我使用了jaws
问题内容: 我将NLTK WordNet Lemmatizer用于词性标记项目,方法是首先将训练语料库中的每个单词修改为其词干(就地修改),然后仅对新语料库进行训练。但是,我发现lemmatizer不能正常运行。 例如,单词被复词化为正确的单词,但是即使在复词之后该词仍然保留。这就像句子“我爱它”。 难道不是单词的词干吗?类似地,在残词化之后,许多其他“ ing”形式仍然保留。这是正确的行为吗?
问题内容: 如果我有 在我的HTML页面上,如何得知鼠标光标位于“文本”一词上方? 问题答案: 除了另外两个答案外,您还可以使用jQuery(或通常是javascript)将您的段落分成多个部分。 这样,您就无需考虑使用跨度较大的单词来输出文本。让您的JavaScript为您完成。 例如 请注意,上述代码虽然有效,但会删除段落标记内的所有html。 jsFiddle示例
问题内容: 根据这个(使用JavaScript在光标下找到一个单词d-under-cursor-using- javascript))链接我可以在鼠标[指针下得到一个单词。英语很好。我将其更改(对于阿拉伯语言) 但每个单词返回“ $ 1”。请帮忙! 问题答案: 您 需要 出现在原始正则表达式中的括号。在正则表达式中,括号形成一个“匹配组”,该替换组将替换字符串中的“ ”。 正则表达式中没有任何匹配
我的文件:syn.txt 一切都很好,除了同义词: 我做了一些研究,我发现了以下几点: 所以我试图改变我的配置文件,并在索引中添加过滤器,但它不起作用。 什么东西有什么想法吗?