jjzjj

python - wordnet路径相似度是可交换的吗?

我正在使用nltk的wordnetAPI。当我将一个同义词集与另一个同义词集进行比较时,我得到了None,但是当我以相反的方式比较它们时,我得到了一个浮点值。他们不应该给出相同的值吗?有没有解释或者这是wordnet的错误?例子:wn.synset('car.n.01').path_similarity(wn.synset('automobile.v.01'))#Nonewn.synset('automobile.v.01').path_similarity(wn.synset('car.n.01'))#0.06666666666666667 最佳答案

python - NLTK WordNet Lemmatizer : Shouldn't it lemmatize all inflections of a word?

我将NLTKWordNetLemmatizer用于词性标记项目,首先将训练语料库中的每个单词修改为其词干(就地修改),然后仅在新语料库上进行训练。但是,我发现lemmatizer没有像我预期的那样运行。例如,单词loves被词形还原为love这是正确的,但单词loving仍然是loving即使在词形还原之后。这里的loving就像句子“我爱它”一样。love不是变形词loving的词干吗?类似地,许多其他“ing”形式在词形还原后保持不变。这是正确的行为吗?还有哪些其他准确的词形还原器?(不需要在NLTK中)在决定词干时是否有形态分析器或词形还原器也考虑到词的词性标签?例如,如果kil

python - python中的wordnet词形还原和pos标记

我想在python中使用wordnetlemmatizer,我了解到默认的pos标记是NOUN,并且它不会为动词输出正确的lemma,除非pos标记明确指定为VERB。我的问题是,为了准确地执行上述词形还原,最好的方法是什么?我使用nltk.pos_tag进行了pos标记,但在将树库pos标签与wordnet兼容的pos标签集成时我迷失了。请帮忙fromnltk.stem.wordnetimportWordNetLemmatizerlmtzr=WordNetLemmatizer()tagged=nltk.pos_tag(tokens)我得到了NN,JJ,VB,RB中的输出标签。如何将这