有没有一种方法可以使用WordNet或使用Python的NLTK查找英语单词的使用频率?注意:我不想要给定输入文件中某个单词的频率计数。我想根据今天的使用情况大致了解某个词的出现频率。 最佳答案 在WordNet中,每个Lemma都有一个由方法返回的频率计数lemma.count(),存储在文件nltk_data/corpora/wordnet/cntlist.rev中。代码示例:fromnltk.corpusimportwordnetsyns=wordnet.synsets('stack')forsinsyns:forlins.l
前段时间SO上有人问howtoretrievealistofwordsforagivensynset使用NLTK的wordnet包装器。以下是建议的回复之一:forsynsetinwn.synsets('dog'):printsynset.lemmas[0].name使用NLTK3.0运行此代码会产生TypeError:'instancemethod'objectisnotsubscriptable。我尝试了之前提出的每个解决方案(上面链接页面上描述的每个解决方案),但每个都会引发错误。因此我想问:是否可以使用NLTK3.0打印同义词集列表中的单词?如果其他人可以就此问题提供任何建议,
前段时间SO上有人问howtoretrievealistofwordsforagivensynset使用NLTK的wordnet包装器。以下是建议的回复之一:forsynsetinwn.synsets('dog'):printsynset.lemmas[0].name使用NLTK3.0运行此代码会产生TypeError:'instancemethod'objectisnotsubscriptable。我尝试了之前提出的每个解决方案(上面链接页面上描述的每个解决方案),但每个都会引发错误。因此我想问:是否可以使用NLTK3.0打印同义词集列表中的单词?如果其他人可以就此问题提供任何建议,
我想对一组关键字(主要是人们可能有兴趣谈论的爱好、最新消息等)实现基于python的语义搜索。我想知道是否存在相同的本体数据库和相同的开源搜索算法/实现。例如。我的设置={说话、喝酒、发推文、卡特里娜麻醉剂、卡特里娜飓风、收集岩石、收集硬币}因此,在搜索“accumulate”时,我可能会得到rockcollection和coincollecting作为输出。编辑:术语可以有多个词。即“President.BarackObamaofUnitedStates”是一个有效的查询。 最佳答案 您可能想使用“随机索引”。它可以完全满足您的需
我想对一组关键字(主要是人们可能有兴趣谈论的爱好、最新消息等)实现基于python的语义搜索。我想知道是否存在相同的本体数据库和相同的开源搜索算法/实现。例如。我的设置={说话、喝酒、发推文、卡特里娜麻醉剂、卡特里娜飓风、收集岩石、收集硬币}因此,在搜索“accumulate”时,我可能会得到rockcollection和coincollecting作为输出。编辑:术语可以有多个词。即“President.BarackObamaofUnitedStates”是一个有效的查询。 最佳答案 您可能想使用“随机索引”。它可以完全满足您的需
我正在尝试启动并运行一个简单的同义词数据库,以便我可以找到用户输入的单词的同义词(没有别的!)。为此,我获取了Wordnetsql词库(http://wnsql.sourceforge.net/)的副本,但现在我看到了所有这些表格,但我无法在任何地方找到对其内容的任何简单解释:adjpositionsadjpositiontypescasedwordslexdomainslexlinkslinktypesmorphmapsmorphspostypessamplessemlinkssensessynsetsvframemapsvframesvframesentencemapsvframe
我正在尝试启动并运行一个简单的同义词数据库,以便我可以找到用户输入的单词的同义词(没有别的!)。为此,我获取了Wordnetsql词库(http://wnsql.sourceforge.net/)的副本,但现在我看到了所有这些表格,但我无法在任何地方找到对其内容的任何简单解释:adjpositionsadjpositiontypescasedwordslexdomainslexlinkslinktypesmorphmapsmorphspostypessamplessemlinkssensessynsetsvframemapsvframesvframesentencemapsvframe
我正在尝试让NLTK和wordnet在Heroku上运行。我已经完成了herokurunpythonnltk.download()wordnetpipinstall-rrequirements.txt但我收到此错误:Resource'corpora/wordnet'notfound.PleaseusetheNLTKDownloadertoobtaintheresource:>>>nltk.download()Searchedin:-'/app/nltk_data'-'/usr/share/nltk_data'-'/usr/local/share/nltk_data'-'/usr/lib
我正在尝试让NLTK和wordnet在Heroku上运行。我已经完成了herokurunpythonnltk.download()wordnetpipinstall-rrequirements.txt但我收到此错误:Resource'corpora/wordnet'notfound.PleaseusetheNLTKDownloadertoobtaintheresource:>>>nltk.download()Searchedin:-'/app/nltk_data'-'/usr/share/nltk_data'-'/usr/local/share/nltk_data'-'/usr/lib
WordNet很棒,但我很难在nltk中找到同义词。如果您搜索类似于here之类的“小”一词,它显示了所有的同义词。基本上我只需要知道以下内容:wn.synsets('word')[i].option()其中option可以是上位词也可以是反义词,但是获取同义词的选项是什么? 最佳答案 如果您想要同义词集中的同义词(也就是构成该集合的引理),您可以使用lemma_names()获得它们:>>>forssinwn.synsets('small'):>>>print(ss.name(),ss.lemma_names())small.n.