jjzjj

python - 如何使用 WordNet 查找英语单词的频率计数?

有没有一种方法可以使用WordNet或使用Python的NLTK查找英语单词的使用频率?注意:我不想要给定输入文件中某个单词的频率计数。我想根据今天的使用情况大致了解某个词的出现频率。 最佳答案 在WordNet中,每个Lemma都有一个由方法返回的频率计数lemma.count(),存储在文件nltk_data/corpora/wordnet/cntlist.rev中。代码示例:fromnltk.corpusimportwordnetsyns=wordnet.synsets('stack')forsinsyns:forlins.l

python - 在 NLTK 3.0 中使用 Wordnet 从 Synset 中提取单词

前段时间SO上有人问howtoretrievealistofwordsforagivensynset使用NLTK的wordnet包装器。以下是建议的回复之一:forsynsetinwn.synsets('dog'):printsynset.lemmas[0].name使用NLTK3.0运行此代码会产生TypeError:'instancemethod'objectisnotsubscriptable。我尝试了之前提出的每个解决方案(上面链接页面上描述的每个解决方案),但每个都会引发错误。因此我想问:是否可以使用NLTK3.0打印同义词集列表中的单词?如果其他人可以就此问题提供任何建议,

python - 在 NLTK 3.0 中使用 Wordnet 从 Synset 中提取单词

前段时间SO上有人问howtoretrievealistofwordsforagivensynset使用NLTK的wordnet包装器。以下是建议的回复之一:forsynsetinwn.synsets('dog'):printsynset.lemmas[0].name使用NLTK3.0运行此代码会产生TypeError:'instancemethod'objectisnotsubscriptable。我尝试了之前提出的每个解决方案(上面链接页面上描述的每个解决方案),但每个都会引发错误。因此我想问:是否可以使用NLTK3.0打印同义词集列表中的单词?如果其他人可以就此问题提供任何建议,

python - Python 中的语义搜索爱好 + 最新消息

我想对一组关键字(主要是人们可能有兴趣谈论的爱好、最新消息等)实现基于python的语义搜索。我想知道是否存在相同的本体数据库和相同的开源搜索算法/实现。例如。我的设置={说话、喝酒、发推文、卡特里娜麻醉剂、卡特里娜飓风、收集岩石、收集硬币}因此,在搜索“accumulate”时,我可能会得到rockcollection和coincollecting作为输出。编辑:术语可以有多个词。即“President.BarackObamaofUnitedStates”是一个有效的查询。 最佳答案 您可能想使用“随机索引”。它可以完全满足您的需

python - Python 中的语义搜索爱好 + 最新消息

我想对一组关键字(主要是人们可能有兴趣谈论的爱好、最新消息等)实现基于python的语义搜索。我想知道是否存在相同的本体数据库和相同的开源搜索算法/实现。例如。我的设置={说话、喝酒、发推文、卡特里娜麻醉剂、卡特里娜飓风、收集岩石、收集硬币}因此,在搜索“accumulate”时,我可能会得到rockcollection和coincollecting作为输出。编辑:术语可以有多个词。即“President.BarackObamaofUnitedStates”是一个有效的查询。 最佳答案 您可能想使用“随机索引”。它可以完全满足您的需

mysql - Wordnet SQL 说明

我正在尝试启动并运行一个简单的同义词数据库,以便我可以找到用户输入的单词的同义词(没有别的!)。为此,我获取了Wordnetsql词库(http://wnsql.sourceforge.net/)的副本,但现在我看到了所有这些表格,但我无法在任何地方找到对其内容的任何简单解释:adjpositionsadjpositiontypescasedwordslexdomainslexlinkslinktypesmorphmapsmorphspostypessamplessemlinkssensessynsetsvframemapsvframesvframesentencemapsvframe

mysql - Wordnet SQL 说明

我正在尝试启动并运行一个简单的同义词数据库,以便我可以找到用户输入的单词的同义词(没有别的!)。为此,我获取了Wordnetsql词库(http://wnsql.sourceforge.net/)的副本,但现在我看到了所有这些表格,但我无法在任何地方找到对其内容的任何简单解释:adjpositionsadjpositiontypescasedwordslexdomainslexlinkslinktypesmorphmapsmorphspostypessamplessemlinkssensessynsetsvframemapsvframesvframesentencemapsvframe

python - 在 Heroku 上找不到资源 'corpora/wordnet'

我正在尝试让NLTK和wordnet在Heroku上运行。我已经完成了herokurunpythonnltk.download()wordnetpipinstall-rrequirements.txt但我收到此错误:Resource'corpora/wordnet'notfound.PleaseusetheNLTKDownloadertoobtaintheresource:>>>nltk.download()Searchedin:-'/app/nltk_data'-'/usr/share/nltk_data'-'/usr/local/share/nltk_data'-'/usr/lib

python - 在 Heroku 上找不到资源 'corpora/wordnet'

我正在尝试让NLTK和wordnet在Heroku上运行。我已经完成了herokurunpythonnltk.download()wordnetpipinstall-rrequirements.txt但我收到此错误:Resource'corpora/wordnet'notfound.PleaseusetheNLTKDownloadertoobtaintheresource:>>>nltk.download()Searchedin:-'/app/nltk_data'-'/usr/share/nltk_data'-'/usr/local/share/nltk_data'-'/usr/lib

python - 如何从 nltk WordNet Python 中获取同义词

WordNet很棒,但我很难在nltk中找到同义词。如果您搜索类似于here之类的“小”一词,它显示了所有的同义词。基本上我只需要知道以下内容:wn.synsets('word')[i].option()其中option可以是上位词也可以是反义词,但是获取同义词的选项是什么? 最佳答案 如果您想要同义词集中的同义词(也就是构成该集合的引理),您可以使用lemma_names()获得它们:>>>forssinwn.synsets('small'):>>>print(ss.name(),ss.lemma_names())small.n.