关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭2年前。Improvethisquestion您好,我正在寻找一个可以从Javascript文本中删除停用词的库,我的最终目标是计算tf-idf,然后将给定文档转换为向量空间,以及所有这是Javascript。任何人都可以指出一个可以帮助我做到这一点的图书馆。只是一个删除停用词的图书馆也很棒。
我正在搜索可与Sphinx搜索一起使用的斯洛文尼亚语词干提取算法。例如,我想要实现的是在搜索“jabolka”时,我还想要包含“jabolko”、“jabolki”、“jabolk”等的文档的结果。我找到了一些关于斯洛文尼亚词干分析器存在的引用资料,但我找不到下载它的地方,它甚至没有在任何地方出售......我遇到的另一个选择是在Sphinx源配置(http://sphinxsearch.com/docs/manual-0.9.9.html#conf-wordforms)中使用选项wordforms,但是构建我自己的字典太困难了,所以我想知道是否有公开的可访问的词典已经可用了吗?如果斯
我正在使用apachelucene开发一个文本分析项目。我需要对一些文本进行词形还原(将单词转换为它们的规范形式)。我已经编写了生成词干的代码。使用它,我可以转换以下句子Thestemisthepartofthewordthatneverchangesevenwhenmorphologicallyinflected;alemmaisthebaseformoftheword.Forexample,from"produced",thelemmais"produce",butthestemis"produc-".Thisisbecausetherearewordssuchasproducti
我使用lucene雪球分析器来执行词干提取。结果是没有意义的话。我提到了这个question.其中一个解决方案是使用一个数据库,该数据库包含一个词干版本与一个稳定版本之间的映射。(从社区到社区的示例,无论社区的基础是什么(社区/或其他词))我想知道是否有一个数据库可以执行这样的功能。 最佳答案 理论上不可能从一个词干中恢复出一个特定的词,因为一个词干可能是许多词所共有的。根据您的应用程序,一种可能性是构建一个词干数据库,每个词干映射到一个包含多个单词的数组。但是您随后需要根据要重新转换的词干来预测这些词中的哪一个是合适的。作为这个问
我正在搜索Java库或其他东西来提取意大利语单词字符串。目标是比较意大利语单词。在这一刻,像“attacco”、“attacchi”、“attaccare”等词被认为是不同的,相反我想返回一个真实的比较。我找到了类似Lucene、snowball.tartarus.org等的东西。还有其他有用的东西吗?或者我如何在Java中使用它们?感谢您的回答。 最佳答案 下载Snowball对于Javahere.它包含一个名为org.tartarus.snowball.ext.italianStemmer的类,它扩展了SnowballStemm
我正在寻找阿拉伯语的Java词干分析器。我找到了一个名为“AraMorph”的库,但它的输出是无法控制的,并且它会形成不需要的单词。阿拉伯语还有其他词干分析器吗? 最佳答案 这是新的阿拉伯语词干分析器:Assem'sArabiclightstemmer使用Snowball框架编码并生成多种语言,包括Java。您可以通过下载适用于Java的libstemmer来使用它here. 关于java-我想要一个Java阿拉伯语词干分析器,我们在StackOverflow上找到一个类似的问题:
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。Java中是否有用于词干提取的库!?
我正在尝试使用MongoDB的全文搜索功能并观察到一些意外行为。该问题与文本索引功能的“词干提取”方面有关。全文搜索的方式在许多在线文章中都有描述,如果文档字段中的字符串“bighuntingdogs”是文本索引的一部分,那么您应该也可以搜索“hunt”或“hunting”如“狗”或“狗”。MongoDB应该在索引和搜索时规范化或阻止文本。所以在我的示例中,我希望它在索引中保存单词“dog”和“hunt”并搜索这些单词的词干版本。如果我搜索“狩猎”,MongoDB应该搜索“狩猎”。嗯,这不是我的工作方式。我在启用了全文搜索的Linux上运行MongoDB2.4.8。如果我的记录有值“b
我正在为我的站点构建一个小的搜索功能。我正在接受用户的查询,提取关键字,然后针对提取的关键字运行全文MySQL搜索。问题在于MySQL将词干视为文字。这是正在发生的过程:用户搜索“棒球”之类的词我的词干提取算法(PorterStemmer)将“baseballs”变成了“basebal”全文没有找到任何匹配“basebal”的内容,即使应该有“baseball”和“baseballs”的匹配项如何对全文执行LIKE'basebal%'的等效操作?编辑:这是我当前的查询:SELECTMATCH(`title`,`body`)AGAINST('basebal')AS`relevance`,
如http://www.mathworks.com/help/techdoc/ref/stem3.html中所述,使用stem3命令制作3d针状图非常容易。请问matplotlib中有没有类似的命令?我检查了最新版本的在线文档,但找不到。谁能给些建议? 最佳答案 我不知道在matplotlib中有任何与stem3直接等效的东西。然而,使用Line3D绘制这样的图形(至少是其基本形式)并不难。小号:importmatplotlib.pyplotaspltimportmpl_toolkits.mplot3d.art3dasart3dim