想知道是否有任何工具可以帮助我检测文本中的代词名称。例子JoneisSpanish.HecanspeakGerman.如何将He标记为Jone? 最佳答案 您要解决的问题称为anaphoraresolution.可以使用执行此任务的Java工具here.源代码在该站点上可用。要从理论上了解它是如何工作的,请查看thispaper由Lappin和Leass从1994年开始。 关于java-检测代词及其名词?,我们在StackOverflow上找到一个类似的问题:
我不明白为什么Weka评估类构造函数需要训练实例才能工作。谁能解释一下?理论上,评估仅取决于训练模型(下一个代码中的cls)和测试数据(TestingSet)。谢谢!这是一个例子://TrainingSetisthetrainingInstances//TestingSetisthetestingInstances//BuilddeclassifierClassifiercls=(Classifier)newNaiveBayes();cls.buildClassifier(TrainingSet);//TestthemodelEvaluationeTest=newEvaluation(
能否请您告诉我如何在weka中表示文本分类的属性或类。我可以使用什么属性进行分类?单词频率还是单词?ARFF格式的可能结构是什么?你能给我几行这种结构的例子吗?非常感谢您。 最佳答案 最简单的替代方法之一是从ARFF文件开始解决二类问题,例如:@relationcorpus@attributetextstring@attributeclass{pos,neg}@data'longtextwithwords...',pos文本表示为String类型,类是具有两个值的标称值。然后你可以应用两个过滤器:StringToWordVector
在weka我加载了一个arff文件。我可以使用可视化选项卡查看属性之间的关系。但是我无法理解抖动slider的含义。它的用途是什么? 最佳答案 您可以在mailinglistarchives中找到答案:Visualize面板中的jitter函数只是添加了人工随机噪声到绘制点的坐标以传播数据输出一点(这样你就可以看到可能已经被别人遮住了)。 关于java-weka的可视化选项卡中的抖动是什么意思,我们在StackOverflow上找到一个类似的问题: https
我一直在尝试使用与weka机器学习库一起使用的Ibk最近邻算法。我知道如何对实例进行分类,但我想实现协同过滤功能,所以我需要实际获取最接近感兴趣对象的实际对象列表。在weka中,我如何使用它的javaAPI真正做到这一点? 最佳答案 这个怎么样weka.core.neighboursearch.LinearNNSearchknn=newLinearNNSearch(trainingInstances);//dootherstuffInstancesnearestInstances=knn.kNearestNeighbours(tar
我正在尝试使用Weka使用PCA算法进行特征选择。我的原始特征空间在2700个样本中包含约9000个属性。我尝试使用以下代码来降低数据的维度:AttributeSelectionselector=newAttributeSelection();PrincipalComponentspca=newPrincipalComponents();Rankerranker=newRanker();selector.setEvaluator(pca);selector.setSearch(ranker);Instancesinstances=SamplesManager.asWekaInstanc
我知道在资源中打开文件的安全方法是:InputStreamis=this.getClass().getResourceAsStream("/path/in/jar/file.name");现在的问题是我的文件是WekaWrapper包中决策者的模型,并且Deciderclass只有一个方法:publicvoidload(Filefile)throwsExceptionload获取文件并将其作为FileInputStream打开。你看到解决方法了吗?我真的会喜欢将模型放入资源中。本来想创建一个临时文件,把模型的内容写到临时文件里,然后把临时文件传给Weka,但是实在是太脏了。。其他选择?
Weka是一种标准的、广泛使用的数据挖掘套件,主要用于Java。我想知道是否可以与C++一起使用,如何使用? 最佳答案 要通过Java以外的其他编程语言使用Weka,我认为最好的方法是从命令行。Aguide.使用您的语言(C++)生成输入arff并在最后解析结果。 关于c++-通过C++代码使用WEKA的最简单方法是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/89041
我使用Weka进行数据探索并确定最适合我的问题的分类算法取得了很大的成功。现在我有了一个训练有素的模型,我想将它集成到我的C++程序的其余部分中。不幸的是,这似乎是一项艰巨的任务:只有Weka原生支持将分类器导出为Java对象文件。有没有人找到以有用格式导出Weka训练模型参数的方法?如果有一个实用程序可以从J48决策树生成C/C++代码,我会特别感兴趣。 最佳答案 我的理解是,J48是QuinlanC4.5算法的Java实现,其C代码可在http://www.rulequest.com/Personal/免费获得。这是您要找的吗?
你能告诉我iOS是否有weka(机器学习算法)吗?如果是,请提供下载链接供我下载。 最佳答案 iOS协议(protocol)说:"3.3.2—应用程序本身不得以任何方式安装或启动其他可执行代码,包括但不限于通过使用插件架构、调用其他框架、其他API或其他方式。不得解释代码在应用程序中下载或使用,但由Apple的文档化API和内置解释器解释和运行的代码除外。”所以你不能启动java解释器来使用WEKA库。但是...谷歌几天前发布了“Java到iOSObjectiveC转换器”。而WEKA是一个“开源”项目。因此,也许您可以尝试下载