如何将下面的OpenNLP模型添加到我的JavaWeb应用程序类Path?我刚刚将“En-Parser-chunking.bin”文件复制到我的JavaWeb应用程序SRC文件夹中。但这给了我班级没有例外。在Tomcat9中将此文件添加到我的class路径的正确方法是什么?打开NLP工具模型看答案如果使用maven,请在下面创建一个文件夹结构src/main/resources/这反映了您正在使用的类包装的包装。例如,src/main/resources/mycompany/myapp/.您将能够使用此代码加载模型:InputStreammodelIn=this.getClass().getR
我需要在我的PHP代码中使用基于Java的OpenNLP库。例如,我需要使用它的SentenceDetector组件(en-sent.bin)来分析我的PHP代码中的文本变量。在其documentation,可以从Java代码访问该API,如下所示:InputStreammodelIn=newFileInputStream("en-sent.bin");try{SentenceModelmodel=newSentenceModel(modelIn);}catch(IOExceptione){e.printStackTrace();}finally{if(modelIn!=null){t
我正在尝试将OpenNLP的自定义特征生成用于NamedFinderAPI。http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html我浏览了文档,但无法理解如何指定不同的功能。它只是说:AdaptiveFeatureGeneratorfeatureGenerator=newCachedFeatureGenerator(newAdaptiveFeatureGenerator[]{newWindowFeatureGenerator(newTokenFeatureGenerator(),2,2),newWindowFe
我计划对我的数据进行一些数据调整。情况-我有一个数据,其中有一个字段country。它包含用户输入的国家/地区名称(它可能包含拼写错误或同一国家/地区的不同国家/地区名称,例如US/U.S.A/UnitedStates代表美国)。我有一个正确的国家/地区名称列表。我想要的-预测它指的是哪个最近的国家。例如-如果给出U.S.,那么它将更改为USA(我们列表中的正确国家/地区名称)。有什么方法可以使用Java或opennlp或任何其他方法来实现吗? 最佳答案 您可以使用GettyAPI.它会给你国家名称的缩写。只需使用此API即可。或您
我需要使用NLP解决以下问题,你能给我一些关于如何使用OpenNLPAPI实现这个的指示吗一个。如何判断一个句子是否暗示过去、现在或将来的某个Action。(e.g.)Iwasverysadlastweek-pastIfeellikehittingmyneighbor-presentIamplanningtogotoNewYorknextweek-future如何找到一个人或公司或国家对应的词(e.g.)JohnisplanningtospecializeinElectricalEngineeringinUCBerkleyandpursueacareerwithIBM).人=约翰公司=
我正在尝试从大量文本中解析出句子。使用java我开始使用NLP工具,例如OpenNLP和Stanford的Parser。但这就是我卡住的地方。尽管这两个解析器都非常棒,但是当涉及到非统一文本时它们会失败。例如,在我的文本中,大多数句子都是用句号分隔的,但在某些情况下,例如要点,它们不是。这里两个解析都失败了。我什至尝试在stanford解析中设置多个句子终止符的选项,但输出并没有好多少!有什么想法吗??编辑:为了使它更简单,我希望解析分隔符是新行(“\n”)或句点(“。”)的文本...... 最佳答案 首先,您必须明确定义任务。确切
我想了解解决以下问题的最佳方法。我有与简历/简历非常相似的文档,并且我必须提取实体(名称,姓氏,生日,城市,邮政编码等)。要提取这些实体,我要组合不同的查找器(正则表达式,字典等)这些查找器没有问题,但是,我正在寻找一种方法/算法或类似的方法来确认实体。“确认”是指我必须在邻近位置(更接近我找到的实体)中找到特定的术语(或实体)。例子:MynameisName:NameandSurname:我可以确认实体,因为它与让我理解“上下文”的特定术语更为接近。如果我在实体附近有“名字”或“姓”字,那么我可以说我很有可能找到了。因此,目标是编写此类规则以确认实体。另一个示例应该是:Myaddre
好的,我有以下代码来训练来自OpenNLP的NER标识符FileReaderfileReader=newFileReader("train.txt");ObjectStreamfileStream=newPlainTextByLineStream(fileReader);ObjectStreamsampleStream=newNameSampleDataStream(fileStream);TokenNameFinderModelmodel=NameFinderME.train("pt-br","train",sampleStream,Collections.emptyMap());n
我想在Hadoop上为意大利语实现一个自然语言处理算法我有两个问题;如何找到意大利语的词干提取算法?如何集成到hadoop中?这是我的代码StringpathSent=...taggedsentences...;StringpathChunk=....chunkedtrainpath....;FilefileSent=newFile(pathSent);FilefileChunk=newFile(pathChunk);InputStreaminSent=null;InputStreaminChunk=null;inSent=newFileInputStream(fileSent);in
我是开放NLP的新手-与NER开放的实体提取,我已经在开放式NLPNER中进行了培训和评估实体提取的模型,当我用一个单词的实体提供输入文本时,它可以正常工作,例如:“我想购买cadbury”。但是它不能适用于多字场景,例如:“我想只是一个苹果MacBook”如何训练模型以选择多个单词PS:我知道我需要做与NLP中提供的Bigrams相关的事情,但是如何使用OpenNLP进行操作?看答案您需要提供涵盖多词跨度的培训数据。来自OpenNLP文档:PierreVinken,61yearsold,willjointheboardasanonexecutivedirectorNov.29.Mr.Vink