OpenNLP

将模型添加到Java Class Path

如何将下面的OpenNLP模型添加到我的JavaWeb应用程序类Path？我刚刚将“En-Parser-chunking.bin”文件复制到我的JavaWeb应用程序SRC文件夹中。但这给了我班级没有例外。在Tomcat9中将此文件添加到我的class路径的正确方法是什么？打开NLP工具模型看答案如果使用maven，请在下面创建一个文件夹结构src/main/resources/这反映了您正在使用的类包装的包装。例如，src/main/resources/mycompany/myapp/.您将能够使用此代码加载模型：InputStreammodelIn=this.getClass().getR

java - 用于访问 Java 库 API 的 PHP 代码

我需要在我的PHP代码中使用基于Java的OpenNLP库。例如，我需要使用它的SentenceDetector组件(en-sent.bin)来分析我的PHP代码中的文本变量。在其documentation，可以从Java代码访问该API，如下所示:InputStreammodelIn=newFileInputStream("en-sent.bin");try{SentenceModelmodel=newSentenceModel(modelIn);}catch(IOExceptione){e.printStackTrace();}finally{if(modelIn!=null){t

java section PHP em opennlp

java - OpenNLP Namefinder API 中的自定义特征生成

我正在尝试将OpenNLP的自定义特征生成用于NamedFinderAPI。http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html我浏览了文档，但无法理解如何指定不同的功能。它只是说:AdaptiveFeatureGeneratorfeatureGenerator=newCachedFeatureGenerator(newAdaptiveFeatureGenerator[]{newWindowFeatureGenerator(newTokenFeatureGenerator(),2,2),newWindowFe

自定 Namefinder opennlp tools noreferrer java machine-learning named-entity-recognition

java - 如何为用户提供的国家名称预测正确的国家名称？

我计划对我的数据进行一些数据调整。情况-我有一个数据，其中有一个字段country。它包含用户输入的国家/地区名称(它可能包含拼写错误或同一国家/地区的不同国家/地区名称，例如US/U.S.A/UnitedStates代表美国)。我有一个正确的国家/地区名称列表。我想要的-预测它指的是哪个最近的国家。例如-如果给出U.S.，那么它将更改为USA(我们列表中的正确国家/地区名称)。有什么方法可以使用Java或opennlp或任何其他方法来实现吗？最佳答案您可以使用GettyAPI.它会给你国家名称的缩写。只需使用此API即可。或您

何为 java 地区名称 section strong nlp string-matching text-mining opennlp

java - 借助 NLP 分析句子并提取人名、组织和位置

我需要使用NLP解决以下问题，你能给我一些关于如何使用OpenNLPAPI实现这个的指示吗一个。如何判断一个句子是否暗示过去、现在或将来的某个Action。(e.g.)Iwasverysadlastweek-pastIfeellikehittingmyneighbor-presentIamplanningtogotoNewYorknextweek-future如何找到一个人或公司或国家对应的词(e.g.)JohnisplanningtospecializeinElectricalEngineeringinUCBerkleyandpursueacareerwithIBM).人=约翰公司=

并提人名 String printStackTrace section java nlp stanford-nlp opennlp

java - 使用 NLP 进行句子检测

我正在尝试从大量文本中解析出句子。使用java我开始使用NLP工具，例如OpenNLP和Stanford的Parser。但这就是我卡住的地方。尽管这两个解析器都非常棒，但是当涉及到非统一文本时它们会失败。例如，在我的文本中，大多数句子都是用句号分隔的，但在某些情况下，例如要点，它们不是。这里两个解析都失败了。我什至尝试在stanford解析中设置多个句子终止符的选项，但输出并没有好多少!有什么想法吗？？编辑:为了使它更简单，我希望解析分隔符是新行(“\n”)或句点(“。”)的文本...... 最佳答案首先，您必须明确定义任务。确切

句子 java section strong nlp opennlp text-segmentation

java - 确认实体的最佳方法

我想了解解决以下问题的最佳方法。我有与简历/简历非常相似的文档，并且我必须提取实体(名称，姓氏，生日，城市，邮政编码等)。要提取这些实体，我要组合不同的查找器(正则表达式，字典等)这些查找器没有问题，但是，我正在寻找一种方法/算法或类似的方法来确认实体。“确认”是指我必须在邻近位置(更接近我找到的实体)中找到特定的术语(或实体)。例子:MynameisName:NameandSurname:我可以确认实体，因为它与让我理解“上下文”的特定术语更为接近。如果我在实体附近有“名字”或“姓”字，那么我可以说我很有可能找到了。因此，目标是编写此类规则以确认实体。另一个示例应该是:Myaddre

java 确认 br noreferrer noopener nlp text-mining opennlp named-entity-recognition

java - 我如何在 OpenNLP 中训练命名实体识别器标识符？

好的，我有以下代码来训练来自OpenNLP的NER标识符FileReaderfileReader=newFileReader("train.txt");ObjectStreamfileStream=newPlainTextByLineStream(fileReader);ObjectStreamsampleStream=newNameSampleDataStream(fileStream);TokenNameFinderModelmodel=NameFinderME.train("pt-br","train",sampleStream,Collections.emptyMap());n

识别器何在 section START lt java nlp opennlp named-entity-recognition

java - 如何在 Hadoop 上的 OpenNLP 中训练意大利语模型？

我想在Hadoop上为意大利语实现一个自然语言处理算法我有两个问题；如何找到意大利语的词干提取算法？如何集成到hadoop中？这是我的代码StringpathSent=...taggedsentences...;StringpathChunk=....chunkedtrainpath....;FilefileSent=newFile(pathSent);FilefileChunk=newFile(pathChunk);InputStreaminSent=null;InputStreaminChunk=null;inSent=newFileInputStream(fileSent);in

意大利语利语 new 34 section java hadoop nlp opennlp linguistics

如何训练OpenNLP模型以提取多集单词

我是开放NLP的新手-与NER开放的实体提取，我已经在开放式NLPNER中进行了培训和评估实体提取的模型，当我用一个单词的实体提供输入文本时，它可以正常工作，例如：“我想购买cadbury”。但是它不能适用于多字场景，例如：“我想只是一个苹果MacBook”如何训练模型以选择多个单词PS：我知道我需要做与NLP中提供的Bigrams相关的事情，但是如何使用OpenNLP进行操作？看答案您需要提供涵盖多词跨度的培训数据。来自OpenNLP文档:PierreVinken,61yearsold,willjointheboardasanonexecutivedirectorNov.29.Mr.Vink

提取单词 code section 实体