jjzjj

用于运行 UIMA Ruta 脚本的 Java API

我是UIMARuta的新手。我使用脚本语言制作了一些注释器。我能够在EclipseIDE中运行它们。我想编写一个JAVAAPI以在提供的输入上自动运行脚本。我使用的是UIMA文档中提供的相同示例项目。到目前为止我已经能够做到这一点try{FiletaeDescriptor=null;FileinputDir=null;//ReadandvalidatecommandlineargumentsbooleanvalidArgs=false;if(args.length==2){taeDescriptor=newFile(args[0]);inputDir=newFile(args[1]);

java - Spark 上下文中的 Uima Ruta 内存不足问题

我在apachespark上运行一个UIMA应用程序。UIMARUTA有数以百万计的页面批量处理以进行计算。但有时我遇到内存不足异常。它有时会抛出异常,因为它成功处理了2000页,但有时在500页上失败。应用日志Causedby:java.lang.OutOfMemoryError:Javaheapspaceatorg.apache.uima.internal.util.IntArrayUtils.expand_size(IntArrayUtils.java:57)atorg.apache.uima.internal.util.IntArrayUtils.ensure_size(Int