jjzjj

Behemoth

全部标签

hadoop - 使用 Behemoth 和 map reduce 转换为 Tika 时配置对象出错

我正在运行命令,使用thistutorial中给出的mapreduce将庞然大物语料库转换为tika。我在执行此操作时遇到以下错误:13/02/2514:44:00INFOmapred.FileInputFormat:Totalinputpathstoprocess:113/02/2514:44:01INFOmapred.JobClient:Runningjob:job_201302251222_001713/02/2514:44:02INFOmapred.JobClient:map0%reduce0%13/02/2514:44:09INFOmapred.JobClient:TaskI

hadoop - 使用 Behemoth 在 Hadoop 上运行 UIMA 作业

我有一个功能齐全的UIMA作业,可以做简单的注释。我可以通过本地CASGUI成功启动它。我一直在尝试使用ApacheBehemoth在Hadoop上运行UIMA作业。我想知道是否有人为此工作过?作业运行成功,但在hadoop输出目录中;UIMA作业没有输出。我可以在Hadoop作业跟踪器输出中看到作业成功完成并将其输入数据复制到最终输出目录。谁能指出这里可能发生的事情,我们是否需要对UIMA代码进行任何其他更改?谢谢 最佳答案 以下是适用于我放在一起的小型管道的步骤:将您的UIMA管道导出为jar(Your-pipeline.jar