TaskTracker

Hadoop 集群 - 如何知道每个 tasktracker 的理想最大 map/reduce 任务数

我刚刚使用Hadoop0.20.205设置了一个Hadoop集群。我有一个主机(NameNode和JobTracker)和另外两个盒子(从机)。我试图了解如何定义要使用的map和reduce任务的数量。到目前为止，我了解到我可以设置每个TaskTracker能够同时处理的最大map和reduce任务数:*mapred.tasktracker.map.tasks.maximum*和*mapred.tasktracker.reduce.tasks.maximum*.此外，我还可以使用*mapred.map.tasks*定义整个集群可以同时运行的最大map任务数。是吗？如果是这样，我怎么知道

java - 无法启动 jobtracker 和 tasktracker

我可以启动namenode和辅助namenode，但无法启动jobtracker和tasktracker。当我检查日志时，它显示这样的内容************************************************************/2013-05-3007:27:50,962FATALorg.apache.hadoop.conf.Configuration:badconffile:top-levelelementnot2013-05-3007:27:50,963WARNorg.apache.hadoop.conf.Configuration:badconff

tasktracker jobtracker hadoop apache conf java

hadoop - CDH伪集群启动Jobtracker和Tasktracker失败

当我尝试在R中执行mapreduce并且未能与JT和TT通信时，我注意到了这个问题。这是在我更改了一些配置文件后发生的，但不幸的是，我忘记了如何将其更改回来(我的错)!!1)JT日志:2013-08-0515:14:09,335INFOorg.apache.hadoop.mapred.JobTracker:STARTUP_MSG:/************************************************************STARTUP_MSG:StartingJobTrackerSTARTUP_MSG:host=rhadoop/172.16.1.39STA

Tasktracker Jobtracker hadoop lib mapreduce

Hadoop:如何启动 tasktracker？

我想打开tasktracker的web/ui。localhost:50030/jobtracker.jsp但它不起作用，因为没有正在运行的tasktracker。我的hadoop应用程序在没有tasktracker的情况下运行良好。但是我发现应该运行tasktracker才能打开web/ui。但是我不知道如何启动tasktracker。我如何启动tasktracker？我尝试了很多方法，但它们都不起作用。我的状态和环境:localhost:50070web/ui运行良好。jps命令显示Datanode、NameNode、NodeManager、SecondaryNameNode、Res

tasktracker Hadoop section code

ubuntu - jobtracker 和 tasktracker 打不开

我已经成功安装了ubuntu12.04和hadoop2.3.0。输入jps命令后，我发现输出如下4135jps2582SeconadaryNameNode3143NodeManager2394Namenode2391Datanode3021ResourceManager为什么不显示jobtracker和tasktracker。我尝试了start-mapred.sh但它显示找不到命令。(我搜索了hadoop目录没有找到这样的文件所以我认为较新的版本即2.0.3已经弃用它并且必须有一些其他方式来启动jobtracker和tasktracker)localhost:50070工作得很好但是l

tasktracker jobtracker section hadoop ubuntu replication hdfs

linux - Hadoop:将 cgroups 用于 TaskTracker 任务

是否可以配置cgroups或Hadoop，使TaskTracker生成的每个进程都分配给特定的cgroup？我想使用cgroups强制执行内存限制。可以将cgroup分配给TaskTracker，但如果作业造成严重破坏，TaskTracker也可能会被oom-killer杀死，因为它们在同一组中。假设我的机器有8GB内存。我想为DataNode和系统实用程序保留1.5GB，让HadoopTaskTracker使用6.5GB内存。现在，我在生成4个映射器和2个缩减器(理论上每个都可以使用1GBRAM)时使用流式API开始一个作业，它占用的内存比允许的多。现在cgroup内存限制将被命中并

TaskTracker cgroups code section linux hadoop linux-kernel

Hadoop on CentOS streaming example with python - permission denied on/mapred/local/taskTracker

我已经能够使用python映射器和缩减器设置流式示例。mapred文件夹位置是/mapred/local/taskTrackerroot和mapred用户都拥有此文件夹和子文件夹的所有权然而，当我运行我的流式传输时，它会创建map但不会减少并给出以下错误无法运行程序/mapred/local/taskTracker/root/jobcache/job_201303071607_0035/attempt_201303071607_0035_m_000001_3/work/./mapper1.py权限被拒绝我注意到，虽然它为mapred/local/taskTracker及其所有子目录提供

taskTracker permission code section mapred hadoop hadoop-streaming

Hadoop 1.0.4 - Windows 7 + cygwin - Tasktracker 抛出异常

执行mapreduce程序时，Tasktracker不工作。tasktraker日志:2014-01-3115:58:51,021INFOorg.apache.hadoop.mapred.JvmManager:InJvmRunnerconstructedJVMID:jvm_201401311556_0001_m_-5239237092014-01-3115:58:51,021INFOorg.apache.hadoop.mapred.JvmManager:JVMRunnerjvm_201401311556_0001_m_-523923709spawned.2014-01-3115:58:

Tasktracker Windows java org hadoop

java - 在 yarn "org.apache.hadoop.ipc.Client - Retrying connect to server: tasktracker3/10.201.2.169:50000"上运行时在 apache Pig 中出现错误

我正在运行ApachePig0.11.2和Hadoop2.2.0。我在Pig中运行的大多数简单作业都运行良好。但是，每当我尝试在大型数据集上使用GROUPBY或LIMIT运算符时，我都会收到以下连接错误:2013-12-1811:21:28,400[main]INFOorg.apache.hadoop.ipc.Client-Retryingconnecttoserver:tasktracker2/10.201.2.145:54957.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetr

apache tasktracker3 RetryUpToMaximumCountWithFixedSle hadoop java apache-pig hadoop-yarn

hadoop - 由于权限失败，无法在 cygwin 上启动 tasktracker

我在Windows7下的cygwin上设置了hadoop1.1.1。dfs组件启动正常(start-dfs.sh或start-all.sh两者)，jobtracker也是如此(启动mapred.sh)，但tasktracker无法正常启动启动和关闭时出现与taskTracker路径权限相关的错误(无法设置0755)。我在Problemstartingtasktrackerinhadoopunderwindows看到过类似的问题但没有找到任何解决方案或指导如何解决它。也尝试过许多网站的解决方案，但都是徒劳的。这是日志输出2013-01-0215:51:31,836INFOorg.apac

tasktracker hadoop apache cygwin

1 234 5 6