jjzjj

VectMult

全部标签

Python 代码有效,但 Hadoop Streaming 生成 part-00000 "Empty file"

在Ubuntu虚拟机上,我根据MichaelNoll的tutorial设置了一个单节点集群这是我编写Hadoop程序的起点。另外,作为引用,this.我的程序使用Python并使用HadoopStreaming。我写了一个简单的向量乘法程序,其中mapper.py接受输入文件v1和v2,每个文件都包含一个向量12,33,10并返回产品。然后reducer.py返回乘积之和,即:映射器:map(mult,v1,v2)reducer:sum(p1,p2,p3,...,pn)映射器.py:importsysdefmult(x,y):returnint(x)*int(y)#Inputcomes