jjzjj

bagValues

全部标签

hadoop - 如何用 Pig 将 (A, B, C) 变成 (AB, AC, BC)?

在Pig中,给定以下Bag:(A,B,C),我能否以某种方式计算所有值的唯一组合?我正在寻找的结果类似于(AB,AC,BC)。我忽略了BA、CA、CB,因为如果按字母顺序排序,它们将成为现有值的副本。 最佳答案 做这样的事情的唯一方法是编写一个UDF。这将完全按照您的要求进行:publicclassCombinationsUDFextendsEvalFunc{publicDataBagexec(Tupleinput)throwsIOException{ListbagValues=newArrayList();Iteratoriter