jjzjj

hadoop - 如何用 pig latin 压平和减去列

coder 2024-01-09 原文

我刚学 pig ;我怎么能接受这个:

((a,b),c,(x,y),z)

得到这样的东西:

(a,b,c,x,y,z, ABS(c-z))

最佳答案

和你写的差不多。

A = load 'foobar' as (t:((a:double,b:double),c:double,(x:double,y:double,)z:double));
B = foreach A generate flatten(t);
C = foreach B generate a, b, c, x, y, z, ABS(c-z);

我假设 double 作为值的数据类型。不能 100% 确定展平,这取决于您的确切模式,这可能会产生不需要的值,在此处描述的情况下,它应该简单地删除内部括号。

关于hadoop - 如何用 pig latin 压平和减去列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28142167/

有关hadoop - 如何用 pig latin 压平和减去列的更多相关文章

  1. hadoop安装之保姆级教程(二)之YARN的配置 - 2

    1.1.1 YARN的介绍 为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的,针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜,提出了全新的资源管理框架YARN. ApacheYARN(YetanotherResourceNegotiator的缩写)是Hadoop集群的资源管理系统,负责为计算程序提供服务器计算资源,相当于⼀个分布式的操作系统平台,⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现,但是因为具有⾜够的通⽤性,同样可以⽀持其他的分布式计算模

  2. ruby-on-rails - 如何用不同的用户运行nginx主进程 - 2

    A/ctohttp://wiki.nginx.org/CoreModule#usermaster进程曾经以root用户运行,是否可以以不同的用户运行nginxmaster进程? 最佳答案 只需以非root身份运行init脚本(即/etc/init.d/nginxstart),就可以用不同的用户运行nginxmaster进程。如果这真的是你想要做的,你将需要确保日志和pid目录(通常是/var/log/nginx&/var/run/nginx.pid)对该用户是可写的,并且您所有的listen调用都是针对大于1024的端口(因为绑定(

  3. ruby - 如何用递增的值填充数组 Ruby - 2

    我正在尝试解决http://projecteuler.net/problem=1.我想创建一个方法,它接受一个整数,然后创建一个包含它前面的所有整数的数组,并将整数本身作为数组中的值。以下是我目前所拥有的。代码不起作用。defmake_array(num)numbers=Array.newnumcount=1numbers.eachdo|number|numbers 最佳答案 (1..num).to_a是您在Ruby中需要做的全部。1..num将创建一个Range对象,以1开始并以任意值num结束是。Range对象有to_a方法通过

  4. ruby - 如何用 Nokogiri 解析连续的标签? - 2

    我有这样的HTML代码:Label1Value1Label2Value2...我的代码不起作用。doc.css("first").eachdo|item|label=item.css("dt")value=item.css("dd")end显示所有首先标记,然后标记标签,我需要“标签:值” 最佳答案 首先,您的HTML应该有和中的元素:Label1Value1Label2Value2...但这不会改变您解析它的方式。你想找到s并遍历它们,然后在每个你可以使用next_element得到;像这样:doc=Nokogiri::HTML(

  5. ruby-on-rails - 如何用 has_many 保存数据 :through - 2

    我在游戏和帐户模型之间存在多对多关系,如下所示:classAccount:destroyhas_many:games,:through=>:account_gamesendclassGame:destroyhas_many:accounts,:through=>:account_gamesendclassAccountGame现在我知道让我们说我想创建一个类似这样的记录:@account=Account.new(params[:user])@account.games但是我应该如何在执行此操作时更新AccountGame中的某些属性?假设AccountGame有一些名为score的字段

  6. ruby - 从另一个哈希中的相应值中减去哈希中的值 - 2

    我希望能够在Ruby中减去两个哈希值并得到第三个哈希值。两个哈希看起来像这样:h1={"Cat"=>100,"Dog"=>5,"Bird"=>2,"Snake"=>10}h1.default=0h2={"cat"=>50,"dog"=>3,"BIRD"=>4,"Mouse"=>75,"Snake"=>10}h2.default=0我希望能够像这样在h1上调用一个方法:h1.difference(h2)并得到这个散列作为结果:{"Cat"=>50,"Dog"=>2,"BIRD"=>-2,"Mouse"=>-75}我想创建一个新的散列,其中包含两个散列中的键,新散列的值是第一个散列中键的值

  7. ruby - 如何用 YARD 记录一个不返回任何内容的方法 - 2

    我有这样的方法defself.import(file_name,opts={})我正在尝试用YARD记录下来。然而,这是一种100%副作用的方法(我知道,我知道,副作用,呃!)。但是对于此方法的用户,实际上没有任何类型的返回对象,但是YARD生成如下签名:+(Object)import(file_name,opts={})有什么办法可以告诉yardimport方法什么都不返回吗?我可以告诉它返回nil,但这不是一回事 最佳答案 所有方法都会返回一些东西,void关键字可能就是您要查找的内容。#@return[void]defmeth

  8. 大数据之Hadoop数据仓库Hive - 2

    目录:一、简介二、HQL的执行流程三、索引四、索引案例五、Hive常用DDL操作六、Hive常用DML操作七、查询结果插入到表八、更新和删除操作九、查询结果写出到文件系统十、HiveCLI和Beeline命令行的基本使用十一、Hive配置一、简介Hive是一个构建在Hadoop之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类SQL查询功能,用于查询的SQL语句会被转化为MapReduce作业,然后提交到Hadoop上运行。特点:简单、容易上手(提供了类似sql的查询语言hql),使得精通sql但是不了解Java编程的人也能很好地进行大数据分析;灵活性高,可以自定义用户函数(UDF)和

  9. Ruby-用另一个数组从一个数组中添加/减去元素 - 2

    我这样做:a=[1,2,3,4]b=[2,3,4,5]c=b-aputc我明白了答案->[1]我想要这个答案->[1,1,1,1](比如矩阵加法/减法)我试过这个:c.each{|e|c[e]=b[e]-a[e]}但我得到了这个答案:[1,0,0,0]谁能给我一个正确的方法来做到这一点?非常感谢! 最佳答案 你可以使用zip:a.zip(b).map{|x,y|y-x}#=>[1,1,1,1]还有一个Matrix类:require"matrix"a=Matrix[[1,2,3,4]]b=Matrix[[2,3,4,5]]c=b-a#

  10. ruby - 在 Ruby 中减去两个哈希值 - 2

    是否可以修改hash类,以便在给定两个散列的情况下,可以创建一个仅包含存在于一个散列中但不存在于另一个散列中的键的新散列?例如:h1={"Cat"=>100,"Dog"=>5,"Bird"=>2,"Snake"=>10}h2={"Cat"=>100,"Dog"=>5,"Bison"=>30}h1.difference(h2)={"Bird"=>2,"Snake"=>10}可选地,difference方法可以包含任何键/值对,这样键出现在两个哈希值中但它们之间的值不同。 最佳答案 h1={"Cat"=>100,"Dog"=>5,"Bi

随机推荐