hadoop - Pig Latin Partition By 子句

coder 2024-01-08 原文

Pig Latin 中的“Partition By”子句有什么用？

另请提供示例用法。

是只允许自定义分区还是允许按列分区？

最佳答案

Pig Latin 中的“Partition By”子句有什么用？

这允许您设置您选择的Partitioner。 Pig 使用默认的 HashPartitioner，order 和 skew join 除外。但有时您可能希望拥有自己的实现来提高性能。 Partition By 对此有帮助。

另请提供示例用法。

DATA = LOAD '/inputs/demo.txt' using PigStorage(' ') as (no:int, name:chararray);
PARTITIONED = GROUP DATA by name PARTITION BY org.apache.pig.test.utils.SimpleCustomPartitioner parallel 2;

是只允许自定义分区还是允许按列分区？

只是指定自定义分区器，并不是直接根据某个字段进行分区。

参见 PIG-282 了解更多详情。

关于hadoop - Pig Latin Partition By 子句，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18785885/

有关hadoop - Pig Latin Partition By 子句的更多相关文章

hadoop安装之保姆级教程（二）之YARN的配置 - 2
1.1.1 YARN的介绍为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的，针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜，提出了全新的资源管理框架YARN. ApacheYARN（YetanotherResourceNegotiator的缩写）是Hadoop集群的资源管理系统，负责为计算程序提供服务器计算资源，相当于⼀个分布式的操作系统平台，⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现，但是因为具有⾜够的通⽤性，同样可以⽀持其他的分布式计算模
ruby - 当你有一个没有参数的 case 语句并且 when 子句是 lambda 时会发生什么？ - 2
这段代码没有像我预期的那样执行:casewhen->{false}then"why?"else"ThisiswhatIexpect"end#=>"why?"这也不是casewhen->(x){false}then"why?"else"ThisiswhatIexpect"end#=>"why?"第一个then子句在两种情况下都被执行，这意味着我提供给when子句的lambda没有被调用。我知道无论when子句的主题是什么，都应该调用大小写相等运算符===。我想知道当没有为case提供参数时，===的另一边会发生什么。我在想它可能是nil，但它不可能是:->{false}===nil#=>
ruby - OR 运算符和 Ruby where 子句 - 2
可能真的很简单，但我很难在网上找到关于这个的文档我在Ruby中有两个activerecord查询，我想通过OR运算符连接在一起@pro=Project.where(:manager_user_id=>current_user.id)@proa=Project.where(:account_manager=>current_user.id)我是ruby的新手，但我自己尝试使用||@pro=Project.where(:manager_user_id=>current_user.id||:account_manager=>current_user.id)这没有用，所以1.我想知道如何在
ruby-on-rails - 如何 stub 事件记录关系以使用 rspec 测试 where 子句？ - 2
我有一个看起来像这样的类:classFoo在测试#nasty_bars_present？我想编写一个rspec测试来对bars关联进行stub，但允许where自然执行。像这样的东西:describe"#nasty_bars_present?"docontext"withnastybars"dobefore{foo.stub(:bars).and_return([mock(Bar,bar_type:"Nasty")])}it"shouldreturntrue"doexpect(foo.nasty_bars_present?).tobe_trueendendend上面的测试给出了一个关于
大数据之Hadoop数据仓库Hive - 2
目录：一、简介二、HQL的执行流程三、索引四、索引案例五、Hive常用DDL操作六、Hive常用DML操作七、查询结果插入到表八、更新和删除操作九、查询结果写出到文件系统十、HiveCLI和Beeline命令行的基本使用十一、Hive配置一、简介Hive是一个构建在Hadoop之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类SQL查询功能，用于查询的SQL语句会被转化为MapReduce作业，然后提交到Hadoop上运行。特点：简单、容易上手(提供了类似sql的查询语言hql)，使得精通sql但是不了解Java编程的人也能很好地进行大数据分析；灵活性高，可以自定义用户函数(UDF)和
ruby-on-rails - Arel AND 子句和 Empty 条件 - 2
考虑以下代码片段:defsqlbilling_requests.project(billing_requests[Arel.star]).where(filter_by_day.and(filter_by_merchant).and(filter_by_operator_name)).to_sqlenddeffilter_by_daybilling_requests[:created_at].gteq(@start_date).and(billing_requests[:created_at].lteq(@end_date))enddeffilter_by_operator_nameu
ruby - 如何分隔 DynamoDB 更新表达式中的多个子句 - 2
根据AWSDocs:Anupdateexpressionconsistsofoneormoreclauses.EachclausebeginswithaSET,REMOVE,ADDorDELETEkeyword.Youcanincludeanyoftheseclausesinanupdateexpression,inanyorder.However,eachactionkeywordcanappearonlyonce.我无法在一个update_expression中获得正确的SET和REMOVE语法:params={key:{'id'=>{s:'123'}},table_name:'c
ruby - Rubocop 保护子句困境 - 不必要 if else VS 行太长保护子句 - 2
我有一段代码，其中有一个带有保护子句的raise语句:defvalidate_indexindex#ChangetoSizeErrorraiseArgumentError,"Sizeofindex(#{index.size})doesnotmatches"\"sizeofvector(#{size})"ifsize!=index.sizeend在这一点上，rubocop给出了罪行:Style/MultilineIfModifier:Favoranormalif-statementoveramodifierclauseinamultilinestatement.我将我的代码修改为正常if
sql - 如何使用 Arel 正确地向带有 'or' 和 'and' 子句的 SQL 查询添加括号？ - 2
我正在使用RubyonRails3.2.2，我想生成以下SQL查询:SELECT`articles`.*FROM`articles`WHERE(`articles`.`user_id`=1OR`articles`.`status`='published'OR(`articles`.`status`='temp'AND`articles`.`user_id`IN(10,11,12,)))通过使用Arel这样Article.where(arel_table[:user_id].eq(1).or(arel_table[:status].eq("published")).or(arel_tab
sql - Ruby on Rails Where 子句小于大于 - 2
所以我想做一个rubyonrails查询，它以这种方式构造，具有小于和大于约束。self.order('random()').where(friends:friend,age:{minimum:5,maximum:20})作为ruby初学者，以上是我想象的完成方式。但是，这不起作用。如何正确实现这一目标？最佳答案使用范围对象。.where(age:5..50)或者你可以这样写.where('ageBETWEEN5AND20') 关于sql-RubyonRailsWhere子句

hadoop - Pig Latin Partition By 子句

有关hadoop - Pig Latin Partition By 子句的更多相关文章

随机推荐