hadoop - Pig 如何处理否定空值？

coder 2024-01-07 原文

我无法理解 apache pig(版本 r0.9.2)如何处理空值的否定。我有这样的表达:

nonEmpty = FILTER dataFields BY NOT IsEmpty(children);

如果 children 为 null，IsEmpty 函数将返回 null - 所以让我感到困惑的是 NOT 运算符的行为方式，因为我会有这样的表达式:

nonEmpty = FILTER dataFields BY NOT NULL;

pig latin r0.9.2 的文档接下来说: “Pig 不支持 bool 数据类型。但是， bool 表达式(包含 bool 和比较运算符的表达式)的结果始终为 bool 类型(真或假)。” 这只会让我完全困惑。

提前感谢您的帮助。

最佳答案

无论如何，测试 NULL 是否为空可能不是一个好主意。事实上，我在 0.10.0 上试过了，它抛出了一个错误，说明了这一点。相反，过滤非空且非空:

nonEmpty = FILTER dataFields BY (children IS NOT NULL) AND (NOT IsEmpty(children));

关于hadoop - Pig 如何处理否定空值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12302687/

何处 hadoop section code children null apache-pig negate

有关hadoop - Pig 如何处理否定空值？的更多相关文章

ruby-on-rails - Enumerator.new 如何处理已通过的 block ？ - 2
我在理解Enumerator.new方法的工作原理时遇到了一些困难。假设文档中的示例:fib=Enumerator.newdo|y|a=b=1loopdoy[1,1,2,3,5,8,13,21,34,55]循环中断条件在哪里，它如何知道循环应该迭代多少次(因为它没有任何明确的中断条件并且看起来像无限循环)？最佳答案 Enumerator使用Fibers在内部。您的示例等效于:require'fiber'fiber=Fiber.newdoa=b=1loopdoFiber.yieldaa,b=b,a+bendend10.times.m
hadoop安装之保姆级教程（二）之YARN的配置 - 2
1.1.1 YARN的介绍为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的，针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜，提出了全新的资源管理框架YARN. ApacheYARN（YetanotherResourceNegotiator的缩写）是Hadoop集群的资源管理系统，负责为计算程序提供服务器计算资源，相当于⼀个分布式的操作系统平台，⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现，但是因为具有⾜够的通⽤性，同样可以⽀持其他的分布式计算模
ruby-on-rails - 如何处理 Grape 中特定操作的过滤器之前？ - 2
我正在我的Rails项目中安装Grape以构建RESTfulAPI。现在一些端点的操作需要身份验证，而另一些则不需要身份验证。例如，我有users端点，看起来像这样:moduleBackendmoduleV1classUsers现在如您所见，除了password/forget之外的所有操作都需要用户登录/验证。创建一个新的端点也没有意义，比如passwords并且只是删除password/forget从逻辑上讲，这个端点应该与用户资源。问题是Grapebefore过滤器没有像except,only这样的选项，我可以在其中说对某些操作应用过滤器。您通常如何干净利落地处理这种情况？
Ruby - 如何处理子类意外覆盖父类(super class)私有(private)字段的问题？ - 2
假设您编写了一个类Sup，我决定将其扩展为SubSup。我不仅需要了解你发布的接口(interface)，还需要了解你的私有(private)字段。见证这次失败:classSupdefinitialize@privateField="fromsup"enddefgetXreturn@privateFieldendendclassSub问题是，解决这个问题的正确方法是什么？看起来子类应该能够使用它想要的任何字段而不会弄乱父类(superclass)。编辑:equivalentexampleinJava返回"fromSup"，这也是它应该产生的答案。最佳答案
ruby-on-rails - 我如何处理 View 中的 nils？ - 2
我设置了以下模型:classContact:no_freq?validates_presence_of:freq,:if=>:no_band?protecteddefno_freq?freq.nil?enddefno_band?band.nil?endendclassBand当我在我的新View中输入频率时，如果输入了频率，则不允许指定波段。这在我的其他观点中造成了问题，因为band现在为零。我如何允许不指定band并在我的index和showView中显示为空，然后在editView中允许在以后指定一个。通过执行以下操作，我已经能够让我的索引显示空白:contact.band&&co
ruby - 如何处理树顶左递归 - 2
我有一个grammarfile对于我正在尝试构建的一种新的通用编程语言。我正在努力使该语言健壮且易于使用(它深受Ruby等启发)，为此我引入了一些左递归规则。我看到一些例子似乎表明了以下左递归规则:rulel_recursel_recurse/'somethingelse'end可以通过将其更改为非左递归:ruler_recurse'somethingelse'/r_recurseend对我来说，这看起来会有不同的问题并且仍然会失败。我是对的，还是这会“奏效”？我试图(查找和)消除的特定左递归可以在这个grammarfile中找到.我不确定哪些规则受到影响，但至少somewerepoi
ruby - Ruby 如何处理嵌套类的继承？ - 2
在下面的测试用例中:classPackageclassComponentdefinitializep[:initialize,self]endendendclassPackage_A结果:[:initialize,#]#[:initialize,#]#如何获取特定的Package_A.component和Package_B.component？最佳答案 ClassComponent是在Package中声明的，所以看起来是正确的。::指示在Package_A范围内查找名称Component。由于那里没有Component，它会查找父
c - 如何处理 ruby ffi gem 中的 ruby 数组？ - 2
我想使用rubyffigem调用一个c函数，该函数将一个数组作为输入变量，输出是一个数组。也就是说，c函数看起来像:double*my_function(doublearray[],intsize)我创建了ruby绑定(bind):moduleMyModuleextendFFI::Libraryffi_lib'c'ffi_lib'my_c_lib'attach_function:my_function,[:pointer,int],:pointer我想用ruby代码调用:result_array=MyModule.my_function([4,6,4],3)我该怎么做？
大数据之Hadoop数据仓库Hive - 2
目录：一、简介二、HQL的执行流程三、索引四、索引案例五、Hive常用DDL操作六、Hive常用DML操作七、查询结果插入到表八、更新和删除操作九、查询结果写出到文件系统十、HiveCLI和Beeline命令行的基本使用十一、Hive配置一、简介Hive是一个构建在Hadoop之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类SQL查询功能，用于查询的SQL语句会被转化为MapReduce作业，然后提交到Hadoop上运行。特点：简单、容易上手(提供了类似sql的查询语言hql)，使得精通sql但是不了解Java编程的人也能很好地进行大数据分析；灵活性高，可以自定义用户函数(UDF)和
ruby - Smalltalk 如何处理 monkeypatching？ - 2
我是一名Ruby程序员。对我来说，monkeypatching是在运行时更改外部项目中的类或模块方法。我感兴趣的是，您有什么机制可以保护您免受某些滥用该优良特性的影响。以下是我遇到的一些场景，其中monkeypatching让我很头疼。虽然我根本不知道Smalltalk，但这种语言早在Ruby出现之前就已经存在了。我做了一些研究，看看Smalltalk是否以及如何解决其中的一些问题，但在Google上没有找到太多。所以我在这里，询问Smalltalkers是否可以分享他们的智慧。场景A:bug修复冲突项目A和B依赖于项目C。项目C有一个错误。项目A和B版本包含对项目C的修复。如果您的代

hadoop - Pig 如何处理否定空值？

有关hadoop - Pig 如何处理否定空值？的更多相关文章

随机推荐