jjzjj

hivexmlserde

全部标签

xml - 解析 XML 并存储在 Hive 表中

我正在使用XPath通过pig解析XML,但在我的用例中我必须解析整个xml文件并将其移动到hive表。我正在考虑使用XPath来解析XML文件,而不是使用pig将解析后的数据移动到配置单元表。但是有没有其他方法可以做到这一点? 最佳答案 我们可以使用hivexmlserde在Hive中解析XML文件。使用hivexmlserde创建一个外部Hive表,并将所有xml文件放在该xml位置(所有xml文件应该相似)。使用此serde,您需要在创建表语句和要获取的属性的XPath中定义开始和结束标记。请看下面的例子。addjar/hom