所以我有一个包含三个节点的Hadoop集群。Vertica位于集群上。HDFS上有Parquet文件(由Hive分区)。我的目标是使用Vertica查询这些文件。现在我所做的是使用HDFS连接器,基本上是在Vertica中创建一个外部表,然后将其链接到HDFS:CREATEEXTERNALTABLEtableName(columns)ASCOPYFROM"hdfs://hostname/...../data"PARQUET;由于数据量很大。这种方法不会获得良好的性能。我做了一些研究,VerticaHadoopIntegration我已经尝试过HCatalog,但我的Hadoop上存在一