我正在使用HanaExpress2SP01的VM。在一个小测试群集上,我安装了SPARK1.6.3的HortonworksDataPlatform2.6,还添加了HanaVora1.4和SparkController2.1。我遵循SAPVora安装和管理指南:https://help.sap.com/http.svc/rc/f09ec811fe634f588647c342cac342cac84c38/1.4/en-en-us/sap_vora_installation_installation_admin_admin_guide_guide_1.1.1.1.1.1.1.1.1.1.1.en.e
我有一个要求,我必须将数据从Hadoop加载到SAPHana。我已经使用MySql、DB2和其他一些带有Spark的RDBMS,并使用HSBCSparkDataframeAPI在1.5.0及更高版本中加载,也使用Cassandra和Hive但不是Hana。是否可以在不对Hana进行任何修改的情况下这样做不能以任何方式接触Hana安装的一面。 最佳答案 如果您更愿意留在Hadoop端,则可以使用Sqoop。带有Hive适配器的SAPBusinessObjects数据服务也能正常工作。 关于
谁能解释一下SAPHANA和SAPHANAVora的智能数据访问之间的区别?据我了解,SDA只是创建了一些虚拟表,可以像这样访问外部系统(如Hadoop和许多其他ODBC数据库)的数据将成为SAPHANA系统的一部分(因此您可以使用HANAIDE)并使用“默认数据库引擎”计算并将此外部系统的子结果返回给SAPHANA。Vora的概念也是让SAP用户访问Hadoop系统,但是子结果是使用ApacheSpark的InMemory执行引擎计算的。我读到Hadoop是冷数据的完美数据存储(来自SAPHANA的数据早于特定时间段并且并非所有分析都需要)。但是我对这两种数据访问解决方案感到困惑,因
我正在使用带有HANAExpress2SP01的虚拟机。在一个小型测试集群上,我安装了HortonworksDataPlatform2.6和Spark1.6.3,还添加了HANAVora1.4和SparkController2.1。我遵循了SAPVora安装和管理指南:https://help.sap.com/http.svc/rc/f09ec811fe634f588647c342cac84c38/1.4/en-US/SAP_Vora_Installation_Admin_Guide_1.4_en.pdf直到第2.9章。一切正常,但Zeppelin部分与%jdbc解释器:%jdbcse
我已经使用SAPVora1.4补丁4部署了一个clouderaCDH5.13.1集群。当我启动Vorathrift服务器时,一切看起来都很好,但是一旦我启动SAPVora工具并登录,就会出现以下错误:17/12/2011:26:52ERRORthriftserver.SparkExecuteStatementOperation:Errorexecutingquery,currentStateRUNNING,org.apache.spark.sql.catalyst.errors.package$DialectException:Instantiatingdialect'sapsql'f
根据文档SAP_Vora_Installation_Admin_Guide_2.0_en.pdf,需要运行Hadoop/Spark集群和运行Kubernetis集群。现在我的问题是,为什么需要这个Hadoop/Spark集群?因为SAPVora可以从HDFS、WebHDFS等读取。如果您有一个Spark作业,您是否可以在Spark集群上运行它,如果它需要来自HANA/Vora的数据,它可以访问它吗?还是Vora也使用Spark集群来处理数据?因为现在看起来Spark可以使用Vora但Vora不能使用Spark(VoraUI工具,如SQL编辑器等)。因为你可以附加到Vora上的Zeppe
我有一个版本为2SP01的HANAExpress服务器和一个带有HortonworksDataPlatform2.6的Hadoop集群。在Hadoop集群上,我安装了Vora1.4和SparkController2.1.1。我看到了以下视频,其中解释了从一个HANA版本到另一个版本的更改:https://www.youtube.com/watch?v=-B9LUjt8x2s&list=PLkzo92owKnVxweu0HK_3QjCfHiMn0jIcA%E2%88%88dex=66在SPS10中,SparkController似乎是HANA/Hadoop交互的实际连接器。但是,有没有可