Spark 下载安装配置详解文档 (spark-2.4.8-bin-hadoop2.7.tgz)

BigData_001_Lz 2024-06-05 原文

下载安装配置spark:
官网地址：https://archive.apache.org/dist/spark/

上传spark-2.4.8-bin-hadoop2.7.tgz
解压tar -zxvf spark-2.4.8-bin-hadoop2.7.tgz -C /opt/moudel/
重命名mv spark-2.4.8-bin-hadoop2.7 spark-2.4.8
配置环境变量 vim /etc/profile
#SPARK_HOME
export SPARK_HOME=/opt/moudel/spark-2.4.8
export PATH=$PATH:$SPARK_HOME/bin

执行source /etc/profile使命令生效

以下在master节点进行
进入/usr/local/spark-2.4.8-bin-hadoop2.7/conf
vi workers
workers内容为：
192.168.10.131
192.168.10.132

修改spark-defaults.conf
cp spark-defaults.conf.template spark-defaults.conf
vi spark-defaults.conf
添加：
#Spark主节点所在机器及端口
spark.master spark://192.168.10.130:7077
#是否打开任务日志功能
spark.eventLog.enabled true
#任务日志默认存放位置
spark.eventLog.dir hdfs://192.168.10.130:8020/spark-logs
#存放历史应用日志文件的目录
spark.history.fs.logDirectory hdfs://192.168.10.130:8020/spark-logs

修改spark-env.sh
cp spark-env.sh.template spark-env.sh
vi spark-env.sh
spark webui与Zookeeper有端口冲突，修改为8085
添加：
JAVA_HOME=/usr/java/jdk1.8.0_281-amd64
HADOOP_CONF_DIR=/usr/local/hadoop-3.1.4/etc/hadoop
SPARK_MASTER_IP=master
SPARK_MASTER_WEBUI_PORT=8085
SPARK_MASTER_PORT=7077
SPARK_WORKER_MEMORY=512m
SPARK_WORKER_CORES=1
SPARK_EXECUTOR_MEMORY=512m
SPARK_EXECUTOR_CORES=1
SPARK_WORKER_INSTANCES=1

启动集群，在HDFS中新建目录：
hdfs dfs -mkdir /spark-logs

将Spark安装包分发到其他节点
scp -qr /opt/moudel/spark-2.4.8-bin-hadoop2.7/ slave1:/opt/moudel/
scp -qr /opt/moudel/spark-2.4.8-bin-hadoop2.7/ slave2:/opt/moudel/

启动spark
进入/opt/moudel/spark-2.4.8/sbin
执行
./start-all.sh

查看客户端
http://master:8085

关闭spark集群
./stop-all.sh

详解 bin-hadoop spark br 大数据 hadoop

有关Spark 下载安装配置详解文档 (spark-2.4.8-bin-hadoop2.7.tgz)的更多相关文章

hadoop安装之保姆级教程（二）之YARN的配置 - 2
1.1.1 YARN的介绍为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的，针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜，提出了全新的资源管理框架YARN. ApacheYARN（YetanotherResourceNegotiator的缩写）是Hadoop集群的资源管理系统，负责为计算程序提供服务器计算资源，相当于⼀个分布式的操作系统平台，⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现，但是因为具有⾜够的通⽤性，同样可以⽀持其他的分布式计算模
ruby - 如何修复 RVM gem "[ missing bin/ruby ]" - 2
执行rvmlist后，我得到以下输出:rvmrubiesgems[missingbin/ruby]=*ruby-2.0.0-p645[x86_64]ruby-2.1.6[x86_64]ruby-2.2.1[x86_64]gems[missingbin/ruby]是什么意思？gems是某种系统gemset吗？它不是我创建的，我不知道我是否可以或应该删除它。最佳答案在我跑完之后:rvmfix-permissions然后我能够卸载具有[缺少bin/ruby]的版本。关于ruby-如何修复
物联网MQTT协议详解 - 2
一、什么是MQTT协议MessageQueuingTelemetryTransport：消息队列遥测传输协议。是一种基于客户端-服务端的发布/订阅模式。与HTTP一样，基于TCP/IP协议之上的通讯协议，提供有序、无损、双向连接，由IBM（蓝色巨人）发布。原理：（1）MQTT协议身份和消息格式有三种身份：发布者（Publish）、代理（Broker）（服务器）、订阅者（Subscribe）。其中，消息的发布者和订阅者都是客户端，消息代理是服务器，消息发布者可以同时是订阅者。MQTT传输的消息分为：主题（Topic）和负载（payload）两部分Topic，可以理解为消息的类型，订阅者订阅（Su
Tcl脚本入门笔记详解（一） - 2
TCL脚本语言简介•TCL（ToolCommandLanguage）是一种解释执行的脚本语言（ScriptingLanguage）,它提供了通用的编程能力：支持变量、过程和控制结构；同时TCL还拥有一个功能强大的固有的核心命令集。TCL经常被用于快速原型开发，脚本编程，GUI和测试等方面。•实际上包含了两个部分：一个语言和一个库。首先，Tcl是一种简单的脚本语言，主要使用于发布命令给一些互交程序如文本编辑器、调试器和shell。由于TCL的解释器是用C\C++语言的过程库实现的，因此在某种意义上我们又可以把TCL看作C库，这个库中有丰富的用于扩展TCL命令的C\C++过程和函数，所以，Tcl是
ruby-on-rails - 'bin'中的 '$ bin/rails?'是什么意思 - 2
我试图按照“引擎入门”Rails指南的教程进行操作，发现了这个:$bin/railspluginnewblorgh--mountable当我在我的终端上输入这个时，我得到:bash:bin/rails:Nosuchfileordirectory当我只尝试$rails时，它工作正常。几个月来我一直在使用命令行，还有Rails。我知道$符号，但我对之后“bin”的含义感到困惑。我习惯于在$后面输入“Rails”，但本教程说使用“bin”...bin/是什么意思？最佳答案 tl;dr运行bundleinstall--binstubs它将
ruby-on-rails - Ruby on Rails : 4. 2.0 rails 和 bin/rails 的区别 - 2
所以从Rails4.1.x开始，似乎有一种推荐的方法是在应用程序文件夹下使用rails。而不是传统的:railsserverRails官方指南推荐使用bin/railsserver看起来bin/rails正在引用带有附加内容的rails。与rails相比，使用bin/rails的额外好处是什么？第二个问题是——我习惯于使用railsserver、railsconsole等，而不是bin/railsserver、bin/railsconsole。如果不使用bin/rails，我会丢失任何东西吗(比如误加载一些库等)？谢谢。最佳答案
【详解】Docker安装Elasticsearch7.16.1集群 - 2
开门见山|拉取镜像dockerpullelasticsearch:7.16.1|配置存放的目录#存放配置文件的文件夹mkdir-p/opt/docker/elasticsearch/node-1/config#存放数据的文件夹mkdir-p/opt/docker/elasticsearch/node-1/data#存放运行日志的文件夹mkdir-p/opt/docker/elasticsearch/node-1/log#存放IK分词插件的文件夹mkdir-p/opt/docker/elasticsearch/node-1/plugins若你使用了moba，直接右键新建即可如上图所示依次类推创建
【Elasticsearch基础】Elasticsearch索引、文档以及映射操作详解 - 2
文章目录概念索引相关操作创建索引更新副本查看索引删除索引索引的打开与关闭收缩索引索引别名查询索引别名文档相关操作新建文档查询文档更新文档删除文档映射相关操作查询文档映射创建静态映射创建索引并添加映射概念es中有三个概念要清楚，分别为索引、映射和文档（不用死记硬背，大概有个印象就可以）索引可理解为MySQL数据库；映射可理解为MySQL的表结构；文档可理解为MySQL表中的每行数据静态映射和动态映射上面已经介绍了，映射可理解为MySQL的表结构，在MySQL中，向表中插入数据是需要先创建表结构的；但在es中不必这样，可以直接插入文档，es可以根据插入的文档（数据），动态的创建映射（表结构），这就
大数据之Hadoop数据仓库Hive - 2
目录：一、简介二、HQL的执行流程三、索引四、索引案例五、Hive常用DDL操作六、Hive常用DML操作七、查询结果插入到表八、更新和删除操作九、查询结果写出到文件系统十、HiveCLI和Beeline命令行的基本使用十一、Hive配置一、简介Hive是一个构建在Hadoop之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类SQL查询功能，用于查询的SQL语句会被转化为MapReduce作业，然后提交到Hadoop上运行。特点：简单、容易上手(提供了类似sql的查询语言hql)，使得精通sql但是不了解Java编程的人也能很好地进行大数据分析；灵活性高，可以自定义用户函数(UDF)和
最强Http缓存策略之强缓存和协商缓存的详解与应用实例 - 2
HTTP缓存是指浏览器或者代理服务器将已经请求过的资源保存到本地，以便下次请求时能够直接从缓存中获取资源，从而减少网络请求次数，提高网页的加载速度和用户体验。缓存分为强缓存和协商缓存两种模式。一.强缓存强缓存是指浏览器直接从本地缓存中获取资源，而不需要向web服务器发出网络请求。这是因为浏览器在第一次请求资源时，服务器会在响应头中添加相关缓存的响应头，以表明该资源的缓存策略。常见的强缓存响应头如下所述：Cache-ControlCache-Control响应头是用于控制强制缓存和协商缓存的缓存策略。该响应头中的指令如下：max-age：指定该资源在本地缓存的最长有效时间，以秒为单位。例如：Ca

Spark 下载安装配置详解文档 (spark-2.4.8-bin-hadoop2.7.tgz)

有关Spark 下载安装配置详解文档 (spark-2.4.8-bin-hadoop2.7.tgz)的更多相关文章

随机推荐