hadoop&spark安装（下）

上一遍文章中其实最主要的就是JAVA环境变量以及hadoop环境变量的设置，这两个设置好了的话，运行hadoop基本上不会出问题。

在hadoop的基础上安装spark好简单。

安装Spark之前需要先安装Hadoop集群，因为之前已经安装了hadoop，所以我直接在之前的hadoop集群上安装spark。

硬件环境：

hddcluster1 10.0.0.197 redhat7

hddcluster2 10.0.0.228 centos7 这台作为master

hddcluster3 10.0.0.202 redhat7

hddcluster4 10.0.0.181 centos7

软件环境：

scala-2.11.7

spark-2.0.2-bin-hadoop2.7.tgz

#所有操作用hadoop

基本流程：

1、master解压scala-2.11.7和spark-2.0.2-bin-hadoop2.7.tgz到相应的目录

2、配置scala和spark环境变量

3、修改配置文件

4、拷贝scala和spark到各个节点，授权

5、启动spark集群

<code>#hadoop用户下操作，下载scala,安装</code>

<code>wget http:</code><code>//downloads</code><code>.lightbend.com</code><code>/scala/2</code><code>.11.7</code><code>/scala-2</code><code>.11.7.tgz</code>

<code>tar</code> <code>-zxvf scala-2.11.7.tgz </code>

<code>mv</code> <code>scala-2.11.7 </code><code>/usr/local/scala</code>

<code>sudo</code> <code>mv</code> <code>scala-2.11.7 </code><code>/usr/local/scala</code>

<code>vim .bashrc </code><code>#添加</code>

<code>export</code> <code>SCALA_HOME=</code><code>/usr/local/scala</code>

<code>export</code> <code>PATH=$PATH:$HADOOP_HOME</code><code>/sbin</code><code>:$HADOOP_HOME</code><code>/bin</code><code>:$SCALA_HOME</code><code>/bin</code>

<code>source</code> <code>.bashrc</code>

<code>[hadoop@hddcluster2 ~]$ scala -version</code>

<code>#在官网下载spark-2.0.2-bin-hadoop2.7.tgz</code>

<code>tar</code> <code>-zxvf spark-2.0.2-bin-hadoop2.7.tgz</code>

<code>mv</code> <code>spark-2.0.2-bin-hadoop2.7 spark</code>

<code>sudo</code> <code>mv</code> <code>spark </code><code>/usr/local/</code>

<code>vim .bashrc </code><code>#添加</code>

<code>export</code> <code>SPARK_HOME=</code><code>/usr/local/spark</code>

<code>export</code> <code>PATH=$PATH:$HADOOP_HOME</code><code>/sbin</code><code>:$HADOOP_HOME</code><code>/bin</code><code>:$SCALA_HOME</code><code>/bin</code><code>:$SPARK_HOME</code>

<code>#修改spark配置文件</code>

<code>cd</code> <code>/usr/local/spark/conf</code>

<code>cp</code> <code>spark-</code><code>env</code><code>.sh.template spark-</code><code>env</code><code>.sh</code>

<code>vi</code> <code>spark-</code><code>env</code><code>.sh </code><code>#添加下面内容</code>

<code>export</code> <code>JAVA_HOME=</code><code>/usr/lib/jvm/java-1</code><code>.8.0-openjdk-1.8.0.111-2.b15.el7_3.x86_64</code>

<code>###scala dir</code>

<code>###the ip of master node of spark</code>

<code>export</code> <code>SPARK_MASTER_IP=10.0.0.228</code>

<code>###the max memory size of worker</code>

<code>export</code> <code>SPARK_WORKER_MEMORY=8G</code>

<code>###hadoop configuration file dir</code>

<code>export</code> <code>HADOOP_CONF_DIR=</code><code>/usr/local/hadoop/etc/hadoop/</code>

<code>#修改slave</code>

<code>cp</code> <code>slaves.template slaves</code>

<code>vi</code> <code>slaves </code><code>#把localhost改为下面内容</code>

<code>hddcluster1</code>

<code>hddcluster2</code>

<code>hddcluster3</code>

<code>hddcluster4</code>

<code>#把/usr/local/spark 和 /usr/local/scala打包，然后复制到slave节点、</code>

<code>cd</code> <code>/usr/local</code>

<code>tar</code> <code>-zcf ~</code><code>/master</code><code>.spark.</code><code>tar</code><code>.gz .</code><code>/spark</code>

<code>tar</code> <code>-zcf ~</code><code>/master</code><code>.scala.</code><code>tar</code><code>.gz .</code><code>/scala</code>

<code>scp</code> <code>master.spark.</code><code>tar</code><code>.gz hddcluster1:~</code>

<code>scp</code> <code>master.scala.</code><code>tar</code><code>.gz hddcluster1:~</code>

<code>#登录各个节点进行解压到/usr/local</code>

<code>tar</code> <code>-zxf master.spark.</code><code>tar</code><code>.gz -C </code><code>/usr/local/</code>

<code>tar</code> <code>-zxf master.scala.</code><code>tar</code><code>.gz -C </code><code>/usr/local/</code>

<code>chown</code> <code>-R hadoop:hadoop </code><code>/usr/local/spark</code>

<code>chown</code> <code>-R hadoop:hadoop </code><code>/usr/local/scala</code>

<code>再配置.bashrc环境变量和master的一样。</code>

<code>加上hadoop上一篇的.bashrc内容是这样子：</code>

<code>#scala</code>

<code>#spark</code>

<code>#java and hadoop</code>

<code>export</code> <code>HADOOP_HOME=</code><code>/usr/local/hadoop</code>

<code>export</code> <code>HADOOP_INSTALL=$HADOOP_HOME</code>

<code>export</code> <code>HADOOP_MAPRED_HOME=$HADOOP_HOME</code>

<code>export</code> <code>HADOOP_COMMON_HOME=$HADOOP_HOME</code>

<code>export</code> <code>HADOOP_HDFS_HOME=$HADOOP_HOME</code>

<code>export</code> <code>YARN_HOME=$HADOOP_HOME</code>

<code>export</code> <code>HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME</code><code>/lib/native</code>

<code>export</code> <code>HADOOP_PREFIX=$HADOOP_HOME</code>

<code>export</code> <code>HADOOP_OPTS=</code><code>"-Djava.library.path=$HADOOP_PREFIX/lib:$HADOOP_PREFIX/lib/native"</code>

<code>到此Spark集群搭建完毕</code>

<code>.启动Spark集群：</code>

<code>启动Spark之前需要先将hadoop的dfs以及yarn启动。</code>

<code>/usr/local/spark/sbin/start-all</code><code>.sh</code>

<code> </code><code>启动所有服务之后，在命令行输入jps:</code>

<code>[hadoop@hddcluster2 ~]$ jps</code>

<code>29601 ResourceManager</code>

<code>32098 SparkSubmit</code>

<code>29188 DataNode</code>

<code>29364 SecondaryNameNode</code>

<code>29062 NameNode</code>

<code>29915 NodeManager</code>

<code>30251 Master</code>

<code>30380 Worker</code>

<code>30062 JobHistoryServer</code>

<code> </code><code>比hadoop集群启动时多了Master和worker</code>

<code>/usr/local/spark/bin/spark-shell</code><code>.sh</code>

<code>出现scala>时说明成功。</code>

<code>在浏览器中输入10.0.0.228:8080时，会看到如下图，有4个Worker</code>

本文转自 yanconggod 51CTO博客，原文链接:http://blog.51cto.com/yanconggod/1885082

hadoop&spark安装（下）

继续阅读

Java小案例——随机数猜测随机数猜测

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method

hadoop&amp;spark安装（下）

继续阅读

hadoop&spark安装（下）