Spark的伪分布安装和wordcount测试一：环境说明二：hadoop伪分布安装三：Scala安装四：Spark安装六：Spark的WordCount实例

2016-06-10 23:50:00

基于hadoop2.6伪分布的Spark安装和wordcount测试

Ubuntu：15.10（不稳定版，建议安装在稳定版，Ubuntu下XX..4是稳定的）

Hadoop：2.6

Scala：2.11.8

Java：1.7.0

Spark：1.6.1

解压到指定目录：tar zxvf scala-2.11.8.tgz -C /usr/local/

进入/usr/local/：cd /usr/local

重命名为scala：mv scala-2.11.8 scala

配置环境变量：sudo vim /etc/profile

加入如下信息：

退出保存：source /etc/profile

命令行输入scala -versiom，显示如下

Spark的伪分布安装和wordcount测试一：环境说明二：hadoop伪分布安装三：Scala安装四：Spark安装六：Spark的WordCount实例

使用时只需要输入scala即可，退出时输入 :quit

tar zxvf spark-1.6.1-bin-hadoop2.6.tgz -C /usr/local/hadoop

重命名为spark(个人习惯):sudo mv spark-1.6.1-bin-hadoop2.6 spark

sudo vim /etc/profile

输入以下：

加入以下代码(注意 java，hadoop，scala，spark要根据自己的目录来)：

<code> cp slaves.template slaves</code>

<code> vim slaves</code>

添加以下代码（默认就是localhost）：

启动spark-master.sh

cd $SPARK_HOME/sbin

./start-master.sh

启动Spark Slave

./start-slaves.sh(注意是slaves)

进入spark-shell界面

进入spark目录下的bin目录，执行：./spark-shell

......

(是不是和scala的shell一样呀)

1：上传Spark目录下的README.txt到hdfs上，例如我这里的存放为 /mr/spark/test （test是个文件，内容同README.txt一致）

2：用第五步的命令进入spark-shell

执行：val file=sc.textFile("hdfs://172.16.48.202:9000/mr/spark/README.txt")

val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)

count.collect()

每一步的执行结果为：

最终的运行结果为：

Spark的伪分布安装和wordcount测试一：环境说明二：hadoop伪分布安装三：Scala安装四：Spark安装六：Spark的WordCount实例

继续阅读

ACS基本配置-权限等级管理

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

JBoss,Geronimo和Glassfish初窥

scala (3) Function 和 Method