spark从入门到放弃十三:spark 三种提交模式

2023-05-27 16:52:09

文章地址：http://www.haha174.top/article/details/257573

一.Standalone 模式基于spark自己的 Master-Worker 集群。

就是之前的 spark-submit 提交的方式这里不再详细叙述。如果不清楚可以看这篇文章如果要切换成第二种，第三种模式。将之前的submit脚本添加上–master 参数设置为yarn-cluster 或yarn-client 即可。如果没有设置就是Standalone 模式。

二.基于YARN的yarn-cluster 模式

spark从入门到放弃十三:spark 三种提交模式

1.当我们使用spark submit 提交到yarn-cluster .此时发送请求到 ResourceManager 。请求启动applicationMaster。applicationMaster启动后会向ResourceManager 请求container，ResourceManager接受到这个请求后会分配一个container.

2.然后在某个NodeManager上启动ApplicationMaster.ApplicationMaster（相当于driver）启动后会去和ResourceManager进行通信请求container 。

3.此时ResourceManager 会给 ApplicationMaster 分配一定量的 container 去启动executer.然后ApplicationMaster去连接其他的NodeManager。来启动executer。然后executer 启动后向ApplicationMaster反向注册。

三.基于YARN的yarn-client 模式

spark从入门到放弃十三:spark 三种提交模式

1.当我们使用spark submit 提交到yarn-client .本地会启动一个driver进程同时发送请求到 ResourceManager 。请求启动ExecutorLanucher。ExecutorLanucher启动后会向ResourceManager请求 container，ResourceManager接受到这个请求后会分配一个container.

2.然后在某个NodeManager上启动ExecutorLanucher(其实类似与上文中的ApplicationMaster，但是功能有限,不同点在1，3) .ExecutorLanucher启动后会去和ResourceManager进行通信请求container 。

3.此时ResourceManager 会给 ApplicationMaster 分配一定量的 container 去启动executer.然后ExecutorLanucher去连接其他的NodeManager。来启动executer。但是executer 启动后向spark 本地的driver进程反向注册。

总结：yarn-client 用于调试 driver 启动在本地。本地可以看到log 方便调试。

而且本地调度会产生大量的网卡流量。

yarn-cluster 一般用于生产。但是调试不方便。

使用yarn 需要在spark-env.sh 中添加Hadoop home

欢迎关注，更多福利

spark从入门到放弃十三:spark 三种提交模式

spark从入门到放弃十三:spark 三种提交模式

欢迎关注，更多福利

继续阅读

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

NOSQL安全攻击

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method