一、概述
本文针对想学习大数据技术从事大数据开发的人员总结了一套专业的学习路线图。大体可以分为以下个阶段七个阶段:入门知识学习阶段 → 基础程序语音学习 → Hadoop生态体系学习 → 分布式计算框架(Spark核心技术) → 实时计算框架 → 大数据常用组件学习 → 大数据项目实战。
在后续的文章中,我将陆续将各个阶段的学习资料和教程进行整理和发布。希望大家通过我文章的引导加上自身的学习新手小伙伴能够快速的熟悉大数据体系,有一定经验的程序猿们也能对自己的知识体系进行一便梳理。
二、入门知识学习阶段
该阶段主要对新手学习人员进行一些基础编程知识进行普及,了解最基础的开发环境组件。
详细学习内容:
1.linux体系学习
2.Git 实战教程
3.MySQL 基础课程
4.MongoDB 基础教程
5.Redis基础教程
三、基础程序语言学习
1.SQL语句学习
2.JAVA基础
3.J2EE开发
4.Scala基础
四、Hadoop生态体系学习
本阶段学习hadoop生态体系的基础知识,包括hdfs,Mapreduce,Hive,Hbase,Zookeeper等等
五、分布式计算框架(Spark核心技术)
本阶段将深入学习目前主流的分布式计算框架spark
六、实时计算框架
1.消息系统:Kafka
2.spark-streaming
3.storm
4.Flink
七、大数据常用组件学习
1.日志收集:Flume
2.数据同步:Sqoop
3.任务调度:Oozie,azkaban
4.搜索和数据分析引擎:ElasticSearch
5.数据挖掘、机器学习
八、大数据项目实战
以上全部学习完就可以找一些实战项目来演练学习下了!目前初步想到的实战项目有网站数据分析BI、用户画像、数据仓库构建等等,后面我会选择几个合适的项目整理成笔记和大家一起分享。