一、概述
本文針對想學習大資料技術從事大資料開發的人員總結了一套專業的學習路線圖。大體可以分為以下個階段七個階段:入門知識學習階段 → 基礎程式語音學習 → Hadoop生态體系學習 → 分布式計算架構(Spark核心技術) → 實時計算架構 → 大資料常用元件學習 → 大資料項目實戰。
在後續的文章中,我将陸續将各個階段的學習資料和教程進行整理和釋出。希望大家通過我文章的引導加上自身的學習新手小夥伴能夠快速的熟悉大資料體系,有一定經驗的程式猿們也能對自己的知識體系進行一便梳理。
二、入門知識學習階段
該階段主要對新手學習人員進行一些基礎程式設計知識進行普及,了解最基礎的開發環境元件。
詳細學習内容:
1.linux體系學習
2.Git 實戰教程
3.MySQL 基礎課程
4.MongoDB 基礎教程
5.Redis基礎教程
三、基礎程式語言學習
1.SQL語句學習
2.JAVA基礎
3.J2EE開發
4.Scala基礎
四、Hadoop生态體系學習
本階段學習hadoop生态體系的基礎知識,包括hdfs,Mapreduce,Hive,Hbase,Zookeeper等等
五、分布式計算架構(Spark核心技術)
本階段将深入學習目前主流的分布式計算架構spark
六、實時計算架構
1.消息系統:Kafka
2.spark-streaming
3.storm
4.Flink
七、大資料常用元件學習
1.日志收集:Flume
2.資料同步:Sqoop
3.任務排程:Oozie,azkaban
4.搜尋和資料分析引擎:ElasticSearch
5.資料挖掘、機器學習
八、大資料項目實戰
以上全部學習完就可以找一些實戰項目來演練學習下了!目前初步想到的實戰項目有網站資料分析BI、使用者畫像、資料倉庫建構等等,後面我會選擇幾個合适的項目整理成筆記和大家一起分享。