《大資料架構詳解:從資料擷取到深度學習》這本書從2016年10月出版以來,一直在重印,早就超過3萬本,在大資料和雲計算專業領域裡面賣的還可以的,多謝各位讀者和朋友們的厚愛。對大資料技術有學習訴求的同學推薦可以買來看看,相信會有收獲。
當能我看到本書出版2年多來,大資料技術和市場都發生了翻天覆地的變化,給我們帶來了非常多新的啟示。
技術上,我們各類技術上的逐漸成熟,機器學習和人工智能技術逐漸重歸平靜,但是在越來越多的城市大腦,智能家居,供應鍊優化上找到真正的場景。2年前我們看到的平台融合趨勢變得越發明顯,比如資料庫領域的越來越多融合分布式的思路,事務不在是傳統關系型資料庫的标配,像mongodb,dynamodb都開始支援事務。技術再發展和融合,元件的能力越來越強,創新進入深水區,和使用場景的深度結合,是未來的發展趨勢之一。
市場上,我們看到包括最近的databricks都已經估值超過27.5億美金,flink被阿裡收購。雲計算的商業能力越來越被重視,aws一年的收入大概有300億美金,不再是other的業務。微軟也通過雲計算賽道重回巅峰。國内巨頭阿裡、騰訊、百度、華為都紛紛發力雲計算,還有一些垂直領域滴滴,京東,美團,平安應該是明确不進入公有雲市場,但是在擅長的專有領域繼續發光發熱。
此書出版以來,根據讀者的意見修訂了2次,但是作為從業者,新的技術和市場的變化,我越發覺得有必要完全再版一下此書,增加一些新的内容,讓内容與時俱進,拿出更豐富的内容給到我們讀者。當能預計再版出來大概預計需要1年時間,在這之前也希望大家繼續支援這本書。
新版本初步的修訂思路
1、技術更新,包括spark,kafka,flink等新技術發展。
2、給出各種元件的綜合選型思路,資料庫和大資料技術背後本質的差別。
3、增加雲化比例,包括和雲結合技術,以及雲使用案例。
4、增加es/mongodb/redis等原來未涉及的nosql領域。
5、增加新一代資料庫aurora等關鍵技術解析。
6、增加使用具體案例,如金融、交通、iot、新零售等關鍵領域。
7、更新機器學習/深度學習技術,包含更多的關鍵技術和落地場景。
看過我的書的同學,更多的建議和意見,大家也可以提給我,優秀建議采納之後,新書出版之後,承諾送上一本新版本的書。謝謝大家!