天天看點

資料分析04|資料分析基本概念

假如你是幾年前開始接觸資料分析,将會被告知資料分析就像廚師炒菜,按照菜單(設計方案)采購食材(資料采集),然後是洗菜(資料處理),接着是下鍋烹饪(資料分析),經過打荷(資料展現)後最終端菜上桌(撰寫報告)。這也是資料分析的正常流程,而括号内的概念是每個入門資料分析人員要務必掌握的基本概念,至少要能了解這些步驟分别代表什麼、能實作什麼功能以及具體如何實作。

不過自從大資料概念進入廣泛應用後,資料分析行業有了一次大的調整。雖然底層邏輯變化不大,基本流程還是“炒菜”,但是随着技術的更新換代以及業務需求的變化,這個“炒菜”的平台已由過去的“竈台”變成了現在的流水線。菜單更加注重特色化與定制化,在不同地域、不同季節、不同時段向擁有不同特征人群推薦人們可能喜歡的菜單(商業智能),食材來自全球購(海量資料),面對大量食材首先要解決存儲問題(資料倉庫),根據菜單先做個大概的了解(資料探索)。然後根據收集的資訊按照客戶的口味進行一定取舍(資料預處理),食材熱性、溫性、平性、涼性、寒性有之分、烹饪方法炒、爆、熘、炸、烹、煎之别(中繼資料),不同性質的食材運用不同的烹饪方法做出各種各樣的菜肴(資料元)。菜肴太多了不知道吃哪樣,流水線會根據天氣情況結合客戶過去的用餐習慣甚至是目前心情、健康狀态進行推薦(資料挖掘)。你可能會想有這麼神奇嗎?流水線是如何做到的,這又要涉及計算(分類算法)。到這兒,你可能已經暈乎乎了,想着吃個飯這麼麻煩嗎?當然不是,這一切都是在你看不到的層面自動進行的,展現在你面前的(資料可視化)永遠是幹淨清爽的界面,你隻需輕輕一點即可。

通過以上對比你會發現,随着技術的發展和需求的變化,資料分析所涉及的知識概念以及手段工具更加多樣,而學習掌握這項技能所需要付出的時間精力也自然“水漲船高”,同時資料分析這項技術也越來越朝着體系化學科方向發展,資料科學與大資料技術也逐漸蔚然成觀。是以,前路漫漫需要學習和掌握的東西有很多,眼前這些基本概念隻是剛剛開始。

下面這張導圖可以幫助你将上述例子中涉及到的一些資料分析基本概念串聯起來:

資料分析04|資料分析基本概念

繼續閱讀