什麼是資料分析?
其實很多做資料分析的人,包括正在做資料分析平台的企業和公司,都很難對資料分析有清晰的認知,經過了十幾年的發展,資料分析這個領域已經摻雜糅合了太多的知識學科,是以造成了很大的謬誤。
其實資料分析相當簡單,我嘗試着自己進行了一次定義:資料分析,是針對某個問題,将擷取後的資料用分析手段加以處理,并發現業務價值的過程。
這句定義中包含了“問題”“擷取”“資料”“分析手段”“業務價值”五個關鍵詞,分别代表了資料分析流程當中的五個層次——“業務需求層”“資料采集層”“資料層”“資料處理層”“輸出層”
問題
資料分析的起點就是問題與目标
目就是眼睛,标就是靶子,也就是用眼睛盯着靶子瞄準,這就是目标思維。也就是說我們一定要知道資料分析的目的是什麼,是為了做什麼事情而分析,是要分析産品功能、還是想要原因診斷。有了目标我們才能搭弓射箭,而不是把時間浪費在應該用什麼弓箭、應該擺什麼姿勢、應該什麼時候射箭這樣的問題上。
擷取
當我們明确了分析的目标之後,下一步工作就是去找資料。
資料采集就是将原始資料從資料庫中取出來,資料分析師在這一步更為重要的工作是搞清楚資料放在哪裡+怎麼把資料取出來這兩件事。
資料
第一種是資料庫資料,包括公司中各個業務系統的資料、系統日志資料、行業資料等。
第二種是資料場景,什麼叫作場景呢?最常見的例子就是資料分析名額體系,比如零售行業當中的“人貨場”體系,其中的人、貨、場三個要素都能組成一種資料場景。
第三種是清洗後的資料,這一步是資料分析當中最耗費時間的工作,幾乎能占到整個過程 60% 的工作量,主要包括髒資料清洗(空資料值、空名額等)、重複資料排除、無效資料剔除等,主要的清洗資料工具有 Excel、FineBI 等。
分析
資料分析,根據實際場景需要可以分為四種:描述分析、統計分析、挖掘分析、模組化分析
舉個最簡單的例子,學校門口賣烤地瓜的攤主告訴你他今天賣了 100 個地瓜,讓你評價一下他的收入怎麼樣。
擁有資料思維的人這個時候應該會問一句“昨天賣了多少”或者“平時都賣多少”,假如他說平時隻賣 50 個,那麼評價就是今天比昨天賣得多,這時很多人就不會繼續深挖資料了。這就是我們平時經常會犯的錯,對比一下資料差異,然後就給個結果出來,抛給上司或者業務人員看,他們自己都能看出來的事情還要資料分析師幹嗎?那麼我們應該怎麼做呢?
首先遵守對比原則,可以分為橫縱向對比、同比環比,橫向對比競争對手、縱向對比自身的差異,比如說與昨天相比今天是否出攤比較早?是否換了出攤的位置?是否隔壁攤位今天沒有來搶生意等。
其次是趨勢分析,大體可以分為周期趨勢、行業趨勢、外部環境趨勢等,比如周期可以取一個星期 / 一個月的資料,最近的銷售額是否一直在增長?是否是地攤的行業整體向好了?外部環境是否允許更多人來買地瓜了,例如學校門口?
然後細分分析,我們可以将烤地瓜的名額進行細分,細分成為銷售個數、單個成本、工作時長或效率等。比如是否是今天的地瓜品質提高了,成本也提高了?是否是工作時長提高了,營業時間提高了?
這時候你就會發現資料中隐藏的很多資訊,比如烤地瓜比昨天賣得多,很可能是因為今天老闆出攤早,也有可能進了一些好吃的地瓜(成本上升帶來銷量的提升),也有可能是某些原因造成今天學生流量大(可能是食堂的飯菜不好吃或者其他原因),甚至有可能是因為今天比昨天冷,路人都想買個熱地瓜吃。
價值
為什麼總是有人抱怨資料分析沒有價值、不能落地?原因很簡單,他們在做分析的時候并沒有關注業務與企業的價值點,是以做出的結果沒有意義。
業務方為什麼會找我們做資料分析?其實就是為了實作業務價值,價值展現在兩點:如何将企業的盈利時間拉長?如何提高機關時間的盈利率?
第一點,盈利時間拉長需要提高使用者的持續黏性,讓使用者和客戶不斷為企業創造價值,簡而言之就是不斷優化使用者體驗,拉長盈利時長;
第二點,需提高企業創造價值的效率,提高機關時間内的盈利率,比如利用資料分析及時監測員工機關産值,進而通過提高人效和産效的方式提高價值效率。