天天看點

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語

本節書摘來華章計算機《資料分析實戰:基于excel和spss系列工具的實踐》一書中的第2章 ,第2.1.2節,紀賀元 著 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

如同資料分析的概念一樣,資料分析的術語也非常多,以下我們挑選一些常用的術語給大家做一些介紹。

1.穩定性和波動性

穩定性和波動性是一對反義詞,在資料分析的很多領域,我們都更關注資料的穩定性,比如,在工業生産領域,我們關心産品品質的穩定程度,都不希望産品品質一會兒好一會兒壞。同樣,在教育領域,我們在評估教學品質時,不僅僅是關注相關名額的高低狀況,也關注資料的穩定程度,例如學生對教學的評分忽高忽低,這裡面一般是有問題的。關于資料的穩定性和波動性,在本書的第6章“資料掃描”中,有詳細的叙述。

2.資料變形

在我們的工作中,經常會碰到資料中存在極值的情況,情況如圖2-9所示。

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語

在圖2-9中,6月份的資料屬于極大值,這個極大值的出現導緻了其他月份的資料被大大壓縮(壓縮在0~10000的狹小區域中了),這使得這些資料之間的互相比較變得比較困難,例如9月份和11月份的資料誰大誰小,單憑肉眼比較難以判斷。

在這種情況下,我們就在想,是否可以把上述的資料進行一個變形,既保留原來資料的基本特征,然後也讓資料之間的對比變得比較容易?這個技術就是資料變形技術。

關于資料變形技術,會在第14章“進階繪圖技巧”中詳細闡述。

3.分類彙總

要講清楚分類彙總,首先要了解什麼是明細資料和概要資料,請看圖2-10。

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語

可以看到,圖2-10是業務的明細資料,明細資料就是細節資料的展現,也就是說,産生了一條細節的統計資料,就記錄下一條。不過在實際工作中,我們也經常關心彙總資料,例如我們往往關心:每周的銷售資料是多少?每種銷售管道的銷售資料是多少?這就是分類彙總資料。

4.資料透視

資料分析人員經常會說“這個資料要透視一下”,實際上就是用資料透視表的方式來看資料,雖然資料分析屬于統計的範疇,但是excel資料透視表在資料分析中使用的頻率非常高。

5.相關分析

相關分析和關聯分析是兩個比較容易混淆的概念,不過都非常重要。相關分析反映的是在發生變動時,變量互相之間的“互動”關系,例如在增加銷售投入時,我們會關心銷售收入是否增長;或者在産品的成本上升時,我們關心産品的價格是否變動。

再強調一下,相關分析反映的是資料變動量之間的關系,而不是資料本身。

6.關聯分析

關聯分析在資料分析領域是一個特定的術語,這裡先簡單地介紹一下購物籃。大家都習慣了去超市時要拿一個購物籃或者推一個購物車,然後将要買的東西放在購物籃或者購物車裡,那麼超市的經營者往往會關心一個問題:顧客同時會購買什麼東西?例如一個顧客購買了豬肉之後會不會買芹菜?買了牛奶之後會不會買雞蛋?在知道了這些資訊之後,超市的經營者能用來幹什麼呢?答案:他們可以做關聯銷售啊。如果知道顧客經常同時購買豬肉和芹菜,就可以做捆綁銷售。

7.資料拟合

在解釋這個概念之前,先看看案例檔案2.6的資料,并且看看圖2-11所示的銷售收入和消費費用的散點圖。

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語

如果希望知道銷售收入和銷售費用之間的關系,怎麼辦呢?我們的統計學家很聰明,他們就會想辦法找到一條曲線,這條曲線能夠把上面的散點基本上都“串”起來,見圖2-12資料拟合中的趨勢線。

當然,這條曲線也有一個方程,找到這樣的曲線及其方程的過程,就是曲線拟合。

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語

8.假設檢驗

有人說,假設檢驗是統計學中的最基本的概念,個人基本表示認同,不過講清楚假設檢驗,并不那麼容易。

首先看一個生活中的例子,我們中的大部分人都是“外貌協會”的,看到相貌英俊的男人或者清秀美麗的女人,都會産生好感。不過帥哥美女一定是好人嗎?未必!可能打過交道之後,你的印象會大大改觀。

圖2-13所示為人和人打交道的過程圖,看到帥哥美女進而心生好感,就是“假設”,後面繼續打交道,就是“檢驗”,合起來就是“假設檢驗”。

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語

那麼如何檢驗呢?

先做假設,如果檢驗的結果跟其假設一緻或者相差不多,那麼就肯定之前的假設;如果相差太大,例如,假設a是個好人,結果我們發現他表面上看起來不錯(是個影帝),但是實際上品質很惡劣,那麼就推翻假設,請見圖2-14假設檢驗。

《資料分析實戰:基于EXCEL和SPSS系列工具的實踐》一2.1.2 術語