天天看點

資料圖表化的兩個關鍵點

資料圖表化的兩個關鍵點

一般來說,大家都不太願意直接看資料,更希望通過圖表來進行呈現。今天,我們讨論圖表化資料的問題。

第一個關鍵點

首先,請簡單地看這麼一個例題。假設一個企業有不同的收入,然後同時可能有不同的利潤,那麼利潤率就是等于利潤/收入,于是利潤率就有了如表所示的各種數值(第一行代表利潤,第二行代表收入)。

資料圖表化的兩個關鍵點

現在,有三個變量,收入、利潤和利潤率,那麼應該如何用圖形來表示三者的關系的?

最容易想到的就是用三維的圖形來表達。x、y軸分别代表收入與利潤,而z軸則是代表了利潤率。

資料圖表化的兩個關鍵點

然而,這張圖看上去似乎将表中的資訊完全展示出來,但是由于三維圖在平面上是通過透視的方法進行描繪的,這導緻我們并不能很準确地對圖形進行了解。我們看不出曲面與坐标軸之間的互相關系,也看不出曲面内部各個點之間的互相關系,設定在圖上的任何一點,我們都不能準确地确定其實際的位置,因為透視三維圖上的任意一點都表示的是一條線的可能。36大資料(http://www.36dsj.com/)

是以,雖然三維圖将表中的資訊最大限度地展現和展示出來,但是由于人們眼睛對于平面上的視覺限制,這種三維圖的效果反而沒什麼實際的價值。

如果退而求其次,我們如果采用二維坐标,那麼就可以在平面上很容易表示兩者的關系,但是卻必須舍棄其中一個變量。例如,如果以收入和利潤來作為橫縱坐标,在利潤率為30%、40%、50%的情況下,兩者之間的關系如圖所示。

資料圖表化的兩個關鍵點

現在圖傘的表示中并沒有充分包含表格中的所有資訊,但是相對于圖二的三維圖,圖三的表示方法使用者更容易直覺了解。36大資料(http://www.36dsj.com/)

結論一:圖表的表示應該以讓讀者能夠更容易了解表格資料的内在規律,而不是以能夠更多更全面的包含所有資料的資訊。必要的省略有時候更能夠幫助讀者抓住重點,了解本質。

第二個關鍵點

如前圖三所示,我們可以把三個變量的角色進行了分解:收入當做自變量,利潤當做因變量,而利潤率則是作為限制條件,在不同的限制條件下,随着收入的變化,利潤也随之變化。

但是問題在于,為什麼這三個變量之間的角色配置設定必須如此呢?

比如,如圖四所示,可以選擇利潤率作為自變量,利潤在不同收入條件下的變化情況,或者是收入作為自變量,利潤率在不同利潤條件的變化情況。

理論上來說,三個變量就存在6種不同資料角色配置設定方式。如表所示。

資料圖表化的兩個關鍵點

也許大家會覺得這其實是在玩一種數字遊戲,因為利潤率=利潤/收入,是以其實6中不同的資料表達形式無非是數字上的變化。事實上,對于資料分析來說,這6種不同的資料角色配置設定方式表現出不同的内涵和意義。

比如,在收入為橫坐标、利潤率為縱坐标,利潤為限制條件的時候,這意味着需要保證固定的利潤,是以在擴大市場規模以及并是以導緻的利潤率下降之間尋找到一條可能的界限。

資料圖表化的兩個關鍵點

或者是以利潤為橫坐标,利潤率為縱坐标,收入為限制條件的時候,這表示的是收入是一個固定額,然後需要考慮如何通過擴大利潤來提升利潤率的水準。

資料圖表化的兩個關鍵點

結論二,雖然圖表資料是相同的,但是圖表資料的展現和表達的不同也是有意義的。也許從數學上看可能僅僅是數學的變換,但是這其實代表了實際場景和目标的的差異。

本文作者:chenjunrui

來源:51cto

繼續閱讀