天天看點

《大資料分析原理與實踐》——3.3 相關分析

相關關系是一種非确定性的關系,例如,以X和Y分别表示一個人的身高和體重,或分别表示每公頃施肥量與每公頃小麥産量,則X與Y顯然有關系,而又沒有确切到可由其中的一個去精确地決定另一個的程度,這就是相關關系。在一些問題中,不僅經常需要考察兩個變量之間的相關程度,而且還經常需要考察多個變量與多個變量之間即兩組變量之間的相關關系。典型相關分析就是研究兩組變量之間相關程度的一種多元統計分析方法。

《大資料分析原理與實踐》——3.3 相關分析
《大資料分析原理與實踐》——3.3 相關分析
《大資料分析原理與實踐》——3.3 相關分析
《大資料分析原理與實踐》——3.3 相關分析
《大資料分析原理與實踐》——3.3 相關分析
《大資料分析原理與實踐》——3.3 相關分析

若本地資料檔案中的字段與表中字段不比對,需手動進行字段比對,如圖3-19所示。

最後提示導入成功。

其分析元件布局如圖3-20所示。其中,在相關系數矩陣元件中選擇想要進行相關系數計算的列。設定完畢後,運作元件。運作成功後,在相關系數矩陣元件上右擊,選擇“檢視資料”得到相關系數矩陣,如圖3-21所示。

從結果資料可以看出,學校得分與教師品質最為相關,教育品質與教師品質最為相關,畢業生就業情況與教育品質最為相關,影響力與出版刊物數量最為相關。

《大資料分析原理與實踐》——3.3 相關分析
《大資料分析原理與實踐》——3.3 相關分析