天天看點

《R語言資料挖掘:實用項目解析》——第2章,第2.9節無參數方法

本節書摘來自華章出版社《r語言資料挖掘:實用項目解析》一書中的第2章,第2.9節無參數方法,作者[印度]普拉迪帕塔·米什拉(pradeepta mishra),更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

2.9 無參數方法

當一個訓練資料集不滿足任何假定的某種機率分布時,唯一的選擇就是通過無參數方法分析資料集。無參數方法不服從機率分布假設。使用無參數方法,我們可以不基于機率分布的前提假設來實施推斷和假設檢驗。現在我們來看當一個資料集不滿足任何機率分布前提假設時,可使用的一系列無參數檢驗。

2.9.1 wilcoxon符号秩檢驗

如果正态性假設不成立,就需要利用無參數方法來回答這個問題——自動擋和手動擋汽車的市内平均行車裡程數是否有差别?

《R語言資料挖掘:實用項目解析》——第2章,第2.9節無參數方法

若兩個樣本恰好成對而又不滿足正态性假設,則可使用參數paired:

《R語言資料挖掘:實用項目解析》——第2章,第2.9節無參數方法

2.9.2 mann-whitney-wilcoxon檢驗

若兩個樣本不比對、獨立且不服從正态分布,則需要使用mann-whitney-wilcoxon檢驗來判斷兩個樣本的平均差有顯著差異的假設。

《R語言資料挖掘:實用項目解析》——第2章,第2.9節無參數方法

2.9.3 kruskal-wallis檢驗

要比較兩組以上資料的平均值,也即無參方法的方差分析,可以使用kruskal-wallis檢驗。這也被稱作無分布的統計檢驗:

《R語言資料挖掘:實用項目解析》——第2章,第2.9節無參數方法

繼續閱讀