《R語言資料挖掘：實用項目解析》——第2章，第2.9節無參數方法

2021-11-08 06:15:33

本節書摘來自華章出版社《r語言資料挖掘：實用項目解析》一書中的第2章，第2.9節無參數方法，作者［印度］普拉迪帕塔·米什拉（pradeepta mishra），更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

2.9　無參數方法

當一個訓練資料集不滿足任何假定的某種機率分布時，唯一的選擇就是通過無參數方法分析資料集。無參數方法不服從機率分布假設。使用無參數方法，我們可以不基于機率分布的前提假設來實施推斷和假設檢驗。現在我們來看當一個資料集不滿足任何機率分布前提假設時，可使用的一系列無參數檢驗。

2.9.1　wilcoxon符号秩檢驗

如果正态性假設不成立，就需要利用無參數方法來回答這個問題——自動擋和手動擋汽車的市内平均行車裡程數是否有差别？

若兩個樣本恰好成對而又不滿足正态性假設，則可使用參數paired：

2.9.2　mann-whitney-wilcoxon檢驗

若兩個樣本不比對、獨立且不服從正态分布，則需要使用mann-whitney-wilcoxon檢驗來判斷兩個樣本的平均差有顯著差異的假設。

2.9.3　kruskal-wallis檢驗

要比較兩組以上資料的平均值，也即無參方法的方差分析，可以使用kruskal-wallis檢驗。這也被稱作無分布的統計檢驗：

繼續閱讀