天天看點

SPSS 單因素方差分析全流程總結

SPSS 單因素方差分析全流程總結

案例與資料

在實際生活中,消費者與産品生産者、銷售者或服務提供者之間經常發生糾紛。發生糾紛後,消費者常常會向消費者協會投訴。為了對幾個行業的服務品質進行評價,消費者協會在零售業、旅遊業以及航空公司三個行業抽取不同的企業作為樣本,然後統計最近一年消費者對企業的投訴次數(假設企業之間的規模、服務對象等條件都是相同的),一般而言,受到的投訴次數越多,其服務的品質越差。消費者協會想知道這三個行業之間的服務品質是否有顯著差異。部分資料如下(資料虛構,無實際意義):

SPSS 單因素方差分析全流程總結

二、分析問題

其實在分析三個行業之間的服務品質是否有差異,實際上也就是要判斷行業被投訴的次數是否有顯著性差異,差異性分析常見的方法包括方差分析,t檢驗,卡方檢驗,由于“行業”是定類資料,“投訴次數”是定量資料,卡方檢驗中的自變量和因變量均需要滿足定類變量,是以使用方差分析或者t檢驗,又因為定類資料的組别為三個分别為“零售業”、“旅遊業”以及“航空公司”,一般兩個以上組别需要使用方差分析。是以本例子中使用方差分析進行研究。方差分析包括單因素方差分析和多因素方差分析,因為自變量隻有一個(“行業”),是以使用單因素方差分析進行研究即可。

三、分析前準備

首先對資料進行簡單檢視,比如是否含有異常值等,異常值的存在可能會影響分析結果,是以在分析前需要進行處理,除此之外,進行方差分析還需要滿足每個總體服從正态分布,各個總體的方差相同(滿足方差齊性),以及觀測值是獨立的(例子已滿足)。是以以下一一來檢驗。

1.異常值檢驗

檢查資料中的異常值,異常值顧名思義就是同一組别中與其他的值相比相差特别大(比如大于3倍标準差等),異常值的存在會使整體的均值和标準差不準确,可能會導緻最終的結果分析,尤其是小樣本研究中,例子中共有三組資料,每組15個樣本,共有45個樣本,是以檢查異常值尤為重要。檢查異常值的方法有很多,包括利用描述分析進行檢視标準差在進行判斷,散點圖以及箱線圖等,其中圖示化方法比較直覺,是以這裡利用SPSSAU可視化的箱線圖進行描述:

SPSS 單因素方差分析全流程總結

箱線圖結果:

SPSS 單因素方差分析全流程總結

從上圖結果可以看出,組别“零售業”以及“旅遊業”均有一個異常值,“航空公司”資料未見異常。具體的異常值請見如下:

SPSS 單因素方差分析全流程總結

可以看出“零售業”中資料的異常值為99,“旅遊業”中資料的異常值為68。接下來進行篩選處理:

SPSS 單因素方差分析全流程總結
SPSS 單因素方差分析全流程總結

對異常值進行處理後,分别檢驗資料是否滿足方差分析的前提條件,首先進行正态性檢驗。

2.正态性檢驗

正态分布的檢驗方法有很多種,包括正态性檢驗以及圖示法p-p圖,q-q圖等,一般正态性檢驗最為嚴謹是以利用SPSSAU分組進行正态性檢驗,結果如下:

SPSS 單因素方差分析全流程總結

因為是小樣本分析(樣本量小于50)是以檢視S-W(Shapiro-Wilk)檢驗結果就可以,如果是大樣本資料則可以考慮K-S(Kolmogorov-Smimov)或者J-B(Jarque–Bera)檢驗。從結果中可以看出三組資料的p值均大于0.05,三組資料具有正态性。若不滿足正态性可以使用非參數檢驗進行分析,接着進行方差齊檢驗如下。

3.方差齊檢驗

利用SPSSAU方差齊進行檢驗結果如下:

SPSS 單因素方差分析全流程總結

從結果中可以看出,三個組别進行方差齊檢驗,最終F值為2.797,p值為0.073大于0.05,意味着三組資料波動沒有太大差異,具有方差齊性。通過分析,發現資料滿足方差分析的條件(如果不滿足方差齊性,可以使用非參數檢驗或者welch方差,或者Brown-Forsythe方差),綜上滿足單因素方差分析條件。

四、單因素方差分析

分析三個行業之間的服務品質是否有差異,以“行業”作為自變量,以“投訴次數”作為因變量進行單因素方差分析,結果如下:

SPSS 單因素方差分析全流程總結

從上表中可以看出,零售業的均值為49.929,标準差為9.068;旅遊業的均值為28,标準差為4.315;航空公司的标準差為34.333,标準差為7.451。從中可以看出三者之間有差異,并且零售業投訴次數相對多一些,以及單因素方差模型的F值為34.244,P值遠小于0.05,具有顯著性差異,也說明了三者之間存在顯著性差異。也可以用圖示化方法進行描述三者的均值對比:

SPSS 單因素方差分析全流程總結

從折線圖中可以看出,例子中“零售業”的均值最大,其次是“航空公司”最後是“旅遊業”也即說明“零售業”的投訴比較多,然後是“航空公司”最後是“旅遊業”。那麼根據單因素方差分析驗證三者之間存在顯著性差異,具體兩兩之間的差異如何檢視呢?接下來利用事後多重比較分析“兩兩”之間的關系。

五、事後多重比較

利用SPSSAU事後多重比較中的LSD法(使用最為廣泛,檢驗效能高,對比組别較少)進行兩兩比較,結果如下:

SPSS 單因素方差分析全流程總結

“零售業”,“旅遊業”以及“航空公司”之間兩兩比較,一共有三組比較,分别為“零售業”和“旅遊業”、“零售業”和“航空公司”以及“旅遊業”和“航空公司”最後發現三組的p值均小于0.05,是以三個行業兩兩之間均具有顯著性差異。

六、總結

通過搜集的資料進行單因素方差分析發現三個行業之間的服務品質有差異,結合單因素方差分析結果以及折線圖發現“零售業”收到的投訴次數相對較多,其次是“航空公司”最後是“旅遊業”,然後分析三者中兩兩行業的關系,在單因素方差分析的基礎上,進行事後多重比較發現三個行業中兩兩之間均具有差異,也說明“零售業”可以更進一步研究“如何提升服務品質”。

繼續閱讀