天天看點

python因子分析案例_學習預測和因子分析

根據上節什麼是因子分析的表4回歸分析結果求回歸方程(方程1)。這裡使用上節表4下方的“系數”值求解和學習預測和因子分析。

python因子分析案例_學習預測和因子分析

方程1

接下來,用回歸方程進行預測。此處的資料(N0.336-340)不用于回歸分析,而是專門用于預測與檢驗(表1)。

python因子分析案例_學習預測和因子分析

表1

預測No.336如下:

No.336的預測值=265.95+0+20.91+0+58.04+10.94+(-3.37)*45+6.74*3+84.72*4.5≈605.52'

同樣地,預測No.337如下:

No.337的預測值=265.95+45.24+20.91+45.74+58.04+10.94+(-3.37)*51+6.74*0+84.72*4≈613.69'

下面用同樣的方法計算No.334的預測值。No.336到No.340的預測值如表2所示。

python因子分析案例_學習預測和因子分析

表2

比較預測值與實際值,判斷預測精确度的高低。求解相對誤差的公式如下:

python因子分析案例_學習預測和因子分析

公式

表3 I

3中,“二手車價格”這一列的資料是實際值。根據表1和表2求相對誤差(表3)。

python因子分析案例_學習預測和因子分析

表3

求相對誤差的絕對值。再計算所有絕對值的平均值,結果是12.1%。

筆者不知道實際市場上使用什麼方法确定二手車價格,但是建議先對曆史資料進行同歸分析,然後使用得出的回歸方程确定二手車價格。

隻要掌握了分析方法,無論是誰都能求出回歸方程。回歸方程,就是确定價格的标準方法。

接着進行因子分析。

由于“LD”、“AW”、“空氣囊”、“顔色”、“拍賣會地點”是定性資料,是以需要求t值範圍。假設删除的項目的t值為0。

“LD”的影響度=3.05-0=3.05

“AW”的影響度=2.00-0=2.00

“空氣囊”的影響度=3.99-0=3.99

“顔色”的影響度=15.21-0=15.2l

“拍賣會地點”的影響度=1.00-0=1.00

因為“行駛距離”、“車檢剩餘有效月數”、“評分”是定量資料,是以t值就是影響度。

“行駛距離”的影響度=-6.4l

“車檢剩餘有效月數”的影響度13.73

“評分”的影響度=6.15

表4是影響度的統計表。把表4做成如圖1的柱形圖。

python因子分析案例_學習預測和因子分析

表4

python因子分析案例_學習預測和因子分析

圖1

從圖1來看,對二手車價格的影響度由高到低的因子依次是:“顔色”、“行駛距離”、“評分”,“空氣囊”。

什麼是類别分析

類别是指項目的具體内容。例如,“顔色”這個項目的類别是“黑色”,

“淺藍色”、 “藏藍色”、

“酒紅色”等。用類别分析可以求出各個類别對于二手車價格的影響。

進行類别分析時,須求回歸系數(類别區域)。類别區域(回歸系數)可以根據表5求出。

表5中,回歸系數的數值就是類别區域。将删除的資料,如“無LD”、

“無AW’、

“無天窗”的類别區域假設為0。

python因子分析案例_學習預測和因子分析

表5

從類别區域看,“有LD”的比‘無LD“的貴45萬日元;“有AW”的比“無AW”的貴2l萬日元;“顔色”中黑色比其他顔色的價格貴很多。

通過類别分析,可知“黑色”對_二手車價格影響最大。今天的預測和因子分析就說完了,其中包含了因子分析和類别分析。http://cda.pinggu.org/view/19073.html