天天看點

數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

擾動項

  • 球形擾動項
  • 異方差
    • 出現的問題
    • 解決
    • 異方差的 Stata畫圖 檢驗
    • 異方差的 假設 檢驗
      • BP檢驗
      • 懷特檢驗 --- 推薦
      • BP檢驗與懷特檢驗差別
    • 異方差問題的解決
      • OLS+穩健的标準誤進行回歸
  • 多重共線性
    • 檢測
    • 處理方法
  • 逐漸回歸分析 --- 篩選後的變量可以避免多重共線性
    • 向前逐漸回歸
    • 向後逐漸回歸
    • 注意

擾動項 μ \mu μ為無法觀測且滿足一定條件 — 球形擾動項

球形擾動項

  • 同方差

    每一個擾動項方差相同

    σ 2 ( μ i ) = σ 2 ( μ j ) \sigma^2(\mu_i)=\sigma^2(\mu_j) σ2(μi​)=σ2(μj​)

  • 無自相關

    μ i 和 μ j ( i ≠ j ) 相 關 系 數 或 者 協 方 差 為 0 \mu_i和\mu_j(i\neq j)相關系數或者協方差為0 μi​和μj​(i​=j)相關系數或者協方差為0

異方差

出現的問題

  • 假設檢驗無法使用(構造的統計量失效)

    ∴ \therefore ∴不能看出求得的回歸系數是否是顯著的

  • OLS(普通最小二乘法)估計量不再是最優線性無偏估計量

解決

  1. 法1. 使用OLS + 穩健的标準誤
  2. 法2. 使用廣義最小二乘法GLS
    數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

異方差的 Stata畫圖 檢驗

在用Stata進行回歸分析後

  1. rvfplot

    畫出殘差與拟合值的散點圖
  • 橫坐标拟合值
  • 縱坐标殘差 — 是拟合值與真實值的差距
數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

圖中:

當拟合值小的時候,殘差變化不大

當拟合值變大的時候,殘差變化很大 — 存在異方差問題

  1. rvpplot x

    畫殘差與自變量 x x x的散點圖
  • 橫坐标 x x x值
  • 縱坐标殘差 — 是拟合值與真實值的差距
    數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

    圖中:

    當 x ( 團 購 價 ) x(團購價) x(團購價)比較低時,殘差變化很大

    當 x ( 團 購 價 ) x(團購價) x(團購價)比較高時,殘差變化不大 — 存在異方差問題

  • 儲存圖檔
//儲存圖檔
graph export a.png ,replace
           

異方差的 假設 檢驗

BP檢驗

// 在Stata回歸結束後
estat hettest ,rhs iid
           
  • 原假設 H 0 不 存 在 異 方 差 H_0 不存在異方差 H0​不存在異方差
  • 數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

懷特檢驗 — 推薦

// 在Stata回歸結束後
estat imtest ,white
           
  • 原假設 H 0 不 存 在 異 方 差 H_0 不存在異方差 H0​不存在異方差
  • 數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性
    數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

BP檢驗與懷特檢驗差別

懷特檢驗包括了平方項和交叉項

BP檢驗可以看成懷特檢驗的特例

  1. BP的優點在于其建設性,即可以幫助确認異方差的具體形式
  2. 懷特檢驗優點可以檢驗任何形式的異方差

    但缺點是不提供任何關于異方差的具體形式的資訊

異方差問題的解決

數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

OLS+穩健的标準誤進行回歸

regress y x1 x2 … xk,r
           

多重共線性

檢測

\\使用回歸代碼後
estat vif
           
數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

處理方法

數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性
  • 第三點增加資料量有點難實作時,可以考慮剔除導緻嚴重共線性的變量

逐漸回歸分析 — 篩選後的變量可以避免多重共線性

數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性
數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

向前逐漸回歸

  • # 1 \#1 #1代表一個數字,當 p < # 1 時 p<\#1時 p<#1時顯著,将變量放入模型中

向後逐漸回歸

  • # 2 \#2 #2代表一個數字,當 p > # 2 時 p>\#2時 p>#2時不顯著,将變量剔除模型

注意

  1. 數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性
  2. x1 x2 … xk之間不能有完全多重共線性

    和regress不同,regress可以自動去除産生多重共線性的變量

    數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性
    ∴ \therefore ∴可以現使用 regress指令 找到去除的變量,再手動去除那些變量後使用 stepwise regress指令
  3. 可以在後面再加參數b和r,即标準化回歸系數或穩健标準誤
  4. 在數學模組化中,可以不用考慮第二點中的内生性問題
    數學模組化 --- 多元線性回歸擾動項滿足的條件球形擾動項異方差多重共線性逐漸回歸分析 — 篩選後的變量可以避免多重共線性

參考資料:數學模組化清風視訊

繼續閱讀