多元線性回歸分析
回歸分析是資料分析中最基礎也是最重要的分析工具,絕大多數的資料分析問題,都可以使用回歸的思想解決
回歸分析的任務:通過研究自變量X和因變量Y的相關關系(注意相關性≠因果性),嘗試解釋Y的形成機制,進而達到通過X去預測Y的目的
常見的五類回歸分析:線性回歸、0-1回歸、定序回歸、計數回歸、生存回歸
其劃分依據是因變量Y的類型
X:自變量/解釋變量
Y:因變量/被解釋變量
資料的分類
1.橫截面資料:某一時點收集的不同對象的資料 例如: 2. 時間序列資料;對同一對象在不同時間連續觀察所取得的資料 例如:3.面闆資料:橫截面資料與時間序列資料綜合起來的一種資料資源 如:
2008-2018年,我國各省份GDP資料
針對不同資料類型的處理方法
資料收集
一.一進制線性回歸
與一進制函數拟合幾乎相同,隻是概念定義格式不同
對于線性:
關于回歸系數:
内生性的研究
誤差項包含了所有與Y相關,但沒有添加到回歸模型中的變量。如果這些變量與我們已經添加的自變量相關,則存在内生性
核心解釋變量和控制變量
關于回歸系數的解釋
對數意味着原被解釋變量對解釋變量的彈性,即百分比的變化而不是數值的變化
對于什麼時候取變量的經驗法則:
總結四類模型回歸系數的解釋:
虛拟變量X——特殊的自變量
當遇見一些定性變量,如性别、地域等,該如何處理?——引入虛拟變量
多分類的虛拟變量設定
含有互動式的自變量
回歸執行個體
第一問
資料的描述性統計
所有名額的總體情況介紹
stata軟體回歸
對于定性變量,加入虛拟變量回歸
題意分析所有變量與評價量的關系,故最終将所有變量(包括處理後的虛拟變量)一同回歸
讨論:如果拟合優度R平方較低怎麼辦
第二問