前言
從我開始水幾個STATA的群開始到現在,遇到了很多關于計量經濟學和STATA相關的問題和疑問,在不斷地解答過程中,如何學習計量經濟學和STATA的想法也逐漸變得清晰了起來。這些問題裡有很多東西存在着共性,考慮到畢業季來臨,大家開始寫實證論文,或者開始改實證論文,就寫一篇專門針對計量經濟學的學習和STATA應用的文章,聊以幫助。
這篇文章将主要從幾個方面入手:
- 計量經濟學的範式轉換
- 在範式轉換的背景下,應當如何學習計量經濟學
- 如何學STATA
因果研究是現代計量經濟學的靈魂
把握事物必須要把握事物的主要沖突和沖突的主要方面。計量經濟學的沖突有兩個,其一為統計方法,其二為經濟學意義或者說經濟活動的因果效應。當代的計量經濟學,尤其是實證計量經濟學已經将“因果效應”看做了計量經濟學的主要沖突,如何鑒别,分析問題中的因果效應才是學習計量經濟學的核心目的。
什麼是因果效應?計量經濟學或實證分析所研究的因果效應指的是原因的結果。
舉例來說,限購令對于房價的增長是否産生了影響?它的影響到底是多少?這一點與結果的原因有所不同,所謂結果的原因就像實體學研究為什麼蘋果會往下落,其原因在于有萬有引力。
至于說為什麼研究原因的結果而非結果的原因,這便要考慮前者更簡單,對于實證分析的可操作性而言更強,後者在很多情況下對于社會科學而言并不存在很好的鑒别政策。
所謂相關性不是因果性,這個問題其實困擾了實證分析很長的一段時間,但經過學者們一代代不懈的努力,當下階段這個問題對于計量經濟學而言已經不再是一個很嚴重的問題。
對學過伍德裡奇教材的人而言,“就業教育訓練對于收入的影響”的問題應該很熟悉,這個問題在導論的第一章就被抛了出來,并且貫穿了整個多元線性回歸的課程。為什麼這個案例會那麼重要?恰恰就是因為這個案例,推動了計量經濟學對于因果判斷的研究。LaLonde(1986)的研究發現,傳統計量經濟學方法是否能夠模拟随機化實驗的結果。他以随機化實驗作為基準(benchmark),利用觀測資料作為控制組,運用回歸、固定效應、Heckman選擇模型等計量經濟學常用方法估計了教育訓練對收入的影響,發現這些計量經濟學方法都無法複制随機化實驗的結果。因而得到觀察研究中,計量經濟學方法無法可信地估計出因果效應的悲觀結論。Dehejia and Wahba(1999)利用傾向指數比對方法重新考察了LaLonde(1986)探讨的問題,他們發現,盡管LaLonde盡量通過手工方式使兩組個體相似,但是,LaLonde構造的控制組個體與實驗中的幹預組個體仍然具有較大的特征差異。他們利用傾向指數比對方法,獲得與幹預組個體更為相似的控制組個體,發現估計的因果效應與随機化實驗的結果非常相似。
這項研究将研究設計,理想化的實驗設計重新放到了桌面上,最終以實驗學派将計量經濟學的研究方向重新聚焦于“對于因果模組化/針對潛在結果進行模組化”作為終結。(Angrist & Pischke 2010)
對于實驗學派而言,我最喜歡的當屬MIT的Angrist J.,他教材寫的比伍德裡奇更有趣。最關鍵的是,他的教材寫的特别薄,全書都是星戰梗,非常有趣也非常精煉。另一位實驗學派的巨擘便是去年獲得諾貝爾經濟學家的Duflo。他們的文章對于有志于實證分析研究的人而言,是很好的路标。Angrist更是在他的個人首頁中公開了許多研究的資料集,可以用于複現他的論文結果。
如何學計量經濟學?
基本政策
如何學計量經濟學或實證分析方法,在上文所述的學科背景下便不言而喻了。
計量方法以及背後的統計學知識固然很重要,但是,因果關系更為重要,針對因果關系進行模組化,考慮在理想化的狀态下,其實驗是怎樣進行的更為重要。同時,對于大多數的計量研究而言,現在的樣本資料往往都是大樣本資料,許多原有的統計檢驗、統計假設都可以在漸進分析的架構下被放寬。Wooldridge(2016)在解釋多重共線性的問題時,甚至将多重共線性的條件放寬到“隻要不存在完全共線性便不會對結果有所影響”的程度。是以對于統計學背景的研究和推導對于初級乃至中級計量經濟學的學習并非是核心重點。
一般來說,對于初級計量經濟學、中級計量經濟學的學習依然還是從教材出發更好。在教材的選擇中,伍德裡奇的《導論》和Angrist的精通《計量》是最好的參考教材。伍德裡奇的《導論》篇幅巨大,足有700頁之多,但本書真正需要仔細學習的内容也就隻有第一章到第九章。在這九章内容中,需要了解基本假設和相關的檢驗,但更重要的是學會如何對一個實證研究的問題進行模組化和解釋。
舉個例子
工資與勞工受到職業教育之間的關系
這個問題來源于LaLonde(1986)、Dehejia and Wahba(1999)以及Wooldridge(2016)。
不妨考慮一下理想化實驗下,如何鑒别職業教育如何影響了勞工工資。最根本的考慮就是要将勞工進行随機化分組,這種随機化控制了勞工不同個體之間的差異。在模型中如何實作呢?最直接的方法就是添加控制變量,譬如勞工的工作經驗、勞工的教育經驗,還有一些是暫時無法觀測的變量。就可以得到如下的模型:
為什麼控制了這些條件以後就能夠顯示出職業教育對于勞工工資影響的因果效應呢?這個問題的回答就涉及到條件期望、偏效應以及控制變量設計的核心了。不嚴謹地來說,職業教育的系數代表了在教育年限與職業經驗相同的前提下,職業教育對于工資的影響程度。所謂條件期望就是代表了在“(控制變量)一緻”的前提下的實驗設計思想。而偏效應則代表了職業教育的系數是單純反映了其實際的貢獻,不包含教育以及工作經驗的貢獻,其理論推導可以見伍德裡奇的教材。而這一切設計的前提就是在于如何設計出一個優秀的控制變量。
抓住統計部分的主要沖突:BLUE
對于統計部分而言,計量經濟學比較核心的内容便是BLUE或者說高斯-馬爾科夫定理。即滿足一定假設條件下,最小二乘法的結果是最佳線性無偏估計(BLUE, Best Linear unbiased estimator)。
為什麼BLUE那麼重要呢?因為BLUE決定了回歸結果和回歸檢驗的設定。舉例來異方差決定了檢驗的形式,如果存在異方差就直接用穩健回歸标準誤變好,否則直接用t檢驗量即可。對于BLUE的解釋,伍德裡奇的在多元線性回歸的章節中做了很充分的說明。
教材推薦
對于最急迫需要學一遍計量經濟學的人而言,我一般推薦他們讀陳強《進階計量經濟學及STATA應用》,所謂半本陳強在手,江湖任我走。
對于想仔細研究其中機制的人而言,我一般推薦讀伍德裡奇《計量經濟學導論:現代觀點》,伍德裡奇對于模型設定、經濟意義分析以及統計分析都做得很不錯。
對于介于這兩者之間的人而言,我一般推薦Angrist的《Mastering Metrics》以及《基本無害的計量經濟學》,或者由我國學者趙西亮所著的《基本有用的計量經濟學》(本書顯然是緻敬了Angrist的《基本無害的計量經濟學》)。
對于進階計量經濟學有所要求的,則可以看Hayashi Fumio的《計量經濟學》,本書從方法論和論文分析兩個角度對實證分析研究做了很充分的解釋,這本書也是陳強《進階計量經濟學及STATA應用》最主要的參考書籍。
最後,迫切想催催連玉君老師寫一本計量經濟學教材。
如何學STATA
上文書說道,半本陳強走天下不是沒有道理的,一般來說看完陳強前10章基本就可以拿着論文和教材開始做文章複現工作或者直接進行研究工作了。STATA由于其提供的軟體功能足夠充分,是以很多情況下都不需要做很多額外的工作。
學習STATA的核心思路其實也很簡單,始終本着自己是一個實證分析工作者的角度去學習,而非要學明白怎麼寫代碼的心态,你又不是程式員。
需要掌握的指令不過隻有幾條:
- reg varlist, option
- xtreg varlist, option
- help
其中option中最重要的就是檢驗是否存在異方差,如果存在異方差便使用reg varlist, r,利用穩健回歸标準誤來解決異方差問題。
其他的問題以及使用的方法都可以通過查詢獲得解決方案,主要查詢的對象有如下幾個:
- 陳強《進階計量經濟學及STATA應用》
- 連享會,由連玉君主辦
- STATA Journal List
- 經管之家
- Google随機查
要相信,隻要思想不滑坡,方法總比困難多。大部分你遇到的問題,前人都遇到過。
緻謝
這篇文章說是要寫已經說了很久了,一方面我一直對自己能不能寫下這樣專業領域的内容有所顧忌,另一方面的确覺得我要學的東西還有很多。但是在水群的過程中,的确發現了很多共性的問題,是以最後還是寫完了本文。在這篇文章的末尾,還是要感謝連玉君老師,在短短的半年中,我對計量經濟學的認知有了很大的提升。這一切不過是緣起于去年4月份我在莫斯科的一通電話。在中大的時候也非常感謝連老師的指導,雖然那時候我還很naive,但自己跟着連老師的要求開始做論文複現之後,的确發現有一個“頓悟”的過程。對于計量經濟學的認知總算也是邁入了下一個台階。
參考文獻
Angrist, J. D., & Pischke, J.-S. (2008). Mostly harmless econometrics: An empiricist’s companion. Princeton university press.
Angrist, J. D., & Pischke, J.-S. (2010). The credibility revolution in empirical economics: How better research design is taking the con out of econometrics. Journal of economic perspectives, 24(2), 3–30.
Angrist, J. D., & Pischke, J.-S. (2014). Mastering’metrics: The path from cause to effect. Princeton University Press.
Hayashi, F. (2000). Econometrics.
LaLonde, R. J. (1986). Evaluating the econometric evaluations of training programs with experimental data. The American economic review, 604–620.
Wooldridge, J. M. (2016). Introductory econometrics: A modern approach. Nelson Education.