前言
从我开始水几个STATA的群开始到现在,遇到了很多关于计量经济学和STATA相关的问题和疑问,在不断地解答过程中,如何学习计量经济学和STATA的想法也逐渐变得清晰了起来。这些问题里有很多东西存在着共性,考虑到毕业季来临,大家开始写实证论文,或者开始改实证论文,就写一篇专门针对计量经济学的学习和STATA应用的文章,聊以帮助。
这篇文章将主要从几个方面入手:
- 计量经济学的范式转换
- 在范式转换的背景下,应当如何学习计量经济学
- 如何学STATA
因果研究是现代计量经济学的灵魂
把握事物必须要把握事物的主要矛盾和矛盾的主要方面。计量经济学的矛盾有两个,其一为统计方法,其二为经济学意义或者说经济活动的因果效应。当代的计量经济学,尤其是实证计量经济学已经将“因果效应”看做了计量经济学的主要矛盾,如何鉴别,分析问题中的因果效应才是学习计量经济学的核心目的。
什么是因果效应?计量经济学或实证分析所研究的因果效应指的是原因的结果。
举例来说,限购令对于房价的增长是否产生了影响?它的影响到底是多少?这一点与结果的原因有所不同,所谓结果的原因就像物理学研究为什么苹果会往下落,其原因在于有万有引力。
至于说为什么研究原因的结果而非结果的原因,这便要考虑前者更简单,对于实证分析的可操作性而言更强,后者在很多情况下对于社会科学而言并不存在很好的鉴别策略。
所谓相关性不是因果性,这个问题其实困扰了实证分析很长的一段时间,但经过学者们一代代不懈的努力,当下阶段这个问题对于计量经济学而言已经不再是一个很严重的问题。
对学过伍德里奇教材的人而言,“就业培训对于收入的影响”的问题应该很熟悉,这个问题在导论的第一章就被抛了出来,并且贯穿了整个多元线性回归的课程。为什么这个案例会那么重要?恰恰就是因为这个案例,推动了计量经济学对于因果判断的研究。LaLonde(1986)的研究发现,传统计量经济学方法是否能够模拟随机化实验的结果。他以随机化实验作为基准(benchmark),利用观测数据作为控制组,运用回归、固定效应、Heckman选择模型等计量经济学常用方法估计了培训对收入的影响,发现这些计量经济学方法都无法复制随机化实验的结果。因而得到观察研究中,计量经济学方法无法可信地估计出因果效应的悲观结论。Dehejia and Wahba(1999)利用倾向指数匹配方法重新考察了LaLonde(1986)探讨的问题,他们发现,尽管LaLonde尽量通过手工方式使两组个体相似,但是,LaLonde构造的控制组个体与实验中的干预组个体仍然具有较大的特征差异。他们利用倾向指数匹配方法,获得与干预组个体更为相似的控制组个体,发现估计的因果效应与随机化实验的结果非常相似。
这项研究将研究设计,理想化的实验设计重新放到了桌面上,最终以实验学派将计量经济学的研究方向重新聚焦于“对于因果建模/针对潜在结果进行建模”作为终结。(Angrist & Pischke 2010)
对于实验学派而言,我最喜欢的当属MIT的Angrist J.,他教材写的比伍德里奇更有趣。最关键的是,他的教材写的特别薄,全书都是星战梗,非常有趣也非常精炼。另一位实验学派的巨擘便是去年获得诺贝尔经济学家的Duflo。他们的文章对于有志于实证分析研究的人而言,是很好的路标。Angrist更是在他的个人主页中公开了许多研究的数据集,可以用于复现他的论文结果。
如何学计量经济学?
基本策略
如何学计量经济学或实证分析方法,在上文所述的学科背景下便不言而喻了。
计量方法以及背后的统计学知识固然很重要,但是,因果关系更为重要,针对因果关系进行建模,考虑在理想化的状态下,其实验是怎样进行的更为重要。同时,对于大多数的计量研究而言,现在的样本数据往往都是大样本数据,许多原有的统计检验、统计假设都可以在渐进分析的框架下被放宽。Wooldridge(2016)在解释多重共线性的问题时,甚至将多重共线性的条件放宽到“只要不存在完全共线性便不会对结果有所影响”的程度。因此对于统计学背景的研究和推导对于初级乃至中级计量经济学的学习并非是核心重点。
一般来说,对于初级计量经济学、中级计量经济学的学习依然还是从教材出发更好。在教材的选择中,伍德里奇的《导论》和Angrist的精通《计量》是最好的参考教材。伍德里奇的《导论》篇幅巨大,足有700页之多,但本书真正需要仔细学习的内容也就只有第一章到第九章。在这九章内容中,需要了解基本假设和相关的检验,但更重要的是学会如何对一个实证研究的问题进行建模和解释。
举个例子
工资与工人受到职业教育之间的关系
这个问题来源于LaLonde(1986)、Dehejia and Wahba(1999)以及Wooldridge(2016)。
不妨考虑一下理想化实验下,如何鉴别职业教育如何影响了工人工资。最根本的考虑就是要将工人进行随机化分组,这种随机化控制了工人不同个体之间的差异。在模型中如何实现呢?最直接的方法就是添加控制变量,譬如工人的工作经验、工人的教育经验,还有一些是暂时无法观测的变量。就可以得到如下的模型:
为什么控制了这些条件以后就能够显示出职业教育对于工人工资影响的因果效应呢?这个问题的回答就涉及到条件期望、偏效应以及控制变量设计的内核了。不严谨地来说,职业教育的系数代表了在教育年限与职业经验相同的前提下,职业教育对于工资的影响程度。所谓条件期望就是代表了在“(控制变量)一致”的前提下的实验设计思想。而偏效应则代表了职业教育的系数是单纯反映了其实际的贡献,不包含教育以及工作经验的贡献,其理论推导可以见伍德里奇的教材。而这一切设计的前提就是在于如何设计出一个优秀的控制变量。
抓住统计部分的主要矛盾:BLUE
对于统计部分而言,计量经济学比较核心的内容便是BLUE或者说高斯-马尔科夫定理。即满足一定假设条件下,最小二乘法的结果是最佳线性无偏估计(BLUE, Best Linear unbiased estimator)。
为什么BLUE那么重要呢?因为BLUE决定了回归结果和回归检验的设定。举例来异方差决定了检验的形式,如果存在异方差就直接用稳健回归标准误变好,否则直接用t检验量即可。对于BLUE的解释,伍德里奇的在多元线性回归的章节中做了很充分的说明。
教材推荐
对于最急迫需要学一遍计量经济学的人而言,我一般推荐他们读陈强《高级计量经济学及STATA应用》,所谓半本陈强在手,江湖任我走。
对于想仔细研究其中机制的人而言,我一般推荐读伍德里奇《计量经济学导论:现代观点》,伍德里奇对于模型设定、经济意义分析以及统计分析都做得很不错。
对于介于这两者之间的人而言,我一般推荐Angrist的《Mastering Metrics》以及《基本无害的计量经济学》,或者由我国学者赵西亮所著的《基本有用的计量经济学》(本书显然是致敬了Angrist的《基本无害的计量经济学》)。
对于高级计量经济学有所要求的,则可以看Hayashi Fumio的《计量经济学》,本书从方法论和论文分析两个角度对实证分析研究做了很充分的解释,这本书也是陈强《高级计量经济学及STATA应用》最主要的参考书籍。
最后,迫切想催催连玉君老师写一本计量经济学教材。
如何学STATA
上文书说道,半本陈强走天下不是没有道理的,一般来说看完陈强前10章基本就可以拿着论文和教材开始做文章复现工作或者直接进行研究工作了。STATA由于其提供的软件功能足够充分,因此很多情况下都不需要做很多额外的工作。
学习STATA的核心思路其实也很简单,始终本着自己是一个实证分析工作者的角度去学习,而非要学明白怎么写代码的心态,你又不是程序员。
需要掌握的命令不过只有几条:
- reg varlist, option
- xtreg varlist, option
- help
其中option中最重要的就是检验是否存在异方差,如果存在异方差便使用reg varlist, r,利用稳健回归标准误来解决异方差问题。
其他的问题以及使用的方法都可以通过查询获得解决方案,主要查询的对象有如下几个:
- 陈强《高级计量经济学及STATA应用》
- 连享会,由连玉君主办
- STATA Journal List
- 经管之家
- Google随机查
要相信,只要思想不滑坡,方法总比困难多。大部分你遇到的问题,前人都遇到过。
致谢
这篇文章说是要写已经说了很久了,一方面我一直对自己能不能写下这样专业领域的内容有所顾忌,另一方面的确觉得我要学的东西还有很多。但是在水群的过程中,的确发现了很多共性的问题,因此最后还是写完了本文。在这篇文章的末尾,还是要感谢连玉君老师,在短短的半年中,我对计量经济学的认知有了很大的提升。这一切不过是缘起于去年4月份我在莫斯科的一通电话。在中大的时候也非常感谢连老师的指导,虽然那时候我还很naive,但自己跟着连老师的要求开始做论文复现之后,的确发现有一个“顿悟”的过程。对于计量经济学的认知总算也是迈入了下一个台阶。
参考文献
Angrist, J. D., & Pischke, J.-S. (2008). Mostly harmless econometrics: An empiricist’s companion. Princeton university press.
Angrist, J. D., & Pischke, J.-S. (2010). The credibility revolution in empirical economics: How better research design is taking the con out of econometrics. Journal of economic perspectives, 24(2), 3–30.
Angrist, J. D., & Pischke, J.-S. (2014). Mastering’metrics: The path from cause to effect. Princeton University Press.
Hayashi, F. (2000). Econometrics.
LaLonde, R. J. (1986). Evaluating the econometric evaluations of training programs with experimental data. The American economic review, 604–620.
Wooldridge, J. M. (2016). Introductory econometrics: A modern approach. Nelson Education.