1、政策评价与因果关系识别: 方法与应用,一.相关性还是因果性 1.传统计量 样本:只包括受影响的处理组 识别策略:简单直接 方法:多元线性回归(OLS、IV、MLE、GMM等) 思想:控制 缺点:容易遗漏重要解释变量,导致估计有偏和不一致 结果:很容易出现伪回归,很多情况下只是相关性分析,2.现代计量 样本:包括受影响的处理组和不受影响的控制组 识别策略:精巧婉转 方法:政策评价(DID、PSM、treatment effect、RD等) 思想:实验和匹配 优点:有效控制遗漏变量偏差 结果:能识别出变量之间的真实因果关系 缺点:reduced form,只研究是什么,很难触及到为什么,二.政策评
2、价简介 1.定义:在其他因素保持不变的情况下,受到政策干预的处理组和没有受到政策干预的参考组之间在结果上被观察到的净差异,以及它在多大程度上能归因于政策干预本身(Guo and Fraser,2009) 2.研究对象:准自然实验 3.样本:观察数据,对处理组和参考组在处理前的初始条件缺乏严格控制,存在“选择偏差”,4.分析框架:Rubin潜在因果模型,参与者的平均处理效应ATT=E(y1i| Di=1)- E(y0i| Di=1) 全部个体平均处理效应ATE=E(y1i-y0i),5.方法分类 (1) 假设个体依可观测变量选择是否参与政策,这种方法以PSM为代表; (2)假设个体依不可观测变量
3、选择是否参与政策,这种方法包括DID、RD和treatment effect模型 (3)小结 结果方程:yi=+Di+Xi+i 处理方程:Di=Zi+i,(1)差分估计 :如果D是完全随机的,不受变量Z影响,可以直接用OLS差分估计量估计处理方程,由于(y0i,y1i)Di,所以ATE:=E(y1i)-E(y0i) 如何证明D是完全随机? (a)在处理方程中加入控制变量,处理效应变化不大 (b)控制变量均值差异检不显著。(Kruger,1999),(2)PSM:满足(y0i,y1i)Di|Zi, Rosenbaum and Rubin(1983)提出的可忽略性假设或者条件独立假设(CIA)。Z
4、称为依可测变量选择,即给定Z,潜在结果y0i和y1i对处理变量D的影响可忽略,或者说潜在结果y0i和y1i独立于D,这个时候对处理方程采用logit模型估计。再估计出倾向得分值与处理组最接近的匹配组以后,同样采用差分计算平均处理效应,因而这个时候不需要估计结果方程,(3)DID:决定D的不可观测因素Z不随时间变化,同时此时有多期数据,对结果方程可以采用DID双差分估计。 (4)treatment effect:结果方程的残差和处理方程的残差相互影响,对处理方程和结果方程一起采用处理效应模型估计。 (5)RD:将个体结果差异完全归因于是否接受政策影响,在Z的断点上下对政策变量D进行分类,此时也不
5、存在明确的结果方程和处理方程。,三.具体方法介绍 1.PSM (1)基本思路:通过构造反事实分析,找到控制组中某个个体j,使其与处理组对应个体i具有最匹配的特 征,也就是在treat前z0iz0j。从而将yj 作为yi0 的估计量,即yi0=yj,这样yi-yj 作为个体i 处理效应的度量。 (2)步骤 A.将影响处理变量D 的控制变量z 尽可能包括进来,以保证条件独立假设尽可能成立;,B.通常采用logit 模型估计倾向得分,即给定z,个体i 成为处理组的条件概率p(zi)=P(Di=1|z=zI),估计logit 模型时为了避免遗漏变量,根据Rosenbaum and Rubin(1995
6、) 建议可以放入z 的高次项或者交互项; C.根据倾向得分值,将与处理组特征最相近的控制组个体给匹配出来,这里主要包括k 近邻匹配、卡尺匹配、卡尺内最近邻匹配、局部线性回归匹配和样条匹配几种方法,具体匹配还有是否允许放回和并列之分。 D.检验是否满足数据平衡和共同支撑假定,(3)缺点: A.该方法要求比较大的样本容量获得高质量的匹配。 B.要求处理组与控制组的倾向得分有较大的共同取值范围。 C.只控制了可观测变量z 的影响,如果存在不可观测变量的影响, 仍然存在隐性偏差。D.在第一步估计倾向得分时存在不确定性,如到底是选择logit、probit 还是非参估计,具体控制变量的x 的形式如何设定
7、,是否需要加入二次项或者交互项等,2.DID (1)要求:构造出(准)自然实验,个体分组或者处理水平完全由自然决定,也就是说并非为了实验目的而发生的外部突发事件,使得当事人仿佛是随机的被分在了处理组或者控制组, 这样政策冲击是外生 (2)原理:对处理组在政策前后一差分就得到处理效应和时间效应,而控制组由于不受政策影响,差分后只有时间效应,两者再进行差分从而得到了处理效应。可以简单表示如下:Yit= 0+ 1du + 2dt+ 3(du*dt),(3)注意事项 A.有些政策只是在某个地区的某些个体实施,可以构造三重差分(DDD)估计量 Y= 0+ 1du + 2d + 3dt+ 4(du*d )
8、+ 5(du*dt)+ 6(d *dt)+ 7(du*d *dt),下标x 代表新泽西州,b 代表宾西法尼亚州;s 代表小餐馆,l 代表大餐馆;2 代表加工资后,1 代表加工资前,B.政策在实验组实施时间不一致,政策是逐步试点推行的,采用如下差分计量模型(Woodridge,2008) : Yit=+1d3t+ 2d4t+ ndTt+ Dit + uit (t=1,2,3T) 其中政策虚拟变量Dit=1,如果实验组在政策以后;其他任何情况Dit=0。 dt 代表样本中第t 年的时间虚拟变量。并通过报告样本中上一层聚类标准差来修正序列相关,如果政策效果随时间变化,通过可以引入政策虚拟变量Ditk
9、=1(如果是政策实施的第k 年,n=0,1,2),只需估计如下计量模型即可(Autor,2003): C.如果政策在各实验组的实施力度不同,只需估计如下计量模型即可(Card,1992):,其中 i 是代表各地区政策实施程度的变量,dt是各时期的时间虚拟变量,3.treatment effect (1)分类 标准处理效应模型: 结果方程独立于处理方程,影响结果(处理)变量的不可观察因素对处理(结果)变量不产生任何影响 内生处理效应模型: 结果方程不独立于处理方程,影响结果(处理)变量的不可观察因素对处理(结果) 变量也会产生影响,两个模型的残差项之间存在相关性。,(2)标准处理效应模型 A.具
10、体方法 RA:对结果方程进行建模,它并不需要对处理方程的函数形式进行任何假定。对处理组和控制组分别进行回归方法,要求处理组和控制组都有足够的样本 IPW:对处理方程进行建模,它并不需要对结果方程的函数形式进行任何假定。采用每个个体成为处理组的概率倒数作为权重 AIPW和IPWRA:加倍稳健(doubly robust),对结果方程和处理方程联合起来建模,只需要其中一个方程设定正确,AIPW和IPWRA的估计结果就要比RA和IPW更稳健,NNMATCH和PSMATCH:用来比较除了处理与否存在不同外,其他特征尽可能相似的个体结果差异。 B.假设前提 a.独立同分布假设:该假设确保了个体是否参加处
11、理组不会影响样本中的其他个体是否选择参加处理组还是控制组。通常多层数据或者面板数据不满足该假设。 b.条件独立假设:(y0i,y1i)Di|zi。 c.重叠假设:个体接受处理的概率取中间值,既不接近0也不靠近1。如果处理组和控制组的核密度曲线很少重合,且各自倾向值集中在0和1附近,则说明重叠假设不满足。,(3)内生处理效应模型 A.原理:,B.步骤,4.RD (1)思路对于高考成绩在498、499、500、501、502 分的考生,认为他们在各方面(可观测变量和不可观测变量)都没有系统差异。高考一两分很多时候取决于评卷老师在一个主观题上面的打分松紧等偶然因素, 而完全与个人能力无关,但是成绩的
12、差别却导致500 分以上的上了大学成为处理组,而低于500 分的落榜成为控制组。由于制度原因,对高考成绩在500 上下的考生进行了随机分组, 因而将其视为准自然实验,如果收入确实在500 分上下存在一明显跳跃,那唯一原因只能是上大学的处理效应。,(2)分类 精确断点回归(SRD):断点上下被处理概率由0到1 模糊断点回归(FRD):断点上下被处理概率有所提升,(3)精确断点 yi=+ (zi-c)+ Di+(zi-c)Di+ i(c-hzc+h) 即为断点估计量,也就是在z=c 两侧局部平均处理效应(LATE)的估计,还可以在上式中加入zi-c 的高次项及高次项与D 的交互项,这样可以放宽函数
13、形式的限制。,局部线性回归方法最小化下列目标函数,(4)模糊断点 A.假设条件:(y1i-y0i)Di|zi B.公式推导:,分母是倾向得分值在断点处的跳跃,如果是精确断点有 ,则上式就成了精确断点的形式,因此精确断点可以看糊断点的一个特例,C.注意事项 a.非随机断点设计:Lee and Lemieux(2010)认为分组变量不适合是年龄或者地区变量,这时容易产生内生分组问题,即个体可以经过自身努力自行选择进入处理组或者控制组,从而导致断点回归失效 检验方法:Mccrary(2008) 提出的内生分组检验,假设存在内生分组,个人将自行选择进入断点两侧,导致断点两侧的分布不均匀,即分组变量z
14、的密度函数f(z)在z=c 处不连续 b.内部有效性比较强的准自然实验,仅推断在断点处的因果关系,5.小结 (1)共同点:政策都有先行试点,所有样本个体被分为处理组和控制组两大类 (2)区别:处理变量D的决定因素不同 (3)适用范围和注意事项 PSM:D完全由可观测因素决定,要注意检验是否满足数据平衡和共同支撑假设 内生处理效应:D由某些不可观测的因素影响,某些不可观测因素还同时影响结果变量,这两类不可观测因素存在很大相关性,此时要检验代表结果方程和处理方程残差相关性的逆米尔斯比例是否显著,标准处理效应:D虽然受某些不可观测因素影响,但是这些不可观测因素对结果变量并不产生影响,要根据处理方程和结果方程的具体情况选择相应的估计方法 RD:D受某一变量在某一断点附近因素影响,同时观察散点图确实在该断点附近处结果变量有明显跳越。要注意检验样本在断点附近是否满足随机分组以及控制变量在断点处的连续性 DID:D是受某些不可观测因素影响且该因素随时间不发生变化,同时能获得多期混合截面或者面板数据。要注意政策实施是否有特定对象、政策实施时间和实施力度有所不同,而选取相对应的模型,四.实证案例 1. David Card and Alan Krueger(1994):DID研究提高最低工资对就业的影响2.David S. Lee(2007):RD研究执政党的在位优势,