会道网
人文社科学术信息平台

公共政策评估的计量经济学方法适用前提和应用场景

来源:苑德宇,宋小宁.公共政策评估的计量经济学方法运用刍议[J].财经智库,2018,3(04):79-92+142.

对于不同计量经济学评估方法,均具有其各自的技术关键点,公共政策评价者只有准确把握这些关键点,才能有效避免计量经济学评估方法误用现象
的发生。在本部分中,我们遵循《计量经济学评估》一书章节顺序,对不同计量经济学方法进行评价并总结其应用前提和场景。

1. 回归校正法
这是一种广义估计处理效应的一种方法,基于可观测变量选择的识别假设。实际上,这种方法仅在条件独立假设(Conditional Independence
Assumption,CIA)下才适用。通常我们可以使用参数和非参数方法估算出处理效应的大小,但这两种处理方法各有利弊。数据稀疏(Sparseness)情况下非参数估计结果要比参数估计结果更可靠,而非参数估计却又很难克服因为弱重叠(Weak Overlap)问题而带来的识别问题。因此,对于回归校正法而言,使用参数估计还是非参数估计取决于现有数据的稀疏和重叠问题。

2. 匹配法
匹配法是当前在非实验环境下评估处理效应最为常用的方法之一 (Stuart,2010)。从技术上说,匹配法是直接利用可观测结果,而不是使用可观测条件均值进行估计的回归校正法。相比于控制函数回归法(Control Function Regression,CFR)A,匹配法具有三个优点:一是有很多具体匹配方法可供选用,以通过比较获得相对稳健的结果;二是可以为处理组找到一个特征相近的对照组,以获得相对准确的处理效应估计;三是匹配原理较为简单,即通过非处理组找到处理组在相反状态下的潜在结果。具体实施过程中,需要注意以下四个方面的问题。
(1)关于处理效应的识别。匹配法可以很好解决弱重叠和弱平衡性(Weak Balancing)的问题,但不能消除不可观测变量选择偏差问题。匹配
法要能识别出处理效应,通常要基于三个假设:一是条件均值独立假设,即E(Y0|x,D)= E(Y0|x)和E(Y1|x,D)= E(Y1|x);二是重叠性假设,即0<p(x)<1,其中p(x)为倾向得分;三是平衡性假设,即匹配后处理组与控制组的协变量分布相同。
(2)匹配估计量的大样本特征。匹配法作为一种特殊的非参数回归校正
法,其获得非观测结果的方法使其渐进性质的识别成为问题。仅有一些匹配方法符合大样本渐进性质,这其中主要包括核匹配(Kernel Matching)和近邻匹配(Nearest-neighbor Matching)两种方法。核匹配法在特定条件下的估计量可以满足N-1/2 渐进一致性,但并不满足有效性B;近邻匹配法的估计量不仅可以满足一致性和渐进正态分布,还可以满足有效性。
(3)精确匹配与维度问题。通常情况下,我们可以采取精确匹配方法来实现匹配,但这仅限于协变量维度较少时。如果协变量维度较多,而样本
容量又较小时,精确匹配将变得不可行,即所谓的维度问题(Dimensionality Curse)。为了克服这一问题, 罗森鲍姆和鲁滨(Rosenbaum and Rubin,1983)建议将多维协变量转换为倾向得分这一单一维度进行匹配。
(4)倾向得分匹配。在运用倾向得分匹配法时,有两个特别重要的特性:平衡性(Balancing)和无混淆性(Unconfoundedness)。前者是在给定倾向得分p(x)的条件下,处理变量D 与其他变量x 是独立的,这一特性表明了当倾向得分被正确处理后,按照倾向得分划分匹配个体和按照协变量x 划分匹配个体是无差别的。因此,在实证研究中检验平衡性是否成立,是检验倾向得分是否正确地用于划分匹配个体的重要标准。无混淆性是指,给定p(x),处理变量D 对于潜在结果的影响是可以忽略的,这一特性是否成立是检验是否穷尽协变量x 的标准。倾向得分匹配法(PSM)在研究中被广泛应用,但需要注重其适用性和缺陷:一是PSM 需要比较大的样本容量才能实现高质量的匹配;二是PSM 要求处理组与控制组之间要有共同的取值范围(重叠性),否则可能丢失较多观测值,导致匹配成功变量较少;三是PSM 虽然控制了可观测变量,但仍然可能存在非观测变量选择问题,仍存在不可见偏差。

3. 复权法
复权法是在可观测变量选择情况下估计处理效应的一种有效方法,与上文的倾向得分匹配法之间有着密切关系。复权法的基本原理是:由于处理组
个体不是随机分配的,处理组个体和控制组个体之间可能呈现着非常不同的特征,这样也可能导致协变量x 出现不平衡分布。为了构建平衡的协变量分布,通常针对不同观测值赋予适当权重并且运用加权最小二乘法估计平均处理效应。相比于其他公共政策计量评估方法,复权法不依赖于对潜在结果m1(x)和m0(x)的估计,而仅依赖于倾向得分p(x)的估计。但这种方法也有一定限制,因为复权估计量对倾向得分估计方程设定较为敏感,如果方程设定存在问题,可能会导致严重的估计偏差。

4. 工具变量法
工具变量法是处理不可观测变量选择(不可见偏差)而引起内生性问题的最有效方法之一。应用工具变量法,首要的是能找到至少一个工具变量,
其要与处理变量D 直接相关,但又不能与因变量(结果)Y 相关。通常情况下,我们可以选择二阶段普通最小二乘法、Probit (或Logit)最小二乘法和Probit (或Logit)二阶段最小二乘法作为工具变量法运用的具体回归方法。但需要注意的是,第一种方法若遇到弱工具变量问题,会降低处理效应回归结果的精确度,但仍然是满足一致性的;第二种方法基于处理变量D 的Probit 或Logit 回归量对选择方程进行回归,其处理效应回归结果相比第一种方法具有更好的有效性,但需要依赖Probit 或Logit 回归方程的正确设定;第三种方法回归并不具有第二种方法的依赖性,即使Probit 或Logit 回归方程设定不正确,仍能满足一致性,但在一定程度上损失了有效性。此外,我们在运用工具变量法时,要特别注意弱工具变量问题,即工具变量与因变量Y 之间不完全外生或与处理变量之间的相关性较差,这可能导致处理效应的回归结果不一致和较差的有效性(Bound et al.,2005)。

5. 模型选择法
模型选择法作为处理数据截断或不可观测变量选择问题的一种方法,近年被逐渐广泛应用于公共政策的效果评估中(Cerulli,2015)。在对选
择模型进行回归时,由于不同的不可观测变量之间可能存在相关性,这会导致处理效应估计出现偏差。要获得一致的处理效应估计,通常要基于不
同误差项之间的联合正态分布。在联合正态分布的假设下,可以利用极大似然估计法,这样可以获得一致且有效的参数估计量。但是,一般情况下
极大似然估计可能会面对收敛问题,在回归方程存在离散控制变量时表现尤为突出(Woodridge,2010)。这时,采用两步法A可能是一个有效的校正方法。

6. 双重差分法
双重差分法也是一种处理内生性问题的有效方法(Abadie,2005;Angrist and Pischke,2008)。在应用中,这种方法因不需像工具变量法那样需要寻找工具变量,也不需像模型选择法那样附加严格的分布假设,当前已经成为公共政策效果的计量评估中最重要、应用最广泛的方法。双重差分法适用于处理组和控制组在公共政策执行前后的数据均可得的情况,其基本原理是在公共政策执行前为处理组个体找到相同或相似的非处理组(控制组)个体,以这些非处理组个体在政策实施时点后的结果作为处理组个体在未进入处理组时的潜在结果参照,通过对比得到公共政策的处理效应。为了获得处理组个体的潜在结果,通常我们要基于可得的协变量考察处理组和控制组个体之间是否具有共同趋势(Common Trend)。相反,如果处理组和控制组之间不具有共同趋势,将会严重影响处理效应回归结果的准确性。

7. 断点回归法
断点回归法是另一种准自然实验的估计方法,近年经常出现在公共政策因果效应评估的文献中。断点回归法适用的基本条件是:存在一个驱动
变量(Forcing Variable),以其某一取值作为门槛划分处理组和非处理组个体。在门槛值之上的个体进入处理组,门槛值之下的个体进入非处理组。门槛值的取值处会出现政策断点,通过选择适当的门槛值临界区间,比较处理组和非处理组因变量的平均值,即可获得公共政策的处理效应。根据政策变量与驱动变量之间是确定关系还是随机关系,可以将断点回归法分为清晰断点法和模糊断点法,前者的处理变量会在门限值处出现严格的“跳跃”,而后者则只形成了模糊的“跳跃”。断点回归法在具体应用中,通常需要符合四个前提:一是准确识别断点。准确识别的一个标准是在门槛值附近是否符合自然实验的随机抽样标准,具体可以计算政策变量D 和协变量x 在门槛值左右两侧的差别。通常可以接受的断点为政策变量D 在门槛值两侧具有明显差异,而协变量x 在门槛值两侧的差异不显著。二是断点不能被人为操控,即不能通过人为修改门槛值来改变断点的位置。三是最优带宽的选择。带宽的选择实际上涉及估计精度和估计偏差的平衡。因为带宽越大,回归可用的观测值越多,可以提高回归的有效性,但同时偏离门槛值较远的个体也就越多,增加了估计偏差。具体可以利用插入法(Plug-in)和交叉验证法(Cross-validation)获得最优带宽A。四是额外协变量选择。一个变量是否能够作为协变量进入回归方程,其标准是在门限值处不会出现统计上显著的断点。

分享到:

评论 抢沙发

评论前必须登录!

 

会道网,社科学术信息平台

关于我们发布会讯
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册