当前位置 博文首页 > 李旭东东东东东阿东:计量经济学导论13:虚拟变量与双重差分
首先我们先对解释变量中的定性因素和定量因素作以下阐述:
在实际建模中,如何对定性因素进行回归分析?采用“虚拟变量”对定性变量进行量化是最常用的一种思路。其基本思想为:
虚拟变量设置的时候需要考虑以下的基本规则:
在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种。
实质上,加法方式引入虚拟变量改变的是截距,乘法方式引入虚拟变量改变的是斜率。
含有虚拟变量的模型的分析手段:条件期望。
以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。主要有四种情况:
以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟变量与其它解释变量的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。
所谓虚拟变量的综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。基本分析方式仍然是条件期望分析。
结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。
例:比较改革开放前后我国居民平均“储蓄—收入”总量关系是否发生变化?
模型设定为 :
\[Y_t=\alpha_1+\alpha_2D_t+\beta_1X_t+\beta_2(D_tX_t)+u_t \]其中:\(Y_t\) 为储蓄总额,\(X_t\) 为收入总额。
\[D=\left\{\begin{array}{cl} 1 \ \ , & \text{改革开放前} \\ 0 \ \ , & \text{改革开放后} \end{array}\right. \ . \]条件期望分析:
- 改革开放后:\({\rm E}(Y_t|X_t,\,D_t=1)=\alpha_1+\alpha_2+(\beta_1+\beta_2)X_t\) ;
- 改革开放前:\({\rm E}(Y_t|X_t,\,D_t=0)=\alpha_1+\beta_1X_t\) 。
只要 \(\alpha_2\) 和 \(\beta_2\) 不同时为零,上述模型就能刻画改革开放前后我国居民平均“储蓄—收入”模型结构是否发生变化。
交互作用:一个解释变量的边际效应有时可能要依赖于另一个解释变量。
例:研究人群的个人收入 \(Y\) 与其教育水平 \(E\) 和所在地区 \(D\) 的关系。
模型设定为:
\[Y=\alpha_0+\alpha_1D_1+\alpha_2D_2+\alpha_3E+\alpha_4D_1E+\alpha_5D_2E+u \ , \]其中
\[D_1=\left\{\begin{array}{cl} 1 \ \ , & \text{中部} \\ 0 \ \ , & \text{其他} \end{array}\right. \ , \ \ \ \ D_2=\left\{\begin{array}{cl} 1 \ \ , & \text{东部} \\ 0 \ \ , & \text{其他} \end{array}\right. \ , \ \ \ \ E=\left\{\begin{array}{cl} 1 \ \ , & \text{高等} \\ 0 \ \ , & \text{中等} \end{array}\right. \ . \]各类人员的收入表如下:
西部 \((0,\,0)\) 中部 \((1,\,0)\) 东部 \((0,\,1)\) 中等 \(E=0\) \(\alpha_0\) \(\alpha_0+\alpha_1\) \(\alpha_0+\alpha_2\) 高等 \(E=1\) \(\alpha_0+\alpha_3\) \(\alpha_0+\alpha_1+\alpha_3+\alpha_4\) \(\alpha_0+\alpha_2+\alpha_3+\alpha_5\) 差异性描述:
中部与西部差 东部与西部差 东部与中部差 中等 \(E=0\) \(\alpha_1\) \(\alpha_2\) \(\alpha_2-\alpha_1\) 高等 \(E=1\) \(\alpha_1+\alpha_4\) \(\alpha_2+\alpha_5\) \(\alpha_2-\alpha_1+\alpha_5-\alpha_4\) 各类人员的收入表如下:
西部 \((0,\,0)\) 中部 \((1,\,0)\) 东部 \((0,\,1)\) 高等与中等差 \(\alpha_3\) \(\alpha_3+\alpha_4\) \(\alpha_3+\alpha_5\)
双重差分法,Differences-in-Differences,基本思想就是通过对政策实施前后对照组和实验组之间差异的比较构造出反映政策效果的双重差分统计量。首先强调一点,一般而言 DID 仅适用于面板数据模型,但并没有严格意义上面板数据模型所需要的过多的假设,通过引入虚拟变量并通过最小二乘法即可实现参数估计。因此我们在讨论面板数据之前,先讨论双重差分模型的应用。
前提假设:
模型设定:
其中,\(Y_{it}\) 为个体 \(i\) 在 \(t\) 期的结果值,
对 DID 模型取数学期望:
对照组+实验前
对照组+实验后
实验组+实验前
对照组+实验前
为了方便对比参数设定的意义,我们用如下的表格:
对照组 | 实验组 | |
---|---|---|
实验前 | \(\alpha\) | \(\alpha+\alpha_1\) |
实验后 | \(\alpha+\alpha_2\) | \(\alpha+\alpha_1+\alpha_2+\beta\) |
Difference | \(\alpha_2\) | \(\alpha_2+\beta\) |
将双重差分的思想与上表的内容结合,我们可以得到政策的净效应:
关键:检验交叉项系数 \(\hat\beta\) 是否显著。