断点回归设计步骤(附代码)
最近在做一个需要利用断点回归设计的研究。为了保证实践的规范性,花了几天时间详细梳理了一下断点回归设计的标准操作。整理好的资料(步骤、数据和代码)分享给大家。
断点回归常规的操作流程:
第一步,确定是精确断点(SRD)还是模断点(FRD)。在正式开展研究前,我们需要根据特定的场景判断使用精确断点还是模糊断点。一般来说,精确断点是特殊情况,在现实的研究设计中使用较少,主要还是以更具一般性的模糊断点回归为主。
第二步,有效性检验。在使用断点回归进行因果识别时,需要满足一系列的前提条件,如局部随机化假设和连续性假设等。
第三步,判断是参数还是非参数估计。一般来说,RDD模型中的估计方法存在参数估计和非参数估计两种。如何选择参数还是非参数估计并没有统一的标准,需要结合研究的场景来选择。
第四步,带宽的敏感性测试。断点估计结果的有效性易受到带宽选择的影响。带宽越小,断点两侧的影响因素越相近,遗漏变量对因变量的影响越小,因而可以更准确地估计断点处的处理效应,减轻内生性带来的估计偏误。但过小的带宽也会带来样本量的过度损失从而导致结果的有偏性。
第五步,安慰剂检验。选择一个不同于断点的值作为安慰剂断点,如果断点回归结果变得不显著,则表明断点的真实性。
部分代码展示: