Stata实操：用PSM搞定论文内生性问题，从数据清洗到结果解读保姆级教程

张

张建站

2026/5/15 16:52:15

10分钟阅读

Stata实战用PSM方法解决研究内生性问题的完整指南在实证研究中内生性问题一直是困扰研究者的重要障碍。当处理组和对照组在观测特征上存在系统性差异时简单的回归分析可能导致有偏的估计结果。倾向得分匹配Propensity Score MatchingPSM作为一种准实验方法能够有效缓解由选择偏差带来的内生性问题近年来在经济学、社会学、公共卫生等领域得到广泛应用。本文将基于Stata软件从实际研究问题出发详细介绍PSM方法的完整操作流程。不同于简单的代码罗列我们将深入探讨每个步骤背后的计量经济学原理帮助研究者不仅掌握操作技巧更能理解方法适用性和结果解读要点。无论你是正在撰写毕业论文的研究生还是准备投稿期刊的青年学者这份指南都能为你提供可直接套用的解决方案。1. PSM方法基础与适用场景1.1 内生性问题与PSM原理内生性问题源于样本选择偏差当个体是否接受处理如参与培训项目与其潜在结果相关时传统的回归分析就会产生偏误。PSM通过构建反事实框架解决这一问题其核心思想是为处理组的每个个体找到特征相似的对照组个体从而模拟随机实验环境。PSM的关键步骤包括估计倾向得分计算每个个体进入处理组的概率匹配处理根据倾向得分寻找相似个体平衡性检验验证匹配后组间协变量是否平衡效应估计比较匹配样本的结果差异提示PSM只能控制可观测变量的影响对于不可观测的混杂因素仍需借助工具变量等其他方法。1.2 适用条件与前提假设PSM方法有效性的前提是满足以下假设条件独立性假设给定协变量处理分配与潜在结果独立共同支撑假设处理组和对照组的倾向得分分布存在重叠区域平衡性假设匹配后协变量在处理组和对照组间分布均衡下表对比了PSM与随机对照试验(RCT)的特点特征PSMRCT处理分配非随机随机混杂控制仅可观测变量可观测和不可观测变量外部效度取决于样本代表性通常较高实施成本相对较低通常较高2. 数据准备与倾向得分估计2.1 数据导入与变量处理我们以研究职业培训对收入的影响为例使用Stata自带的nswre74.dta数据集。首先进行数据准备工作use nswre74.dta, clear * 生成必要变量 gen u74 (re740) // 1974年失业状态 gen u75 (re750) // 1975年失业状态 * 描述性统计 summarize age educ black hisp married nodegree re74 re75 u74 u75 if treat1 // 处理组 summarize age educ black hisp married nodegree re74 re75 u74 u75 if treat0 // 对照组2.2 倾向得分模型设定选择合适的协变量是PSM成功的关键。协变量应满足影响处理分配如是否参与培训影响结果变量如收入不受处理影响在时间上先于处理我们使用logit模型估计倾向得分* 安装psmatch2包 ssc install psmatch2, replace * 定义全局变量 global x age educ black hisp married nodegree re74 re75 u74 u75 * 估计倾向得分 logit treat $x predict pscore, pr // 生成倾向得分3. 匹配方法与实施3.1 常用匹配方法比较Stata的psmatch2命令支持多种匹配算法各有优缺点方法命令选项优点缺点最近邻匹配neighbor(1)简单直观可能匹配质量差卡钳匹配caliper(0.2)避免差匹配可能损失样本核匹配kernel使用所有信息计算量大半径匹配radius平衡质量与数量需要设定合理半径3.2 实施1:1最近邻匹配* 1:1最近邻匹配 psmatch2 treat, pscore(pscore) neighbor(1) common out(re78) * 查看匹配结果 psgraph // 共同支撑域 pstest $x, both // 平衡性检验匹配后需特别关注匹配样本量共同支撑域标准化偏差%bias应10%t检验结果组间应无显著差异3.3 匹配质量诊断良好的匹配应使处理组和对照组在关键变量上分布相似。我们可以通过多种图形检验匹配质量* 核密度图比较 twoway (kdensity pscore if treat1) /// (kdensity pscore if _weight!.), /// legend(label(1 处理组) label(2 匹配对照组)) /// title(匹配后倾向得分分布)4. 结果解读与报告4.1 处理效应估计PSM主要估计三种处理效应ATE(Average Treatment Effect)总体平均处理效应ATT(Average Treatment Effect on the Treated)处理组的平均处理效应ATU(Average Treatment Effect on the Untreated)对照组的平均处理效应在学术论文中通常报告ATT结果* 显示ATT结果 estat att结果解读要点ATT值的经济意义和统计显著性处理效应的方向正/负和幅度与匹配前估计的比较偏误减少程度4.2 敏感性分析为验证结果稳健性建议进行以下敏感性分析不同匹配方法比较* 半径匹配 psmatch2 treat, pscore(pscore) radius caliper(0.2) out(re78) * 核匹配 psmatch2 treat, pscore(pscore) kernel out(re78)不同卡钳值测试尝试0.1、0.2等不同卡钳值观察结果稳定性协变量组合测试增减协变量检验ATT变化5. 常见问题与解决方案在实际应用中研究者常遇到以下问题问题1匹配后样本量大幅减少检查共同支撑域psgraph尝试更宽松的匹配标准如增大卡钳值考虑使用核匹配保留更多样本问题2某些变量始终不平衡检查该变量是否同时影响处理和结果尝试在匹配中增加该变量的二次项或交互项考虑使用马氏距离匹配mahalanobis选项问题3处理效应不显著检查匹配质量pstest结果验证共同支撑假设psgraph考虑是否存在不可观测混杂因素注意PSM不是万能的当关键混杂因素不可观测时应考虑结合其他方法如双重差分(DID)或断点回归(RD)。6. 论文写作中的PSM报告规范在学术论文中报告PSM结果时应包括以下要素方法描述匹配变量选择依据使用的具体匹配方法匹配前后的样本量平衡性检验标准化偏差变化关键变量的t检验结果匹配质量可视化展示效应估计ATT值及标准误统计显著性水平经济意义解释稳健性检验不同匹配方法的结果比较不同协变量组合的测试其他敏感性分析结果以下是一个典型的PSM结果报告表格示例变量匹配前处理组均值匹配前对照组均值匹配后对照组均值标准化偏差(%)偏差减少(%)年龄25.8228.0325.913.289.5教育10.3510.2410.330.595.1收入2095153220870.498.3在应用PSM方法的过程中我发现匹配质量对结果影响极大。一次关于教育政策评估的研究中最初匹配后某些变量仍存在显著差异通过调整协变量组合和匹配算法最终获得了良好的平衡性。这个过程让我深刻体会到PSM不仅是一种技术操作更需要研究者对数据特征和理论背景的深入理解。

拒绝运维“盲盒”！实测实在Agent如何重塑设备运维预警

摘要： 站在2026年的技术关口，设备运维预警已从单纯的“状态监控”进化为“智能预测驱动”。然而，企业在落地AI模型故障识别时，仍面临老旧系统无接口、传统RPA易崩溃、信创环境适配难等硬骨头。本文由「企服AI产品测评局」深度出品…...

2026/5/15 16:50:51 阅读更多 →

用STC89C52和DAC0832做个简易信号发生器：从三角波到方波，代码全解析

用STC89C52和DAC0832打造多功能信号发生器：从硬件搭建到波形优化实战在电子工程实验和嵌入式系统开发中，信号发生器是不可或缺的基础工具。市面上的专业设备往往价格昂贵，而使用STC89C52单片机配合DAC0832芯片搭建的简易信号发生器&#xff…...

2026/5/15 16:48:04 阅读更多 →

ChatGPT Web性能监控与优化：实时统计与用户行为分析

ChatGPT Web性能监控与优化：实时统计与用户行为分析【免费下载链接】chatgpt-web A third-party ChatGPT Web UI page built with Express and Vue3, through the official OpenAI completion API. / 用 Express 和 Vue3 搭建的第三方 ChatGPT 前端页面, 基于 Open…...

2026/5/15 16:43:59 阅读更多 →

4月28日隐喻“鲸鱼开眼”，DeepSeek识图模式灰度上线，迈入图文交互时代！

4月28日，DeepSeek多模态团队研究员推文隐喻“鲸鱼开眼”，次日开启“识图模式”灰度内测，5月初大范围开放。该模式有亮点也有短板，标志其迈入图文交互时代。事件回顾4月28日，DeepSeek多模态团队研究员陈小康在X平台推文…...

2026/5/15 14:23:43 阅读更多 →

AI赋能高能物理：图神经网络与生成式模型在粒子径迹重建与模拟中的应用

1. 项目概述：当AI遇见高能物理的“显微镜”电子离子对撞机（EIC），被誉为探索物质深层结构的下一代“超级显微镜”。它不像我们熟悉的LHC那样让质子对撞，而是让高能电子去轰击质子或重离子，其核心目标是精确“…...

2026/5/14 8:53:29 阅读更多 →

A/B 测试前后的合成控制样本

原文：towardsdatascience.com/synthetic-control-sample-for-before-and-after-a-b-test-683bac36ffc1 简介 A/B 测试非常强大。我喜欢这种实验，因为它让我们能够比较结果，并确定某物是否比另一物表现更好。 A/B 测试有一个特定类型&#x…...

2026/5/15 14:23:32 阅读更多 →