回到主页

“前沿研读沙龙”第6期


清华大学国际关系数据与计算实验室春季学期第6期“前沿研读沙龙”活动于2023年8月6日在腾讯会议平台顺利举行。

本期读书会邀请到清华大学国际关系学系硕士生高佳琦和中国人民大学国际关系学院博士生贾宇娴主讲,内容为复刻期刊文章“Territorial control in civil wars:Theory andmeasurement using machine learning”中的统计分析过程。

01 主要内容

本文的研究问题是:如何测量不对称内战中的“领土控制”这一隐藏变量?首先,贾宇娴同学介绍了“领土控制”这一变量在内战研究中的理论价值。然而,由于缺乏内战双方在特定时期所控制区域的具体数据,也缺乏明确定义的前线,故研究者难以直接测量政府与反对派在内战中控制的地区。作者通过隐马尔科夫模型(HMM模型),将内战中“领土控制”这一隐藏变量通过“反对派策略”这一观察变量测量出来。具体而言,在政府控制程度较高的区域,反对派更倾向于选择恐怖袭击的策略;在反对派控制程度较高的区域,其更倾向于选择常规战争(如游击战)的策略。借助于HMM模型中的最大似然路径,通过维特比算法进行解码,作者估算出一组最可能发生的“领土控制”序列。

02 研究设计

作者选取了哥伦比亚内战与尼日利亚内战的案例,以验证HMM模型估计“领土控制”的有效性。通过Uppsala Conflict Data Program(UCDP)数据库的地理坐标数据集( GED)与全球恐怖主义数据库(GTD)构建了一个数据集,在明确反对派策略、转换概率与输出概率的前提下,利用R-Studio软件并根据HMM模型估算政府与反对派的领土控制分布及变化情况。

 

broken image


HMM模型图式


最后,作者使用了样本外数据进行稳健性检验。在哥伦比亚的案例中,HMM模型的估算结果与反映领土控制变化的变量“森林砍伐情况”显著正相关。在尼日利亚的案例中,HMM模型的估算结果与ACLED数据库所记录的领土控制变化显著正相关。这说明HMM模型是解决不对称内战中领土控制数据缺乏的一种有效方法,可以反映出领土控制的主要空间模式与时间趋势。

broken image

03 活动总结

高佳琦同学详细展示和讲解了本篇文章的实证分析部分在统计软件R-Studio中的操作过程,细致解读了相关代码。随后,贾宇娴同学介绍了文章测量方法与案例设计部分的亮点,同时也提出了作者研究中可以进一步完善的地方,并对后续的研究方向进行了展望。在随后的问答环节中,同学们就作者的研究假设与可能存在的遗漏变量问题进行积极提问,得到了主讲人和与会指导老师的热烈回应。