DCL前沿研读沙龙2025年春季学期第2期：衡量国家间敌意的潜在指标

回到主页

DCL前沿研读沙龙2025年春季学期第2期：衡量国家间敌意的潜在指标

· DCL前沿研读沙龙

清华大学国际关系数据与计算实验室2025年春季学期第2期“前沿研读沙龙”于2025年3月8日在腾讯会议平台顺利举行。

本期读书会由南开大学国际关系系本科生李珂稷和外交学院国际关系研究所硕士生严珮嘉主讲。主讲人对期刊文章《怒不可遏：衡量国家间敌意的一个潜在指标》（Hot under the collar: A latent measure of interstate hostility）做了主要内容的介绍以及统计分析过程的复刻。本期读书会由清华大学国际关系数据与计算实验室主任漆海霞老师主持，并邀请到清华大学国际关系研究院博士后张晟昊老师作为点评嘉宾。

01 主要内容

李珂稷同学首先介绍了文章的主要内容。这篇文章的核心内容是构建了一个用于衡量敌意水平的有序项目反应理论模型（O-IRT）。作者首先对于相关研究进行了回顾，发现既有研究针对冲突升级进行实证测量或分析的研究相对较少，更多研究选择将重点放在军事化敌对行动的爆发上；同时现有的大多数衡量指标都是基于军事化冲突已经开始后（且往往是在武力使用已经发生后）的国家行为，因此忽略了争端军事化之前的国家互动，使得现有研究大多忽视了非军事化威胁或指责到武装冲突的过程。而由于缺乏一个概念上精确且经过验证的冲突升级衡量指标，导致国际冲突学者在如何正确衡量冲突升级方面缺乏共识，作者因此构建了一个有序项目反应理论模型，以精细测量敌意水平。

随后，李珂稷同学继续介绍了文章的关键函数及变量，其中包括该模型的项目难度、项目区分度及先验设定。

图1：文章关键函数

02 实证分析

严珮嘉同学首先对于模型的分析单元、数据处理、stan模型构建过程进行了补充。随后根据作者提供的源代码，对于全文主要的分析过程进行复现，首先在作者提供的stan模型源代码中，出现了关键变量名称的缺失，严珮嘉同学对于源代码进行了修改。在作者提供的预测效度检验源代码之中，将一个名为 data 的对象赋值给 dataset 变量，这里假设 data 已经在之前的代码中已被定义，它可能是一个包含实际分析数据的数据框或矩阵。源代码中用dataset=data本意是想对于数据集进行赋值，但是实际上data是一个函数而非数据，所以导致年份缺失报错，在此情况下严珮嘉同学将代码进行了调整。

图2：经修改整合后的stan模型复现代码

与此同时，作者在源代码中将特定国家对的编码出现了一定偏差，在复现过程中也进行了相应调整（图三）。通过代码复现，作者的理论假设基本得以验证：固定截距模型显示敌意水平上升，时变截距模型显示敌意水平随时间下降，在典型国家对的敌意均值对比分析中，复现图表与原文图表在部分年份的散点分布上存在差异，但是在拟合线趋势上基本一致，这可能受到由于设备配置等客观因素造成的MCMC采样种子数与源代码不一致的影响，但是基本可以验证作者结论。

图3：经修改整合后的同时效度检验复现代码

图4: 原文图表与复现图表

随后，李珂稷同学复现了预测效度检验的有关过程，作者认为高敌意国家对更可能发生跨国恐怖主义袭击，据此进行了研究设计：选取1968-2002年非竞争国家对作为研究样本，同时以敌意水平（后验均值）、跨国恐怖袭击次数（ITERATE数据集）为变量，同时以联合民主、能力比、毗邻性等因素为控制变量，经过李珂稷同学所复现的代码显示敌意水平在全样本和非竞争样本中均对恐怖袭击次数有显著正向影响（Table IV），与作者理论假设基本一致，验证了敌意水平对非传统安全威胁的预测能力。

图5: 预测效度检验复现过程及图表

最后，两位主讲人对于文章进行了简要的评价。总体而言，该文章存在理论、数据、验证方面的贡献：重新定义敌意为连续的潜在变量，通过冲突行为的观测推断其强度，为冲突升级研究提供了更精细的理论框架；构建了结合 MID 与 Phoenix 数据的敌意测量模型，覆盖 1950-2010 年的政治相关国家对，解决了传统数据在低强度冲突中的覆盖不足问题；通过预测跨国恐怖主义事件的实证分析，验证了新测量的有效性，拓展了现有理论在非敌对国家对中的适用性。同时，文章也存在一定的不足之处：首先是数据限制，Phoenix 数据集的时间覆盖（1946-2010）与 MID 的起始年份（1816）存在差异，可能影响长期趋势分析；第二是模型复杂度：贝叶斯模型的计算成本较高，且未考虑国际体系中动态网络效应的影响，未来可结合网络分析扩展模型；第三是理论扩展的局限：当前模型聚焦单维敌意，未来可探索多维敌意或与其他变量（如联盟结构）的交互作用，深化对冲突动态的理解。

03 活动总结

李珂稷同学介绍了项目反应理论的背景知识、文章的主要内容以及实证策略。严珮嘉同学在补充理论模型相关内容的同时，对文章的统计分析过程和同时效度检验进行了复刻，并修正了作者在数据处理中可能出现的错漏，李珂稷同学则对于预测效度检验进行了复现。两位主讲人还指出了文章的主要贡献与局限，并提供了进一步研究的潜在方向。

在讨论环节，同学们针对变量的操作化、理论机制的逻辑性以及可能的竞争性解释等提出了各自的看法。主讲人对此进行了一一回应。在点评环节，漆海霞老师和张晟昊老师肯定了主讲人对文章的介绍和对代码的复刻工作，并鼓励进一步对模型中的区分度参数和难度参数等具体内容作进一步分析与研究，推动对理论模型的更深入理解。