回到主页

DCL前沿研读沙龙2025年春季学期第5期:领导人发言与联大转型

· DCL前沿研读沙龙

清华大学国际关系数据与计算实验室2025年春季学期第5期“前沿研读沙龙”于2025年6月14日在腾讯会议平台顺利举行。

本期读书会由武汉大学马克思主义学院本科生陈滨琪和国际关系学院硕士研究生刘宇婷主讲。主讲人对期刊文章《联合国大会中的领导人发言:振兴还是政治化?》(Leaders in the United Nations General Assembly: Revitalization or Politicization?)做了主要内容的介绍以及统计分析过程的复刻。本期读书会由清华大学国际关系数据与计算实验室高佳琦同学主持,并邀请到清华大学国际关系研究院博士研究生刘哲希和王淇作为点评嘉宾。

01 主要内容

在本期DCL春季第四期读书分享活动中,刘宇婷与陈滨琪同学围绕Alexander Baturo与Julia Gray发表于《国际组织》期刊的文章《Leaders in the United Nations General Assembly: Revitalization or Politicization?》展开讲解。文章以联合国大会(UNGA)发言人中的国家领导人为研究对象,探讨其发言在内容、风格、议题聚焦等方面的独特性,以及这种参与形式是否真正推动了联合国的“振兴”,抑或反而加剧了其“政治化”。

首先,刘宇婷同学介绍了文章的选题背景与研究问题。她指出,联合国近年来鼓励国家元首和政府首脑积极参与大会,许多国际改革话语也认为“高层参与”是联合国大会“振兴”的关键路径。然而,作者却提出一个具有挑战性的问题:领导人的参与,真的让大会更专业、更聚焦了吗?还是使其变得更分散、更政治化?

围绕这一问题,作者提出了第一个研究假设(H1):领导人相较其他代表,其发言更不贴合联合国大会设定的“全球主流议程”,也就是说,领导人更倾向于围绕本国或个人诉求进行表达。为了验证这个假设,作者构建了一个文本量化模型,利用潜在语义标度(LSS, Latent Semantic Scaling)方法,测量每篇发言与“全球主流议题”的相似程度。

Section image

图1:潜在语义标度(LSS)基本原理

刘宇婷同学详细解释了LSS的基本原理:研究者先选取如“cooperat”、“global”、“together”等6个词,作为代表“全球议题”的种子词,然后将每篇演讲稿转化为词向量,并计算其与这组种子词向量之间的相似度,得出一个LSS得分。得分越高,说明该发言越贴近全球主流议题;得分越低,说明其更“跑题”。

为帮助同学理解该方法的技术路径,刘宇婷同学还复现了文章的核心LSS得分计算代码,展示了如何将原始文本处理为语料库,如何选取种子词,如何借助R语言中的text2vec与quanteda等包完成LSS建模与得分提取,并展示了代表性发言的得分差异。这一部分的讲解强调了方法论的直观性与透明度,使大家对“语义距离”这一抽象概念形成了清晰认知。

02 实证分析

在完成理论与方法的介绍后,刘宇婷同学接续讲解了文章的后续内容。她首先介绍了作者采用的固定效应回归模型。以LSS得分作为因变量,作者引入“是否为领导人发言”作为核心自变量,同时控制国家固定效应、年份固定效应、人均GDP对数、是否为联合国安理会成员、是否为民主国家等变量。结果显示:“领导人”这一变量在所有模型中均呈显著负向关系,说明领导人发言普遍远离大会设定的全球议题。

Section image

表1:LSS作为因变量的固定效应回归结果(Table2)

随后,刘宇婷同学根据作者提供的源代码,对全文主要的分析过程进行复现,基本重现了全文的图表。

Section image

表2:经修改整合后的Table2复现图表

根据文章的思路,刘宇婷同学着重补充讲解了文章对H1的多维度稳健性检验逻辑。作者通过引入结构主题模型(STM),进一步验证领导人与其他代表在关注主流议题上的系统性差异。STM识别出23个主题,并通过主题概率分布分析发现,领导人更偏好强调本国立场或争议性话题,而非大会普遍讨论的全球合作主题。

Section image

图2:结构主题模型(STM)自动归纳出的23个主题

随后作者采取计算出的每年(每届会议)全体发言人中“最常被提及的1个/3个主题作为因变量,同样做了一次固定效应回归,结果依旧表明无论民主与否,领导人在每届大会最重要(或前三大)议题上的参与度都显著低于普通代表。民主国家代表整体更愿意谈论当期热门话题,但领导人群体本身更易“跑题”或凸显自身关切,而非紧跟全球主流。这与前文LSS和余弦相似度等多种量化检验结果形成呼应,进一步验证了作者关于“领导人发言更易偏离全球议程”的结论。

刘宇婷同学根据作者提供的源代码,对全文主要的分析过程进行复现,基本重现了全文的图表。

Section image

表3:经修改整合后的Table3复现图表

在完成假设H1的实证检验后,陈滨琪同学接续讲解和复刻了对该假设的稳健性检验部分。在区域异质性检验中,研究者引入联合国区域小组作为控制变量,采用随机效应模型分析不同地区领导人演讲模式对全球议程的偏离程度,发现拉丁美洲以外区域领导人的演讲风格并未显著改变原有结论,证明结论具有跨区域适用性。为量化效应实质意义,作者运用边际效应分析将回归系数转化为原始量表变化量,通过可视化图表揭示:相较其他代表,民主与非民主国家领导人演讲中全球议程相关内容平均减少约四分之一标准差(0.023-0.025),且该偏离幅度超出基准值0.103标准差的20%以上,这种实质性差异均通过显著性检验。针对重大国际事件冲击,研究采用LSS方法构建涵盖阿富汗战争、911事件等危机议题的关键词字典,实证发现领导人即使在紧急议题年份仍减少相关讨论,印证了"将UNGA作为国内议程展示平台"的核心机制。

随后为规避固定效应模型局限,研究者交叉验证混合回归、随机效应与固定效应模型,通过比较不同模型对国家特征、时间效应的处理方式,证明核心结论不依赖于单一模型假设,尤其随机效应模型对国家异质性的控制进一步排除了潜在偏差。针对潜在语义标度的单维局限性,作者构建自由主义、马克思主义及全球议程主题的词典替代指标,通过相关性检验(r=0.47, p<0.000)验证语义标度得分与术语占比的高度一致性,并采用全球议程术语占比及绝对数量双重指标进行固定效应回归,均复现了"领导人全球议程讨论显著低于其他代表"的核心发现,且该效应不受演讲长度影响。这种多方法论互补策略有效克服了文本缩短等数据限制,确保结论在语义分析框架变革下仍保持稳健。这些多重检验有力支撑了H1的核心结论。

Section image

表4:使用联合国区域小组的附加预测变量重新估计后的复现图表

Section image

表5:随机效应模型和混合回归模型检验与固定效应模型的对比

注:作者使用了5种方法对H1进行稳健型检验,这里只使用1种复现进行举例

紧接着,陈滨琪同学引入了文章的第二个假设H2,即领导人与其他发言人在沟通风格上的差异性。她展示了作者如何使用Flesch-Kincaid可读性指数、外交术语使用比例和第一人称代词频率等指标量化发言风格,发现领导人发言更“平易近人”、更“自我中心”、更缺乏外交规范化色彩。这些差异,在控制一系列国家层面变量后仍然稳健。

Section image

表6:领导者的沟通质量回归结果(Table4)

Section image

表7:经修改整合后的Table4复现图表

最后,在结论部分,作者指出,虽然联合国鼓励“高规格”发言、希望借助领导人提升大会影响力,但从数据来看,领导人发言往往更“跑题”,风格也更“政治化”,这未必真正推动了多边合作的有效性与大会的“振兴”,反而可能削弱大会作为一个专业性、协商性平台的权威性。

03 活动总结

两位主讲人对文章做出了各自的总结与反思。刘宇婷指出,文章创新地结合了文本量化与国际组织研究,为理解联合国大会内部行为机制提供了新视角。陈滨琪强调,本文虽然没有量化“振兴”的因果路径,但在揭示领导人发言特征方面贡献明显,也为我们重新理解国际组织的运作方式提供了重要启发。

在讨论环节,现场同学就种子词选择的主观性、领导人发言效果的差异、主流议题的设定权等问题提出深入提问,两位主讲人逐一回应,展开热烈交流。本次分享体现出机器学习赋能下的文本研究与国际组织研究的有机结合,也鼓励大家用量化工具审视“语言”这一传统上被认为难以计量的外交资源。期待未来有更多相关跨方法、跨议题的扎实研究。