新闻资讯
产品建模 计算国际关系学的发展图景与研究路径 | 国政学人
计算国际关系学视域下互联网与算法编程的价值与意义
图片
在线美工作者:H. Akin Unver产品建模,奥兹耶金大学(Ozyegin University)国际关系系副教授,研究兴趣为计算社会科学、恐怖主义等议题。
来源:Ünver H A. “Computational international relations what can programming, coding and internet research do for the discipline,” All Azimuth: A Journal of Foreign Policy and Peace, Vol. 8, No. 2, 2019, pp. 157-182.
导读
得益于通信技术的飞速发展,计算社会科学(Computational Social Science)成为了当下的热门学科。海量数据及其高速增长极大地便利了社会科学学者提取社会发展、政治互动、人口流动等有价值的信息进行相关议题研究。在此背景下,计算国际关系学(Computational IR)应运而生,利用数据挖掘、自然语言处理、地理空间分析等信息技术工具来整合分析数据从而检验国际关系理论。本文将深入探析计算国际关系学同计算社会科学的渊源产品建模,以及计算国际关系的主要议题,紧接着深入探究如何提高学者对算法工具的掌握能力以及国际关系学同计算机科学的结合度。可以说计算国际关系学弥合了定量和定性研究的鸿沟,为多元研究设计的方法论奠定了坚实的基础,而本文深入浅出地剖析了计算国际关系学的发展图景及热点议题,为优化跨学科结合度和学术能力提供了极具借鉴意义的方向与建议。
明晰计算国际关系学的概念
计算国际关系学的出现得益于计算社会科学革命。《设计社会科学研究》(Designing Social Inquiry, DSI)确立了国际关系和政治学的正统方法论,并成为了所有方法论课程的主要教材。但关于DSI的争议持续至今,具体来说就是定性阵营质疑实证主义关于回归分析和统计建模的方法论,数据的规范性、计算的有效性都影响着整体因果关系的解释力。而计算社会科学作为自然科学同社会科学的桥梁,终止了原先无休止的方法论争辩。计算社会科学作为交叉学科,主要依托大数据处理来解释描述社会现象。作为新生学科,计算社会科学面临很多质疑,这同研究的主观性以及科技发展环境瞬息万变不无关系。1.计算社会科学简史自20世纪80年代以来,社会科学下属的多类学科在不同时期经历了对计算机等辅助工具的采用、放弃、边缘化和重新利用的方法论发展过程,虽然很难准确把握计算社会科学的发展轨迹,但可以勾勒出大致进程轮廓。20世纪50年代到60年代,初期的动态系统理论和人工智能辩论推动了复杂性科学(complexity science)的诞生以及基于主体的建模(agent-based model)在社会学和行为经济学中的普及。20世纪80年代,得益于信息科技的进步,社会研究领域出现了数据挖掘等多元研究方法雏形。20世纪90年代,互联网数据、复杂性研究、城市系统建模在社会研究领域建立了多元联系。进入21世纪后,生产量化数据的计算模型被广泛运用与认知、决策、社会互动等研究领域的系统分析中。随着数字平台、社交媒体和智能手机的普及,计算社会科学加强了对多元且新颖数据的采用,这也将其同以信息技术为工具基础的社会科学区分开来。因为前者是处理实时海量数据,而后者则是依据计算机程序来处理定量社会数据。计算国际关系学很大程度上源于但又不完全依赖于计算社会科学,而是以权力、冲突与和平、国家行为等国际关系议题为核心,并将研究对象拓展至非国家行为体。计算国际关系学依靠大量数字社会足迹来挖掘和处理现实事件,侧重于观测产生海量数据的在线活动变化,这使得其超越了定性和定量的方法论分歧,突破了现有研究限制。2.绘制图谱:计算国际关系学的主要问题计算国际关系学作为新兴学术领域,其研究边界尚不明确,可以尝试从语言、制图、建模、通信和互联网五方面进行探究。(1)语言与文本语言学一般用于社会科学和国际关系学的定性研究,但信息技术的出现为有关文本的定量研究提供了可能性。定量语言学于20世纪60年代便已存在,但同国际关系相关的计算语言学则是新兴议题。文本的数字化与语音识别技术极大地便利了数据检索,赋予了文本可搜索、可量化、可测量的可能性。而且文本挖掘工具的出现使得学者不仅可以进行信息检索,还能在超大文本数据集间探寻多元联系、建立关系图谱。主要有三类文本挖掘工具:一是信息检索,称得上最古老同时也是最容易借助编程复制的文本挖掘工具,主要通过匹配特定词汇来实现数据搜集;二是自然语言处理,主要通过建立语料库来实现信息提取与数据挖掘,将文本分析引入了人工智能领域;三是信息提取,依托自然语言处理搭建的语料实现文本数据的非结构化到结构化的转变。文本挖掘同话语分析、过程追踪等其他研究方法共同使用将事半功倍,但要特别注意语料库建设中对不同文本细微差别的把握与展现,避免概念过度延伸或者建立无关紧要的数据库。(2)制图制图和地理空间分析是国际关系的核心,是剖析战争、冲突和不平等现象的重要工具。制图研究主要是指将坐标、海拔等地理位置信息同其他统计数据相结合进行可视化分析。如今的智能设备和社交软件往往自带位置信息,这为社会科学带来了新的研究要素,包含地理信息的社会数据集助力学者细化研究颗粒度,深入探究政治现象的因果关系。地理空间研究既可以在地理信息系统专用程序上实现,也能在具备地理信息系统插件的编程平台上进行。此外,地理空间数据可分为两类:一是矢量数据,即地图上指定或是包围特定坐标的点和多边形;二是栅格数据,即三维立体呈现地图的航空图像和数字地面模型,这对分析水文和交通系统至关重要。相关数据集通常储存在专用地理数据库中,用户可以从中下载有用信息,也可以通过手动输入或信息技术来生成自己的数据库。地理空间信息集成技术实现数据可视化的同时,还有助于学者对现实现象或学术理论进行检验。(3)建模对社会事件进行数学和物理建模不足为奇,早在20世纪60年代便有学者将自然科学原理与函数计算用来分析社会现象。在过去十年中主要有数学模型、物理模型和生物有机模型三类建模方法,信息技术的发展显著提升了以上模型的说服力与影响力。第一,社会科学的数学建模建立在一个争议性的假设之上,即人类行为归属于一定常量范围内,并能进行数字化观测。该建模有效弱化了主观性的干扰,因而被广泛运用于检验平衡、稳定、秩序等方面,且效果斐然。第二,社会科学的物理建模受制于彼此学科间联系性文献的缺乏,因而更为复杂,且并不直观。但随着跨学科研究学者的努力,情况有所改善,社会科学研究中出现了两大物理模型运用热潮。第一种是处理粒子系统相互作用的细胞自动机(cellular automata),兼职美工主要用于处理社会科学中的危机扩散事件。例如,可运用该模型来预测冲突事件扩散至不同邻国的事件与可能性,准确把握冲突扩散的距离和速度。第二种是观测一定温度下微观粒子运动速度的概率分布的温度模型(temperature models),主要用于分析分析联盟或一定区域内的外交压力、国际社会拉帮结派或推卸责任的行为。例如,在外交压力下一国可能会碍于盟友权势而跟随其签署有损本国利益的条约。第三,生物领域的流行病学模型(epidemiology model)远比其他模型更能深入剖析社会科学议题。流行病建模主要描述疾病通过预先设定的媒介网络进行传播的过程,社会科学学者借此来理解暴乱、抗议、移民等多类集体行动与民众动员。流行病学模型的独特之处在于其基于无序性、不确定性和复杂性来进行测量与理论概念化,极大地便利了对社会行为的数字化监测。(4)通信数字技术带来了通信领域的新一轮发展飞跃,便利了人与人之间的沟通。社交媒体的兴起实现了在互动式环境中对人类交流的观察,促进了对信号传递、认知偏差等议题的探讨。此外,社交媒体从根本上改变了信息传播的途径,而且大数据会依据用户的差异化偏好进行精准推送,这加剧了民众观点的分化与对立。因此,政治信息的网络传播途径及呈现方式成为了政治学和国际传播学研究的重要争论点。数字空间中网络机器人是通信领域的新兴热点。网络机器人加剧了假新闻和误导性信息的散播,扰乱社会风气,且背后不排除人为因素的引导。对此,学界给予充分重视,竭力探寻该类机器人如何在换届选举或国际危机等重要时期发布相关信息掀起舆论风浪。网络竞选对政治进程和社会动员的影响力也是通信领域中同国际关系密切相关的重要课题。许多学者投身其中,探讨了在线竞选的作用、网络政治信息对个人行为的影响等诸多议题。(5)互联网数字网络研究日趋流行,学者借此研究数字空间中政治与权力关系互联,明晰国家的外交网络的同时探寻非国家行为体间的互动往来。经典网络理论(classical network theory)侧重于个人社交网络及正式契约关系的分析,为主体间复杂的互动往来建构分析框架,不论是宏观还是微观层面的关系都能被其有效概念化和理论化。因为网络理论并未采用国际关系主流的分析方法,而是重点关注不同层次和主体间的互动从而探寻背后的因果关系。而且得益于现代信息技术,网络理论还能够依托人工智能、机器学习等来观测各类关系的实时变化。如何成为一名合格的计算国际关系学学者
当前尚未有专业化规模化的计算国际关系学项目,但是可以通过学习计算社会科学的知识来明晰计算国际关系学的发展方向。计算国际关系学培训大致分为两方面。第一是关于学生的技术基础。数据可视化、建模、估算及统计能力是首要前提,在此基础上了解满足计算需求的多元数据类型、处理原则以及主流程序运用。同时还应加强应对复杂性研究的定性课程培训,从而提升学生整体分析总结能力。第二是关于学者技术能力的掌握与更新。同语言一样,计算机科学也需要日常使用来记忆和储存相关运用知识。而学者应以思考以下三个问题:能否掌握计算科学分析工具;如何在理论建设和计算机科学方法论之间取得平衡;哪些计算工具需要自己运算,那些可以外包。结合实际来说,至少需要半年来熟悉计算机科学领域的研究方法,探究如何借助文本和软件实现数据可视化。虽然计算机的研究方法不断更新迭代,但其基本原理并不会发生根本性的变化,也就是说掌握基本的编程语言和功能后将显著提高对新型编程知识和平台的适应能力。同时,在这一过程中要暂时忘却社会科学学者的身份,全身心沉浸于计算机科学思维以探寻全新研究视角。计算国际关系学培训最难的部分是掌握计算机科学原理与方法后,要主动回归社会科学这一起点,在核心理论读物的引领下重新思考该领域基础知识的价值意义与创新方向。冲突研究学者如何从计算国际关系学中获益?
计算国际关系学难以借助应用于单一性研究问题来解释,其重点研究方向是冲突影响下社交媒体与国际政治、比较政治发展的关系。近年来冲突事件研究开始关注量化计算,数据的存在方便学者跟踪冲突模式、目标选择以及单一或多重边界争夺事件。大部分数据都来自于国家层面或者报道战场动态的主流媒体公司,但是如果以上主体无法进入的冲突禁区又该如何获取数据呢?社交媒体的出现为此带来重大转折。非国家行为体的民众以及武装分子开始利用社交媒体展示武装冲突、死亡报告等重要信息,禁区内的战斗和内幕情况借助数字化力量以地理标签的形式逐分钟更新传播。而这为相关研究学者提供了绝佳的冲突计算数据,成为了数字社会学的早期衡量标准:在日益互联的世界中,什么是集体行动的最基础来源?在紧急时期,哪种社会组织力量能够动员群众采取集体行动?数字世界的破坏和干扰者也是热门议题,例如国际危机期间的假新闻。针对危机期间的数字化传播,本文综合现有文献及现实事件后认为网络水军,即自动化算法操控的社交媒体账号集群所发送的推文会在短时间内(15-20分钟)不成比例地增加,并会在某一个时间节点骤减至消失。而由人类发送的网帖的大多呈现阶段式变化趋势,整体持续性更优。国际关系学如何从大数据和机器学习中获益?
大数据和算法彻底改变了社会科学,并会影响国际关系学今后几十年的发展方向。计算科学研究的潜力在于:一是数据规模庞大,传统的定量或定性工具难以高效应对处理;而是计算科技的存在使得学者能够放大或缩小人类行为的各个层面以深入探究相关问题。数据革命推动学界重新思考国际关系研究的分析层次问题,大数据为行为、认知偏差、世界观等微观层面研究提供了方法层面的可能性,并为探究集体行动、民族主义运动等中观层面以及意识形态、身份认同等宏观层面问题提供了庞大的数据量。大数据和计算工具能帮助学者更好地模拟和理解人类行为,但也存在滥用和夸大的风险,因为大数据研究就过于依赖信息工具的处理能力而忽视了文化差异和区域差异。对此,应超越计算机研究本身,建立跨学科关联,借助智能算法来追踪全球民族主义情绪、国际危机时期舆论等重要议题。未来的国际关系研究者也应拥有基础编程能力,从而为同计算机科学的互动打下基础。词汇积累
natural language processing, NLP自然语言处理automated text analysis 自动化文本分析法译者:沈好文,国政学人编译员,吉林大学国家安全学专业研究生。
校对 | 丁伟航审核 | 丁伟航排版 | 赵弘宇本文为公益分享,服务于科研教学产品建模,不代表本平台观点。如有疏漏,欢迎指正。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。 特别声明:以上内容(如有图片或视频亦包括在内)来源于网络,不代表本网站立场。本网站仅提供信息存储服务。如因作品内容、版权和其他问题需要同我们联系的,请联系我们及时处理。联系方式:451255985@qq.com,进行删除。