当前位置:首页 >> 学术资讯 >> 科研信息

北京大学团队“AI+人文”跨学科研究取得标志性成果

2024/03/26

由北京大学人工智能研究院支持、北京大学数字人文研究中心研究并设计、北京大学王选计算机研究所参与研发的有关定量文化分析系统的研究论文登上Nature旗下唯一人文社科期刊Humanities and Social Sciences Communications。该项研究的发表与介绍核心算法的研究论文在该刊的发表相距不到一年。两篇论文的详细信息如下:

Evol project: a comprehensive online platform for quantitative analysis of ancient literature  

Jun Wang, Siyu Duan*, Binghao Fu, Liangcai Gao & Qi Su,  Humanities and Social Sciences Communications  volume 11, Article number: 291 (2024)

Disentangling the cultural evolution of ancient China: a digital humanities perspective

Siyu Duan, Jun Wang, Hao Yang & Qi Su*,  Humanities and Social Sciences Communications,  volume 10, Article number: 310 (2023)

Evol Project一文介绍了数字人文中心跨学科团队开发的古文献溯源分析平台原型系统。该平台应用深度学习技术对大规模古典文献集进行定量文化分析,追溯中华思想文化观念的源流及其在后世的演化轨迹,在词汇、句子和文档三个层面提供数据驱动的人文研究组合工具。该平台为人文学者应用定量分析方法从事思想史和文化史研究提供了便利。下图分别展示了《老子》与一众道家文献的书本级互文网络、篇章级互文分布与句子级互文频率统计,借此观察典籍文献中所蕴含的思想观念在后世文献中的递相传播和演化。

4ecdc49d891843119b908877224a46b7.png

为此,平台汇集了目前能收集到的唐以前的所有数字化典籍,加上《二十四史》《资治通鉴》以及若干精选典籍和文章总集,共计201种30,880篇,5千余万字符,内容涉及哲学、历史、政治、文学、宗教等多个领域。平台除了常见的浏览、检索和频率统计等基础功能外,特色在于提供了文本重用、词共现、历时性n-gram等定量文化分析功能,配备了多样化的可视化呈现。用户通过简单的点击操作,就能观察千余年的思想演化轨迹。

论文介绍了几个基于该平台的文化分析案例。下图展示了历代史料中与游牧民族名称共现的词汇的负面情绪分数变化。从图中可以看出,史料文字中对游牧民族的负面情绪整体上是逐渐降低的,这印证了传统民族研究的主流观点:从历史发展的大尺度上看,中华各民族互相依存、趋于融合是大趋势。

该原型系统已经开放使用,访问网址见:http://evolution.pkudh.xyz/。在此基础上,数字人文研究中心和王选计算机研究所合作开发了应用级的古文献溯源分析系统,访问地址见:https://ca.pkudh.org/

Disentangling Cultural Evolution论文描述了上述系统的核心算法原理。论文应用深度神经网络在上述数据集上遍历计算数百万相似互文对,随后使用一个层次框架将相关文献组织起来构建文献互文网络。基于该网络的节点特征,计算任意两部文献之间的标准化互文分数作为检验各类文化现象的依据。论文首先计算若干通识性文化现象的互文指数,以验证互文分析方法的有效性,例如:宋明理学文献与先秦儒家典籍存在显著的互文联系;《参同契》《文始真经》《阮籍集》《嵇康集》这些道教及魏晋玄学类文献与先秦道家文献存在显著的互文联系。论文应用互文指标分析若干在传统人文研究中有争议性的问题,发现:《吕氏春秋》在先秦学术流派维度上有相对均匀的互文分布,但略偏向道家;《陶渊明集》中有作者争议的篇章与其他篇目的互文分布确实存在偏差。

下图展示了《陶渊明集》与儒、道、墨、法、兵五家学派的互文联系强弱。Collection1代表陶渊明集中有作者争议的《五孝传》和《四八目》,Collection2代表其余文本。

论文以史料和历代文总集作为历时性数据的观察对象,计算先秦诸子典籍与各时代的互文强度,以观察两千年间诸子百家的兴衰更替,将一系列历史事件的影响予以定量测度和可视呈现。在下图中,可以清晰地观察到秦朝重用法家,两汉罢黜百家独尊儒术,以及道家玄学在两晋的复兴等。

两项研究成果的取得,得益于跨学科团队的精诚合作。北京大学信息管理系教授王军与外国语学院长聘副教授苏祺、人工智能研究院副研究员杨浩(哲学系原教师)组成跨学科研究团队共同指导研究工作。信息管理系博士生段思宇相对独立地探索钻研,先后得到李佳纯、付炳豪等同学的协助。来自计算语言学研究所的罗睿轩和毕潇晗同学承担了原型系统初期的开发工作。系统研发得到了王选计算机研究所的大力支持,副所长高良才调动工程技术力量参考Evo Project原型系统开发了应用级的古文献分析系统,展现了北京大学跨学科交叉协作的力量。


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

2026年IEEE第八届软件工程和计算机科学国际会议(CSECS 2026)(2026-04-17)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年神经网络、深度学习与智能计算国际会议(IGADL 2026)(2026-3-27)

2026年生物医学与信息技术国际会议(ICBIT 2026)(2026-4-29)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-3-27)

2026年计算机网络与信息工程国际会议(ICCNIE 2026)(2026-3-29)

2026年人文科学、艺术与语言国际会议(ICLHA 2026)(2026-4-28)

2026年数学,天文学与测量国际会议(ICMAM 2026)(2026-3-27)

2026年新能源科学、生态经济与绿色发展国际会议(NESEEGD 2026)(2026-5-28)

2026年数据驱动、应用统计与数学国际会议(ICDDASM 2026)(2026-4-27)

2026架构设计、云数据处理与智能制造国际会议(ADCDPIM 2026)(2026-4-28)

2026年风景园林与生态建筑、可持续发展国际会议(ICLAEASD 2026)(2026-5-27)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年第五届云计算、计算机视觉和图像处理.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年多尺度人工智能国际会议(MAI 2.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年传感器技术、自动化与智能制造国际会.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.

2026年第七届控制, 机器人与智能系统国际.