当前位置:首页 >> 学术资讯 >> 科研信息
小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

【长春电子科技学院主办】第二届计算机网络技术与电子信息工程国际学术会议(CNTEIE 2024)

【IEEE出版,沈阳工业大学、IEEE Power & Energy Society联合主办】第四届智能电网与能源互联网国际会议(SGEI 2024)

【连续四届完成EI、SCOPUS检索,检索稳定,见刊后1个月检索】第五届材料化学与复合材料国际学术会议(MCCM 2024)

【SPIE出版,EI稳定检索】2024年信号处理与神经网络应用国际学术会议(SPNNA 2024)

2024年IEEE亚洲先进电气与电力工程会议(ACEPE 2024)

【东北林业大学主办,JPCS独立出版 | 稳定EI、对学生友好、性价比超高】第三届智慧能源与电气工程国际学术会议(SEEE 2024)

【IEEE独立出版,岭南师范学院主办,连续4届完成 EI, Scopus, IEEE Xplore检索】第五届IEEE信息科学与教育国际学术会议(ICISE-IE 2024)

【EI,Scopus检索 | 往届已见刊检索】第五届应用力学与机械工程国际学术会议(ICAMME  2024)

【高届数,往届EI检索】第十届能源资源与环境工程研究进展国际学术会议(ICAESEE 2024)

2024年第七届数据科学与信息技术国际会议(DSIT 2024)

2024年第七届算法,计算与人工智能国际会议(ACAI 2024)

【ACM独立出版丨EI稳定检索丨往届100%检索丨 郑大、浙大、河工大等高校联办】第三届信号处理、计算机网络与通信国际学术会议(SPCNC 2024)

【SPIE (ISSN: 0277-786X)独立出版】2024年能源技术与电气、电力国际学术会议 (ETEP 2024)

【中南大学土木工程学院主办,往届均已见刊检索】第六届建筑学研究前沿与生态环境国际研讨会(ARFEE 2024)

【江苏科技大学主办 | IEEE出版,往届均已成功出版和EI, Scopus检索】第九届清洁能源与发电技术国际学术会议(CEPGT 2024)

【华东交通大学主办 | SPIE (ISSN: 0277-786X)独立出版】第四届机电一体化与智能控制国际学术会议(MIC 2024)

【浙江水利水电学院、中国计量大学、西安石油大学联合主办 | IEEE 出版】2024年第五届新能源与电气科技国际学术研讨会 (ISNEET 2024)

【IEEE出版 | 南京师范大学、广西大学联合主办 | 往届均已EI、Scopus检索】第四届电气工程与控制科学国际学术会议 (IC2ECS 2024)

2025年IEEE第七届软件工程和计算机科学国际会议(CSECS 2025)

2024年第七届计算机图形,图像和可视化国际会议(CCGIV 2025)

2025年IEEE 第五届先进电气,电子与计算技术国际会议(EECT 2025)

会议展示区

第十二届信息系统与计算技术国际会议(ISCTech 2024)

【多高校支持举办,SPIE出版,见刊检索稳定!】2024年遥感技术与图像处理国际学术会议(RSTIP 2024)

【IEEE出版,马来西亚北方大学支持,往届均已见刊检索】第六届管理科学信息化与经济创新发展学术会议(MSIEID 2024)

【华南理工大学主办,华南理工大学土木与交通学院承办】第六届水利与土木建筑工程国际学术会议(HCCE 2024)

【IEEE独立出版 | 厦门大学主办 | 往届均已成功见刊检索】第四届人工智能、机器人和通信国际会议(ICAIRC 2024)

【黑龙江大学电子工程学院主办,EI Compendex 和 Scopus 检索】2024年先进成像、检测和信号处理国际学术会议(AIDSP 2024)

第九届机器学习与软计算国际会议(ICMLSC 2025)

北京大学人工智能研究院朱松纯、朱毅鑫团队在可理解和解释直觉物理违反预期现象的研究方面取得进展

2024/03/26

北京大学人工智能研究院朱松纯教授、朱毅鑫助理教授及团队,与北京通用人工智能研究院张驰研究员联合在ICCV 2023会议上发表论文,题为“X-VoE: Measuring eXplanatory Violation ofExpectation in Physical Events”。

该研究的核心目标是构建能够类似人类般理解和解释物理“魔术”现象的智能体,尤其是在某些元素被遮挡或不可见的情境中。通过这项研究,团队不仅提出了一种全新的评估方法,以衡量智能体对物理常识的理解和解释能力,还展示了在无监督的条件下,如何利用物理常识推测遮挡现象背后可能的场景解释。

构建具有人类般思考能力的智能体,特别是借鉴人类婴儿早期智能的发展历程,是人工智能研究的重要方向。虽然直觉物理的重要性已逐渐得到认识(Battaglia, et al., 2013; Piloto, et al., 2022),但现有研究往往仅将其视为一个预测问题(Piloto, et al., 2022; Riochet, et al., 2021),而忽视了对观察结果的解释过程。发展心理学家通过设计“魔术”般的违反预期实验(VoE)来探索人类早期对直觉物理的认知能力(Baillargeon, et al., 1985; Baillargeon, 2004)。他们发现,人类的惊讶不是来自于物理事件本身,而是来自于在事件发生后仍然无法解释的观察结果(Andréa & Baillargeon, 2002; Baillargeon, 1994)。这揭示了在VoE实验中,解释过程是不可或缺的。论文的作者戴博强调,这项研究旨在推动AI学习和模拟人类对直觉物理的理解,特别是在视觉中对事件观测不完全时的可解释性,为后续进一步提升AI的解释能力提供了启示。

VoE通过比较婴儿对可能事件和不可能事件的反应来检验其认知能力。如图所示,即便是婴儿,也能对奇异的物理现象,例如物体神奇地穿过另一个固体或在未接触的情况下弹回,产生惊讶(surprise)反应。实验通常包括展示一系列严密设计的事件给婴儿,这些事件要么符合,要么违反婴儿对物理世界和物理规律的预期。通过这种对比实验设计,研究人员可以观察和分析婴儿是否有惊讶反应来判断婴儿对物理世界的理解。受此启发,DeepMind和MIT等机构的研究团队也采用VoE作为测试智能体对直觉物理认知的方案(Piloto, et al., 2022; Smith, et al., 2019)。然而,这些研究主要关注智能体的预测能力,而较少考虑其解释能力。因此在AI的直觉物理认知研究中,解释能力需要进一步探索。

研究团队通过如下图所示的三种不同测试方案完成对解释能力的综合评估;每个图中,上图是提供给算法的输入,下图是算法输出的对VoE的解释结果。

评估方案:这三种测试设置中最简单的是预测性设置,如下图所示。当一开始所有的物体都可被观测(即不存在隐藏变量),任何一个预测模型都可以预测视频将要发生什么,从而判断视频是否违反物理定律(即产生类似婴儿般的惊讶)。这也就意味着,在这一设置条件下,无法区分模型是否具有解释能力。然而,在假设性设置中,根据是否对隐藏因素进行推理,其结果可能会大相径庭:仅凭视觉感知,年龄越小的婴儿越可能会对球返回起点而非直接穿过感到惊讶;但随着解释能力的提高,其会认为墙后隐藏着阻挡者,因而不会感到惊讶,就像知道魔术秘密的观众不会对魔术感到惊讶一样。最后在解释性设置中,由于场景设置在最后才被揭开,这一后续提供的信息会使之前发生的物理过程违背物理定律,而仅使用预测模型无法利用这一后续信息,相反,具有解释能力的模型可以利用这一信息从而给出与预测模型完全相反的结果。通过这三种实验设置可以帮助区分智能体在处理VoE事件时是否具有解释能力。

fd51159f269c46a08ff0c54cfd17584b.jpg

三种不同的测试方案

数据集:基于上述三种不同的实验设置方案(分别标记为S1、S2、S3),研究者们创建了如下图所示的四个经典的测试场景,包括球体碰撞(collision)、阻挡(permanence)、物体持久性(permanance)和物体连续性(continouity)。为了测试不同的直觉物理定律,每个场景(除物体持久性)都设计了三种独特的设置:预测、假设和解释。为了准确实现VoE的效果,在每个场景中的物体前都添加了遮蔽墙,以隐藏某些物体,通过改变墙壁的升降来实现不同的效果。在每种情况下,使用具有相同设置识别码(S1、S2、S3)来连接每种设置下测试视频中的帧。从起始帧(第一行图像)到结束帧(第三行图像),黑色连接表示符合直觉物理的视频,而红色连接表示不符合直觉物理的视频。值得注意的是,该数据集的设计主要目的是用于测试模型对于直觉物理的理解,通过这种设计,可以全面评估模型在不同场景和设置下的解释能力,为进一步的研究和开发提供有价值的参考。

球体碰撞(collision)、阻挡(permanence)、物体持久性(permanance)和物体连续性(continouity)四个测试场景

包含可解释模块的物理学习模型:为了嵌入解释能力,研究人员在现有的基准模型PLATO的基础上增加了解释模块,构建出如图所示的解释能力集成的物理学习模型(XPL)。所提出的XPL模型包括三个主要组成部分:(1)感知模块,负责提取以物体为中心的表征,为下游处理提供基础;(2)解释模块,负责从空间和时间维度推断被遮挡物体的状态;(3)动态模块,负责学习物理知识并评估被遮挡物体的解释结果。这三个模块共同工作,使得XPL模型能够在处理物理事件时,不仅能预测结果,还能为预测结果提供合理的解释。通过这种设计,XPL模型为在AI中探讨和实现解释能力提供了新的可能路径,有助于推动相关研究的进一步发展。

解释能力集成的物理学习模型(XPL)

可视化:该工作的一大亮点是加入了解释过程。下图可视化地展示了在阻挡场景下三种不同设置中,模型解释模块推理并恢复出的被遮挡的物理过程,从而解释了观察结果,并根据解释后的物理过程,判断是否违反了直觉物理。

4724a77250fe43e5941b6f9bf8d34b48.jpg

在阻挡场景下三种不同设置中,模型解释模块推理并恢复出的被遮挡的物理过程

定量分析:我们从整体和对比两个角度分析了模型的准确率,并与PLATO和PhyDNet两个经典模型进行了对比。

1、综合准确率(参考Smith, et al., 2019):为了评估一个模型在违反和不违反直觉物理现象中的综合表现,综合准确率将违反和不违反的物理场景进行配对并交叉验证,测试模型的准确率。结果如下图所示:在所有测试场景中,研究者提出的XPL都表现出了更好的性能,尤其在碰撞、阻塞和持久性方面。

综合准确率

2、相对准确率(参考Piloto, et al., 2022):为了进一步评估模型对直觉物理的解释能力,相对准确率要求模型判断给定一组的视频中,哪一个相对更违反直觉物理。在预测环境(S1)中,因为这一任务仅依赖预测能力,所以已有的AI系统都能取得较好的结果,接近人类的水平。

真正区分出不同模型的优劣,尤其是与人类水平之间差距的,是在假设环境(S2)和解释环境(S3)中的变化率。在S2中,婴儿在实验中没有展现出VoE,这可能意味着其不具有物理常识,也有可能包含了解释能力,即相对率应为50%;转换到S3中,由于后续提供的额外信息,婴儿能分辨出VoE,即100%。这一由极少量额外信息引发的对VoE的分辨能力变化(50%到100%)是之前直觉物理模型无法实现的。而研究者提出的XPL较好地捕捉到了这一变化,尤其是在碰撞和阻塞场景中。

相对准确率

在这项工作中,研究人员重点突出了直觉物理理解中解释能力的重要性。具体地,研究人员提供了一个新颖的包含测试解释能力的违反预期视频数据集,同时还提出了一个包含解释能力的模型来处理相关隐藏变量(即被遮挡的物体)。

实验结果表明,该模型可以利用学到的直觉物理还原被遮挡物体,并因此在测试数据集上对比其他缺少解释过程的模型拥有更好的表现。值得注意的是,模型对被遮挡物体的解释结果经过可视化后,也能较为符合人类的认知,这突出了它对隐藏因素进行推理的能力。

本文的第一作者是北京大学博士后戴博(朱松纯指导),通讯作者为朱毅鑫、张驰研究员。论文作者还包括清华大学王林歌以及北京通用人工智能研究院的贾宝雄和张泽宇研究员。


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2024年大数据与人工智能学术会议(BDA2024)(2024-10-18)

科技计划管理改革暨国家科技计划项目申报和科研平台建设运行、科研资金全过程管理使用高级研修班(2024-10-23)

第十四届管理与服务科学国际会议 (MASS 2024)(2024-10-25)

2024年生物医学、公共卫生与心理健康国际会议(BPHMH 2024)(2024-10-29)

2024年文学艺术、媒体传播与社会发展国际会议(ICLAMSD 2024)(2024-10-31)

第十一届电气工程与自动化国际会议 (IFEEA 2024)(2024-11-22)

2024年第三届通信,信息系统与数据科学国际会议(CISDS 2024)(2024-11-22)

2024马来西亚应用心理学会议(MCAP 2024)(2024-11-28)

2024年计算机视觉与艺术研讨会(CVA 2024)(2024-11-29)

2024新材料、应用化学与工业催化国际会议(NMACIC 2024)(2024-12-01)

2024年先进材料、机械电子与电气工程国际会议(ICAMMEE 2024)(2024-11-10)

2024年综合艺术、绘画与摄影国际学术会议(ICIAPP 2024)(2024-12-5)

2024年教育、管理与服务科学国际会议(ICEMSS 2024)(2024-12-20)

2024年航空航天与遥感技术国际会议(ICARST 2024)(2024-11-6)

2024媒体传播、语言与艺术设计国际会议(ICMCLAD 2024)(2024-11-8)

2024年第三届计算机应用技术国际会议(CCAT 2024)(2024-11-15)

2024教育、艺术鉴赏与管理国际学术会议(ICEAAM 2024)(2024-11-17)

2024农业经济、农村发展与农业管理国际会议(ERDAM 2024)(2024-12-11)

2024年公共文化与社会服务国际会议(ICPCSS 2024)(2024-12-7)

2024年电力系统与储能技术国际学术会议 (PSEST 2024)(2024-11-8)


2024年信息光学与光电技术国际学术会议(CIOT 2024)
第四届文化、设计与社会发展国际学术会议(CDSD 2024)
第六届国际科技创新学术交流大会  暨通信、信息系统和软件工程学术会议(CISSE 2024)
第六届国际科技创新学术交流大会暨机械工程与自动化国际学术会议(MEA 2024)
第三届信号处理、计算机网络与通信国际学术会议(SPCNC 2024)