电子学院程翔团队首次提出“机器联觉”概念——通信与多模态感知智能融合领域的首个统一框架
2024/03/26
作为助力实现“万物智联”的核心技术之一,通信与感知融合技术是6G无线通信的一项关键技术。然而,现阶段主流的通信感知融合技术局限于通信与单一射频感知的融合(射频通感一体化),且局限于静态、低速场景,无法支撑6G典型应用场景的需求。为满足通信与感知系统极高的性能要求,需要挖掘通信与多模态感知之间存在的潜在关联,发挥“通”与“感”相互辅助的能力,促进通信与多模态感知的智能融合。
当前,通信与多模态感知智能融合领域虽已存在初步研究工作,但应用范围局限,缺乏系统框架来统一指导其设计思路与目标。受人类联觉启发,北京大学电子学院程翔教授团队在全球范围内首次系统化地建立并论述了通信和多模态感知智能融合的统一框架:机器联觉(Synesthesia of Machines, SoM),近日在权威综述性期刊IEEE Communications Surveys & Tutorials发表,旨在推动通信与多模态感知智能融合理论的研究发展并指导该领域的相关研究,助力实现B5G/6G时代的泛在连接和网联智能。
基于机器联觉概念,程翔团队通过定义机器联觉的三种工作模式,首次系统总结了通信与多模态感知之间相互辅助增强的范式,为通信与多模态感知智能融合领域提供了统一的设计目标与思路(图1)。其具体包括唤起模式、增强模式与合作模式:唤起模式是指在通信单元不工作的情况下直接增强通信系统的性能;增强模式是指通信单元在获得基本射频信息的基础上,利用多模态感知为通信单元带来性能增强;合作模式是通过多模态环境数据的融合强化智能体的环境感知能力。考虑多模态感知与通信之间的固有差异并受人类联觉中脑神经网络的启发,程翔团队指出人工神经网络是机器联觉的三种工作模式中的核心工具。与通常采用的数据驱动方式不同,SoM需要以模型增强数据驱动的方式应用人工神经网络,在分析、研究通信系统和感知系统特定任务的理论基础上,实现多模态感知与通信之间可信可解释的智能融合。
图1:SoM及其三种工作模式示意图
基于机器联觉的三种工作模式,程翔团队分析得出,机器联觉的研究需要有数据和理论两方面的研究基础。数据基础指的是通信与多模态感知智能融合数据集,理论基础是指通信与多模态感知联觉机理(映射关系)。当前,数据基础仍然缺乏,理论基础也尚不明确。为此,程翔团队构建了首个通信与多模态感知智能融合仿真数据集,提供了高准确性与高保真度的通信与多模态感知数据。基于数据集的支撑,程翔团队探索了多模态感知信息与信道大、小尺度衰落特性间的映射关系,旨在为后续相关研究提供有效指导。
该工作的主要亮点如下:
(1)首次提出通信与多模态感知智能融合的统一框架:SoM强调了多模态感知的作用,拓展了多模态感知与通信相互辅助增强的应用方向,适用于6G时代更具有挑战性的应用场景。SoM为研究者们提供了对于通信与多模态感知智能融合领域全面、清晰、深入的认知。
(2)首次总结通信与多模态感知相互辅助增强的方式:定义SoM的三个工作模式,首次全面系统地给出了通信与多模态感知之间智能融合的设计目的和方式。
(3)首次分析通信与多模态感知智能融合的研究基础:分析得出SoM研究需要以通信与多模态感知智能融合数据集作为数据基础和通信与多模态感知联觉机理(映射关系)作为理论基础。
(4)首次综述该领域研究现状并给出最新研究成果及思路:该工作首次综述了当前通信与多模态智能融合领域的相关研究工作。在此基础上,该工作给出了程翔团队针对三种工作模式开展的最新的研究结果及设计思路,展现了SoM在优化通信和感知性能上的巨大潜力。基于SoM-唤起模式,程翔团队首次探索了复杂高速移动场景下多模态感知数据与信道全(大、小)尺度衰落特性的复杂非线性联觉机理(映射关系)(图2a);基于SoM-增强模式,程翔团队提出以模型增强数据驱动的方式从多模态感知信息中挖掘不同隐式射频空间特征,设计了一系列高效通信系统传输方案(图2b);基于SoM-合作模式,程翔团队创新性地开展了基于任务语义的机器联觉协同感知工作,进行通信传输与环境感知网络联合设计,以优化非理想通信下协同感知性能(图2c)。
图2:程翔团队针对SoM的三种工作模式开展的最新研究结果及设计思路
该研究成果以“Intelligent Multi-Modal Sensing-Communication Integration: Synesthesia of Machines”为题发表在IEEE Communications Surveys & Tutorials上。该期刊2023年影响因子为35.6,在IEEE旗下所有期刊中排名第一,代表了该领域的学术前沿和未来的发展方向,年发文量仅有80篇。北京大学为该研究工作的第一完成单位,合作单位包括山东大学、香港科技大学(广州)、香港科技大学、三星半导体等。程翔为该论文的第一作者以及通讯作者。这项工作得到了国家自然科学基金委杰出青年科学基金、国家重点研发计划、新基石科学基金会科学探索奖等的支持。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年11月优质学术会议推荐 16
-
2025年机器视觉、智能成像与模式识 392
-
2025年第七届控制与机器人国际会议 576
-
2025年智能光子学与应用技术国际学 1529
-
2025年机械工程,新能源与电气技术 1790
-
2025年计算机科学、图像分析与信号 2065
-
2025年材料化学与燃料电池技术国际 1861
-
2025年自动化前沿系统、智慧城市与 10-23
-
2025年信息光学、遥感技术与机器视 10-23
-
2025年数字人文、文化遗产与语言学 10-23
-
2025年神经科学、生物信息学与智能 10-23
-
2025年语言认知、人工智能与计算建 10-23
-
2025年社会科学、应用语言学与人文 10-23
-
2025年传统机械、动力学与智能装备 10-23
-
2025年图像处理、物理建模与结构设 10-23
-
2025年两院院士增选有效候选人1145
-
2025最新JCR分区及影响因子4758
-
好学术:科研网址导航|学术头条分2033
-
2025年国际期刊预警名单发布!1930
-
2025年中科院期刊分区表重磅发8447
-
中国科协《重要学术会议目录(205134
-
吉林大学校长张希:学术会议中的提2840
-
清华大学地学系阳坤课题组揭示全球10-20
-
历史时期极端干旱灾害的数据评估和10-20
-
“清华化学百年论坛:塑造化学的未10-20
-
研究揭示植物激素独脚金内酯作为跨10-20
-
清华大学联合研发的“46MW大容10-20
-
清华大学(软件学院)-九疆电力建10-20
-
中国农业大学土地学院马韫韬教授团10-20
-
电子科技大学光电学院本科生在一区10-20
-
百奥泰国际会议(大连)有限公司+ 24103

-
兰州理工大学 23242

-
VFDAEW 23986

-
APISE 22944

-
天津飞音科技有限公司 8014

-
2016年教育科学与人类发展国际 2065

-
WILL 24062

-
先進成型技術學會 24037

-
河南省科学院 23447

-
北京仕而优教育科技集团有限公司 8162

-
上海广尧商务咨询公司 7915

-
湖南科技大学 21075

-
兰州泛海佳乙广告有限公司 18017

-
工程信息研究院 18005

-
中国知识产权研究会 18015

-
北京盛合技术研究院 21304

-
北京贝拓会展 18134

-
商业地产杂志 21011

-
重庆市化工职业学院 18169

-
华南出版社(广东)有限公司 1975

















761











































