合肥工业大学在视听多模态场景理解研究方面取得进展_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

2026年传感器技术、自动化与智能制造国际会议（STAIM 2026）

第十一届材料科学与工程国际学术会议(ISAMSE 2026）

第二届导航、检测与控制国际学术会议（CNDC 2026)

第三届图像处理、多媒体技术与机器学习国际学术会议（IPMML 2026）

2026年智能医学与图像计算国际会议 (IMIC 2026)

第三届虚拟现实、图像和信号处理国际学术会议（VRISP 2026）

2026年具身智能、机器人与控制系统国际学术会议（EIRCS 2026）

第五届信息经济、数据建模与云计算国际学术会议（ICIDC 2026）

第三届数字媒体、通信与信息系统国际学术会议（DMCIS 2026）

2026年智能机器人与控制技术国际会议（CIRCT 2026）

第五届机械电子工程与人工智能国际学术会议（MEAI 2026）

第六届先进制造技术与电子信息国际学术会议（AMTEI 2026）

第十一届计算机与信息处理技术国际学术研讨会（ISCIPT 2026）

第三届大数据、神经网络与深度学习研讨会（BDNNDL 2026）

第六届计算机视觉、应用与算法国际学术会议（CVAA 2026）

2026年IEEE计算机通信、信息系统与网络安全国际会议(CCISC 2026)

2026年第五届算法、数据挖掘和信息技术国际会议(ADMIT 2026)

2026年人工智能与机器人系统国际会议(ICAIRS 2026)

2026年IEEE人工智能、大数据与云计算国际会议 (AIBDCC 2026)

2026年IEEE第二届电力与可持续能源技术国际会议(PSETC 2026)

合肥工业大学在视听多模态场景理解研究方面取得进展

2024/04/12

图视听多模态场景理解研究示意图

　　在国家自然科学基金项目（批准号：61725203、62020106007、62272144、72188101）资助下，合肥工业大学汪萌研究团队在视听多模态场景理解研究方面取得进展。最新研究成果以“沿着视听事件线的对比正样本传播（Contrastive Positive Sample Propagation along the Audio-Visual Event Line）”为题，近日在线发表于《IEEE模式分析与机器智能汇刊》（IEEE Transactions on Pattern Analysis and Machine Intelligence, TPAMI），论文链接：https://ieeexplore.ieee.org/document/9956870。

　　自然生活中充斥着大量的声音和视觉信号，且两种信号往往伴随发生，比如，在一场音乐会中我们既能看到演奏家在深情地演奏乐器，也能听到美妙的音乐声。得益于听觉和视觉这两种最重要的感官，人类可以更全面准确地认知周边事物。如何让机器模仿人类这种智能，理解多模态的视听信号，是一个具有挑战且蕴含巨大价值的科学问题。

　　该团队从探究音频信号和视觉信号的对应关系入手，针对视听事件定位任务提出了简单高效的正样本传播网络。该方法能够让模型从视频中感知最高度相关的音频-图像片段对进行特征聚合，从而学习更具判别力的视听特征表达。该方法相比于领域内现有其他研究方法，可在网络可学习参数量降低近90%的情况下，取得具有竞争力的性能。同时，该团队还构建了一个大规模的视听事件定位任务数据集，并基于此做了网络的泛化性研究。

　　近年来，团队联合商汤科技等提出视听分割任务，让机器学习拥有定位并分割出发声物体的智能，相关研究工作以“视听分割（Audio-Visual Segmentation）”为题发表在当年《欧洲计算机视觉会议》（European Conference on Computer Vision）上。最新的研究成果聚焦于让机器对一个视频生成包含音频和视觉信息的精细化描述，相关工作以“精细化音视频描述 (Fine-grained Audible Video Description)”为题被2023年《计算机视觉和模式识别会议》（IEEE Computer Vision and Pattern Recognition conference）接收。

版权声明：
文章来源国家自然科学基金委员会，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

相关学术资讯

研究发现亚热带常绿阔叶林优势树种防御策略的种间差异性

温州医科大学教授在类风湿关节炎病变机制研究方面取得进展

研究揭示植物无性繁殖结构通过贝氏拟态实现鸟类介导的内源性传播

清华大学化工系王铁峰、陈晓合作揭示金属有机框架中配体取代基对局域结构刚性的影响

清华大学化学系张韶光团队提出磷中心以单电子和双电子途径活化卤代烃新策略

非洲猪瘟关键致炎“密码”被破解

清华大学材料学院钟敏霖团队在超薄高效散热和液膜蒸发领域取得重要进展

中国科学院大学在全球可持续发展进程与人类主观幸福度关系方面取得进展

北京大学环境学院朱彤团队发现大气污染影响动脉粥样硬化的潜在分子机制

上海交大溥渊未来技术学院王敏强团队在《Chemical Reviews》发表封面综述文章：可穿戴生物电子的替代微/纳米加工方法