当前位置:首页 >> 学术资讯 >> 科研信息

合肥工业大学在视听多模态场景理解研究方面取得进展

2024/04/12


图 视听多模态场景理解研究示意图

  在国家自然科学基金项目(批准号:61725203、62020106007、62272144、72188101)资助下,合肥工业大学汪萌研究团队在视听多模态场景理解研究方面取得进展。最新研究成果以“沿着视听事件线的对比正样本传播(Contrastive Positive Sample Propagation along the Audio-Visual Event Line)”为题,近日在线发表于《IEEE模式分析与机器智能汇刊》(IEEE Transactions on Pattern Analysis and Machine Intelligence, TPAMI),论文链接:https://ieeexplore.ieee.org/document/9956870。

  自然生活中充斥着大量的声音和视觉信号,且两种信号往往伴随发生,比如,在一场音乐会中我们既能看到演奏家在深情地演奏乐器,也能听到美妙的音乐声。得益于听觉和视觉这两种最重要的感官,人类可以更全面准确地认知周边事物。如何让机器模仿人类这种智能,理解多模态的视听信号,是一个具有挑战且蕴含巨大价值的科学问题。

  该团队从探究音频信号和视觉信号的对应关系入手,针对视听事件定位任务提出了简单高效的正样本传播网络。该方法能够让模型从视频中感知最高度相关的音频-图像片段对进行特征聚合,从而学习更具判别力的视听特征表达。该方法相比于领域内现有其他研究方法,可在网络可学习参数量降低近90%的情况下,取得具有竞争力的性能。同时,该团队还构建了一个大规模的视听事件定位任务数据集,并基于此做了网络的泛化性研究。

  近年来,团队联合商汤科技等提出视听分割任务,让机器学习拥有定位并分割出发声物体的智能,相关研究工作以“视听分割(Audio-Visual Segmentation)”为题发表在当年《欧洲计算机视觉会议》(European Conference on Computer Vision)上。最新的研究成果聚焦于让机器对一个视频生成包含音频和视觉信息的精细化描述,相关工作以“精细化音视频描述 (Fine-grained Audible Video Description)”为题被2023年《计算机视觉和模式识别会议》(IEEE Computer Vision and Pattern Recognition conference)接收。


版权声明:
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025艺术、服装设计与纺织科学国际会议(FDTS 2025)(2025-07-26)

第八届声学、振动、噪声控制国际研讨会(CAVNC 2025)(2025-08-09)

2025年矿山工程、地质工程与环境工程国际会议(ICMEGEEE 2025)(2025-08-10)

标准化、信息化、智能化(AI)赋能科技成果评估转化与高价值专利布局高级研修班(8月青岛)(2025-08-13)

第六届清洁能源与电力工程国际学术会议(ICCEPE 2025)(2025-08-15)

2025年可信大数据与人工智能国际会议(ICTBAI2025)(2025-08-21)

2025年第三届智能制造与自动化前沿国际会议(CFIMA 2025)(2025-08-22)

第六届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2025)(2025-08-22)

第五届测量控制与仪器仪表国际学术会议(MCAI 2025)(2025-08-22)

第十届工程机械与车辆工程新进展国际学术会议(ICACMVE 2025)(2025-08-22)

2025通信技术、信息科学与系统科学国际会议(TISSS 2025)(2025-9-28)

2025年图书馆、档案管理与文献学国际会议(ICLAMB 2025)(2025-9-23)

2025第一届人工智能与可持续社会国际会议 (AISS 2025)(2025-11-28)

2025年文化、设计与社会发展国际会议 (CDSD 2025)(2025-8-13)

2025年密码学、生物识别与安全管理国际会议(CBISM 2025)(2025-9-15)

2025年第四届计算机工程, 技术与应用国际会议(CETA 2025)(2025-9-24)

2025人工智能、图像处理与计算机视觉国际学术会议(ICAIIPCV 2025)(2025-9-10)

2025年测量技术与地理信息系统应用国际会议(ICMTGISA 2025)(2025-9-18)

2025年传感器网络与环境监测国际会议(ICSNEM 2025)(2025-9-3)

2025年能源转换与材料科学国际会议(ICECMS 2025)(2025-8-9)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。