浙江大学教授团队在跨媒体智能计算领域取得进展
2024/03/21
![]() |
图 基于多重知识表达的音-视频跨媒体感知算法,获ACM Multimedia 2023唯一最佳论文奖(1/3072)
跨媒体智能计算综合了人工智能与多媒体计算的相关核心技术,主要研究多媒体内容的对齐、表达、理解和推理等理论与方法,目标是实现对外部世界的智能化感知、认知与重现,对具身智能、元宇宙等领域的发展具有重要推动作用。
在国家自然科学基金项目(批准号:62293554、U2336212、61976185、U19B2043)等资助下,浙江大学杨易教授和肖俊教授项目组深入探索新一代跨媒体智能基础理论和计算框架,取得进展。项目组针对基于多重知识表达的跨媒体计算框架展开系统性研究,突破了纯数据驱动的跨媒体智能计算在可控性、可解释性、鲁棒性等方面的瓶颈;通过在跨媒体学习过程中综合深度特征表达、语义结构知识、知识图谱、大模型世界知识等不同抽象层次的知识,克服了以往单一知识形态无法兼顾强表征与易解释的不足,构建了更加可靠、可解释的跨媒体表达。与国内外跨媒体建模和计算技术相比,提高了跨媒体智能算法在复杂开放环境下的泛化能力、解释能力和推理能力。相关研究成果为跨媒体智能研究提供了新思路、新理论,推动了基于多重知识表达的新型跨媒体智能计算的技术发展,有望助力我国在知识和数据双轮驱动的人工智能方向上取得突破。
相关研究成果在《IEEE模式分析与机器智能汇刊(TPAMI)》(SCI一区、影响因子23.6、CCF-A类)、《神经信息处理系统大会(NeurIPS)》(CCF-A类、H5-index 309)、《IEEE国际计算机视觉与模式识别会议(CVPR)》(CCF-A类、H5-index 422)、《计算机视觉国际大会(ICCV)》(CCF-A类、H-index 254)等人工智能领域的国际期刊和会议上发表,并获得2023年多媒体领域国际学术会议ACM Multimedia(CCF-A类)唯一最佳论文奖(图)以及2021年浙江省科学技术进步奖一等奖,以及十余项CCF-A类会议国际学术竞赛的世界冠军,应邀在多个CCF-A类会议做学术报告。被来自哈佛、普林斯顿、卡内基梅隆、牛津、剑桥等高校和微软、Meta、亚马逊等企业的研究团队引用,获得多位国际学者的正面评价。成功应用于华为跨媒体搜索引擎,以及阿里、百度、海康威视等企业的业务场景。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
好学术:科研网址导航|学术头条分240
-
《时代技术》投稿全攻略:一位审稿254
-
2025年国际期刊预警名单发布!381
-
2025年中科院期刊分区表重磅发3185
-
中科院已正式发布2024年预警期612
-
2025年度国家自然科学基金项目531
-
中国科协《重要学术会议目录(201792
-
2024年国家自然科学基金项目评908
-
2024年JCR影响因子正式发布897
-
吉林大学校长张希:学术会议中的提1112
-
上海交大李丹课题组与合作者在AD06-16
-
上海交大申涛、陈向洋通过“光电合06-16
-
期刊投稿增刊问题:如何规避学术陷06-16
-
Applied Sciences06-16
-
Elsevier期刊proof阶06-16
-
第四军医大学西京医院放疗科 18023
-
小儿推拿网 23964
-
武汉志明文化传播有限公司 7965
-
嘉定优势会展服务社 20915
-
武汉会议策划公司 22934
-
南京军区南京总医院 17980
-
WILL 23956
-
飞鸟科技 21173
-
VFESVDS 20900
-
上海同巨文化传播有限公司 7995
-
上海交通大学 20944
-
Create-Net 20883
-
中国能源学会 17827
-
上海东华大学 20872
-
四川大学网络空间安全研究院 22929
-
北京石成医学咨询有限公司 23875
-
海星技术学院 17940
-
广州恒斌展览有限公司 1966
-
北京华斯泰生物医学科技有限公司 7995
-
南山区鹏城实验室 7811