当前位置:首页 >> 学术资讯 >> 科研信息

我国学者在行为视觉理解领域取得进展

2025/06/03

我国学者在行为视觉理解领域取得进展


图 主体姿态行为感知(左);视觉交互行为认知推理(中);行为神经机制溯因(右)

  随着“以人为中心”的具身智能技术的发展,智能体被要求拥有类似于人类的观察和理解日常行为的能力,这催生了“行为视觉理解”这一科学问题的产生。该方向的研究对于智能装备、智慧城市、服务机器人、虚拟现实、人机交互、健康医疗等领域有举足轻重的作用,同时对具身智能和通用机器人研究发展有关键性推动效应。

  在国家自然科学基金项目(批准号:61772332)等资助下,上海交通大学卢策吾教授项目组在行为视觉理解的理论与应用研究中取得了突破性成果。项目组从主体行为感知、交互行为认知推理、神经机制溯因(图)三个方面入手,开展了深入研究。面对主体姿态行为感知的挑战,设计了多重自适应结构约束下的跨尺度联合优化框架,该框架可有效应对密集遮挡、个体姿态估计以及人体关节扭动量估计等问题,提升了复杂动态场景主体行为理解的性能;针对复杂交互行为推理难题,提出了混合行为基元概念提取和逻辑推理机制,提升了行为理解在复杂场景交互推理行为方面的性能;项目组提出了机器视觉驱动的行为脑神经机理解析工具和方法,构建了连接行为检测与脑神经信号的系统,并建立了二者之间深层的相关性。提出的一系列算法使得行为主体(小鼠)的复杂社会行为检测准确率达到人类水平,保证了行为神经机制溯因系统的有效性。项目组在主体姿态行为感知领域开发和维护的开源系统Alpha Pose展现了实用价值,与国际14家企业签署商用授权合同。

  项目组的研究成果发表在《自然》(Nature)、《自然机器智能》(Nature Machine Intelligence)、《IEEE 模式分析与机器智能汇刊》(TPAMI)、《IEEE 机器人汇刊》(T-RO)等国际顶级期刊上。同时,获得2024年中国人工智能学会“吴文俊”自然科学奖一等奖、2023年科学探索奖、2022年教育部青年科学奖和2019年度《麻省理工科技评论》中国35岁以下科技创新35人(MIT TR35)等。


版权声明:
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年矿产资源、勘探技术与地球科学国际会议(ICRTS 2026)(2026-02-28)

2026年能源、电力与可持续发展国际学术会议(EESD 2026)(2026-03-06)

第三届光电信息与光学工程国际学术会议(OIOE 2026)(2026-03-06)

第九届大数据与应用统计国际学术研讨会(ISBDAS 2026)(2026-03-06)

第五届网络安全、人工智能与数字经济国际学术会议(CSAIDE 2026)(2026-03-06)

第五届材料工程与应用力学国际学术会议(ICMEAAE 2026)(2026-03-06)

2026年社会心理学、行为科学与教育国际会议(SPBSE 2026)(2026-03-09)

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年第五届算法、计算和机器学习国际会议(CACML 2026)(2026-03-27)

2026年绿色能源与激光、光学国际会议(ICGELO 2026)(2026-4-11)

2026公共艺术、科学研究与社会服务国际会议(PASRSS 2026)(2026-3-14)

2026年计算金融与金融科技国际研讨会(CFFT 2026)(2026-4-17)

2026年第十一届电力与电气工程亚洲会议(ACPEE 2026)(2026-4-14)

2026年现代管理与社会科学国际会议(ICMMSS 2026)(2026-3-17)

2026年第十二届教育与培训技术国际会议 (ICETT 2026)(2026-5-22)

2026年先进能源系统、氢能与燃料电池国际会议(AESHEFC 2026)(2026-3-20)

2026年交通电气化、电网互动与基础设施规划国际会议(TEGIIP 2026)(2026-2-13)

第七届人类遗传学与健康国际研讨会(HGH 2026)(2026-5-29)

2026年物理天文、测量技术与图像处理国际会议(IPAMT 2026)(2026-3-13)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。