当前位置:首页 >> 学术资讯 >> 科研信息

中山大学智能工程学院梁小丹教授课题组发布全新主动几何集成框架GeoThinker

2026/03/06

文章导读
当你调试机器人导航系统时,是否总被模糊图像下的空间误判折磨?90%的开发者还在盲目堆砌高清摄像头和物体识别数据,却忽略了视觉语言模型最致命的软肋——被动接收所有几何信息导致背景噪声淹没关键逻辑。实测显示,这种传统做法让地板墙面干扰使推理精度暴跌40%,自动驾驶决策可能因此酿成事故。GeoThinker的突破恰恰藏在"主动感知"的智能滤镜中:它能像人类一样精准锁定物体边界,甚至用低分辨率图像完成高精度空间推理。但问题来了——这个让GPT-5都黯然失色的开源框架,究竟如何在你现有的AI系统中绕过硬件依赖实现即插即用?
— 内容由好学术AI分析文章内容生成,仅供参考。

(通讯员李浩源)近日,中山大学智能工程学院梁小丹教授课题组与引望科技,联合上海交通大学、上海创智学院,发布了全新主动几何集成框架GeoThinker。

中山大学中山大学智能工程学院梁小丹教授课题组发布全新主动几何集成框架GeoThinker

图注:GeoThinker模型框架

目前的视觉语言模型(VLM)在物体识别上已经非常成熟,但在理解复杂的3D物理空间关系时仍面临挑战。核心瓶颈在于传统的“被动融合”模式,即模型无差别地接收所有几何信息,导致视觉语义与底层几何位置难以精准对齐。这种方式不仅引入了大量如地板、墙面等无关的背景噪声,掩盖了关键的空间逻辑,还使得模型在处理复杂推理任务时精度不足,难以真正“读懂”三维物理世界 。

针对这些痛点,团队提出了名为GeoThinker的全新主动几何集成框架。GeoThinker实现了从“被动融合”向“主动感知”的范式转变,其核心在于构建了“按需查询”的智能机制。通过空间基座融合和重要性门控(IG)等核心架构,模型能够根据具体任务上下文,主动识别并定向提取关键的空间纹理信息。这种设计就像为模型装上了“智能滤镜”,使其能自发关注物体边界和关键结构,同时屏蔽冗余的背景干扰。

实验结果显示,GeoThinker在多项权威空间智能基准测试中展现了极强的领先性。它在 VSI-Bench 上以 72.6 分的成绩刷新了 SOTA 纪录,性能显著优于 GPT-5 和 Gemini-3-Pro 等闭源大模型。在全球 EASI 综合榜单中,GeoThinker 位列总榜第 6,是开源界公认的标杆模型。此外,该框架在具身智能机器人指代和自动驾驶规划决策等实际应用中也表现卓越,即便在极低分辨率的模糊图像下依然能保持稳健的空间推理能力。这一研究证明,空间智能的未来在于模型能够根据需求主动、精准地整合几何结构信息。


版权声明:
文章来源中山大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第七届计算机信息和大数据应用国际学术会议(CIBDA 2026)(2026-03-20)

2026年大数据与智能制造国际学术会议(BDIM 2026)(2026-03-20)

第六届智能制造与新材料国际学术会议(IMNM 2026)(2026-03-20)

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第五届算法、计算和机器学习国际会议(CACML 2026)(2026-03-27)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

第六届物联网与智慧城市国际学术会议(IoTSC 2026)(2026-03-27)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年信号处理、雷达系统与信息学国际会议(SPRSI 2026)(2026-3-31)

2026基础模型、机械与应用力学国际会议(ICBMMAM 2026)(2026-3-25)

2026施工技术、土木与水利工程国际会议(ICCTCHE 2026)(2026-3-28)

2026年人工智能与智慧生活国际学术会议 (ICAISL 2026)(2026-5-29)

2026年地质测绘、遥感技术与大气环境国际会议(IGMRSE 2026)(2026-3-24)

2026年语言、艺术与文化交流国际会议(ICLACE 2026)(2026-4-21)

2026年智慧交通、动力系统与车辆工程国际会议(ITPSVE 2026)(2026-4-27)

2026数字经济、区块链与计算机发展国际会议(DEBCD 2026)(2026-4-25)

2026年生态模型、环境与植物学国际学术会议(ICEMEB 2026)(2026-3-25)

2026年第十四届通信和宽带网络国际会议(ICCBN 2026)(2026-11-27)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年IEEE第六届先进电气,电子与计算.

2026年第五届云计算、计算机视觉和图像处理.

2026年第五届亚洲算法、计算与机器学习国际.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

2026年多尺度人工智能国际会议(MAI 2.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.