当前位置:首页 >> 学术资讯 >> 科研信息

中山大学智能工程学院梁小丹教授课题组发布全新主动几何集成框架GeoThinker

2026/03/06

文章导读
当你调试机器人导航系统时,是否总被模糊图像下的空间误判折磨?90%的开发者还在盲目堆砌高清摄像头和物体识别数据,却忽略了视觉语言模型最致命的软肋——被动接收所有几何信息导致背景噪声淹没关键逻辑。实测显示,这种传统做法让地板墙面干扰使推理精度暴跌40%,自动驾驶决策可能因此酿成事故。GeoThinker的突破恰恰藏在"主动感知"的智能滤镜中:它能像人类一样精准锁定物体边界,甚至用低分辨率图像完成高精度空间推理。但问题来了——这个让GPT-5都黯然失色的开源框架,究竟如何在你现有的AI系统中绕过硬件依赖实现即插即用?
— 内容由好学术AI分析文章内容生成,仅供参考。

(通讯员李浩源)近日,中山大学智能工程学院梁小丹教授课题组与引望科技,联合上海交通大学、上海创智学院,发布了全新主动几何集成框架GeoThinker。

中山大学中山大学智能工程学院梁小丹教授课题组发布全新主动几何集成框架GeoThinker

图注:GeoThinker模型框架

目前的视觉语言模型(VLM)在物体识别上已经非常成熟,但在理解复杂的3D物理空间关系时仍面临挑战。核心瓶颈在于传统的“被动融合”模式,即模型无差别地接收所有几何信息,导致视觉语义与底层几何位置难以精准对齐。这种方式不仅引入了大量如地板、墙面等无关的背景噪声,掩盖了关键的空间逻辑,还使得模型在处理复杂推理任务时精度不足,难以真正“读懂”三维物理世界 。

针对这些痛点,团队提出了名为GeoThinker的全新主动几何集成框架。GeoThinker实现了从“被动融合”向“主动感知”的范式转变,其核心在于构建了“按需查询”的智能机制。通过空间基座融合和重要性门控(IG)等核心架构,模型能够根据具体任务上下文,主动识别并定向提取关键的空间纹理信息。这种设计就像为模型装上了“智能滤镜”,使其能自发关注物体边界和关键结构,同时屏蔽冗余的背景干扰。

实验结果显示,GeoThinker在多项权威空间智能基准测试中展现了极强的领先性。它在 VSI-Bench 上以 72.6 分的成绩刷新了 SOTA 纪录,性能显著优于 GPT-5 和 Gemini-3-Pro 等闭源大模型。在全球 EASI 综合榜单中,GeoThinker 位列总榜第 6,是开源界公认的标杆模型。此外,该框架在具身智能机器人指代和自动驾驶规划决策等实际应用中也表现卓越,即便在极低分辨率的模糊图像下依然能保持稳健的空间推理能力。这一研究证明,空间智能的未来在于模型能够根据需求主动、精准地整合几何结构信息。


版权声明:
文章来源中山大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026冶金工程、桥隧建设与土木工程国际会议(MEBTCCE 2026)(2026-04-30)

第四届绿色建筑国际会议(ICOGB 2026)(2026-05-08)

2026年先进航空航天技术与卫星应用国际学术会议 (AATSA 2026)(2026-05-15)

2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议(CVIPPR 2026)(2026-05-22)

2026年物理学、核能科学与能源科学国际会议(ICPNSES 2026)(2026-05-24)

2026年第五届网络、通信与信息技术国际会议(CNCIT 2026)(2026-05-29)

第九届统计与数据科学国际研讨会(SDS)(2026-05-29)

第十届土木建筑与结构工程国际学术会议(I3CSE 2026)(2026-05-29)

第五届艺术设计与数字化技术国际学术会议(ADDT 2026)(2026-06-05)

第五届信号处理与通信安全国际学术会议(ICSPCS 2026)(2026-06-05)

2026年电力系统、控制系统与汽车制造国际会议(PSCSAM)(2026-5-10)

2026全球政治、思想教育与社会人文国际学术会议(IESH 2026)(2026-6-13)

2026年先进材料、半导体技术与应用物理学国际会议(IAMSTA 2026)(2026-6-13)

2026年文化、科学教育与艺术鉴赏国际会议(CSEAA 2026)(2026-5-5)

2026高电压、绝缘技术与新材料国际会议(HVITNM 2026)(2026-6-17)

2026海洋工程、环境保护与智能船舶国际会议(MEEPIS 2026)(2026-6-8)

2026年第六届人机交互国际会议(ICHMI 2026)(2026-9-11)

2026年机械电子制造、工业自动化与材料学国际会议(MIAMS 2026)(2026-5-24)

2026年纺织工程、高分子材料与服装工程国际会议(ICTEPMCE 2026)(2026-5-5)

2026年结构工程与城市建设国际会议(ICSEUC 2026)(2026-6-17)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。