清华大学深圳国际研究生院曾龙团队合作在文本-3D场景生成技术领域取得新进展
2025/12/12
随着具身机器人的场景泛化需求和数字内容创作需求,根据自然语言的场景描述,从预定义的资产集合中生成逻辑连贯且丰富的自定义3D场景布局(文本-3D场景生成)成为一项具有挑战性的任务。传统方法定义精确的规则既耗时又需要大量的艺术专业知识,并且限制了复杂和多样场景组合的表达。基于深度学习的方法,当前数据集仍然相对有限,生成结果缺乏多样性,无法完全满足艺术专家的实际需求。近期基于大语言模型的场景生成方法虽然通过语言模型提取布局先验,但在空间感知和几何精度上仍有不足,难以准确表示复杂的空间关系、建模对象姿态,并符合美学设计原则。
图1.文本-3D场景生成系统获得的高质量3D场景
为此,清华大学深圳国际研究生院曾龙副教授课题组与合作者联合攻关,研究搭建一个3D场景布局系统(图2),能在给定某个高质量的3D资产库的情况下,在文本或图像输入下即可生成自然、细致且逻辑连贯的3D场景布局。
图2.文本-3D场景生成技术方法概述
研究团队使用图像生成模型Flux将用户的输入提示扩展为引导图像,通过高质量3D场景布局数据进行微调,Flux能够生成质量更高且与资产集合风格更一致的图像,这显著提高了摆放系统的可控性;接着构建一个基于预训练视觉模型的图像分析模块,融合视觉语义分割、单图像几何解析以及基于图的场景图逻辑构建功能;随后根据语义特征匹配策略,从资产集合中检索出与引导图像最匹配的对象,结合视觉语义特征、几何信息和场景布局逻辑,迭代计算每个前景对象的旋转、平移和缩放变换。最终,团队通过场景图逻辑和图像语义解析对三维场景布局进行一致性优化,确保最终3D场景在视觉和逻辑上与引导图像相近。
3D资产由自主开发的模型、高质量的开源内容及授权市场资产组合而成,并由20名具有三年以上经验的专业艺术家将这些项目布置成互动媒体级别的3D场景。
图3.3D资产及布局数据集
图像生成模型擅长生成美观且细致的二维布局,该研究方法可将这些能力应用于三维场景布局任务。与之前依赖复合资产的方法不同,团队根据引导图像以不同的姿态和位置放置资产,避免了冗余,增加了多样性。此外,团队引入了资产内部布局功能,使资产可在其他资产内进行排列,以优化空间使用并提高场景真实性。这些功能使得生成的三维场景布局更加自然、详细和具备视觉吸引力。实验结果显示,与以往的方法相比,3D场景布局质量显著提升。
实验结果显示,团队研究生成的3D场景布局在丰富度和美术质量方面优于其他先进方法。这一成果使原本需要专业美术师耗费2.5小时完成的工作流程实现了自动化,有望将所需时间降低至4分钟以内。
图4.3D场景布局方法的生成结果对比
研究成果以“Imaginarium:视觉引导的高质量3D场景布局生成”(Imaginarium: Vision-guided High-Quality 3D Scene Layout Generation)为题,被计算机图形学领域顶会SIGGRAPH Asia 2025接收,并于12月4日发表于《美国计算机协会图形汇刊》(ACM Transactions on Graphics)。
清华大学深圳国际研究生院2022级硕士生朱晓明为论文第一作者,腾讯IEG游戏AI中心高级研究员邓治博士和深圳国际研究生院副教授曾龙为论文通讯作者。研究得到国家重点研发计划“工业软件”专项课题和国家自然科学基金面上项目的资助。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第八届计算机科学与技术在教 109
-
2026年3月高含金量国际学术会议合 88
-
2026资源、化学化工与应用材料国际 1265
-
2026年人工智能教育技术与数据科学 246
-
2026年图像处理与数字创意设计国际 1041
-
2026年机械工程,新能源与电气技术 5524
-
2026年材料科学、低碳技术与动力工 1312
-
2026年第二届无线与光通信国际会议 2080
-
第七届多组学科研与临床应用大会 02-05
-
2026年制药学、生物技术与植物学国 02-04
-
2026年节能技术、低碳发展与可持续 02-04
-
2026年导航控制、传感技术与卫星应 02-04
-
2026年经济转型与商业文化国际学术 02-04
-
2026年体育科学、运动健康与创新管 02-04
-
2026创意城市、设计与社区建设国际 02-04
-
2025年两院院士增选有效候选人4066
-
2025最新JCR分区及影响因子10070
-
好学术:科研网址导航|学术头条分5098
-
2025年国际期刊预警名单发布!5129
-
2025年中科院期刊分区表重磅发16711
-
中国科协《重要学术会议目录(2010250
-
吉林大学校长张希:学术会议中的提6245
-
bbrc期刊,bbrc期刊处于S02-03
-
siam期刊,siam期刊发的最02-03
-
了望期刊,瞭望期刊02-03
-
共享经济期刊,共享经济学术论文02-03
-
期刊代理网,从哪里找期刊代理02-03
-
light期刊,Light期刊综02-03
-
传承 期刊,传承期刊投稿点评02-03
-
期刊勘误,期刊勘误时会索要原始数02-03
-
上海麦峰医学科技有限公司 2155

-
徽州文化园---华商山庄 23227

-
哈尔滨工业大学 21604

-
中国香料香精化妆品工业协会 21171

-
湖南大学 2179

-
上海怡涵展览服务有限公司 2237

-
系统仿真专业委员会 21327

-
中南林业科技大学 24365

-
武汉海讯科技会务有限公司 18171

-
The Right Spin P 21355

-
云南仟纯会展服务有限公司 18160

-
北京康慈医学中心 18212

-
上海麦峰医学 24395

-
武汉青博盛学术服务有限公司 23270

-
第十三届全国渗流力学学术会议暨渗 2453

-
中国环境科学学会 24295

-
北京嘉园文华发展中心 2238

-
清华大学持久性有机污染物研究中心 2352

-
北京市海淀人-机-环境系统工程研 21244

-
百奥泰国际会议有限公司 24299

















71
















































