科研人员开源本地通用幻灯片智能体模型与环境系统
2026/04/23
近日,中国科学院软件研究所团队开源第二代幻灯片智能体系统DeepPresenter,实现了将幻灯片智能体模型与完整的智能体沙箱环境一同开源,可在单张消费级显卡和终端上一键部署,并适配国产化算力生态。该成果重构了AI制作幻灯片逻辑,使智能体不仅能“深度探索”,还能“亲眼所见”。
在内容生成方面,团队构建了包含20余种专业工具的共享智能体环境,集成了基于Docker的智能体沙箱、arXiv实时文献检索,以及Python代码执行与数据可视化等能力,为幻灯片内容的专业性与数据准确性提供保障。在排版优化方面,团队提出了环境感知反思机制。这一机制通过“生成—渲染—审视—修正”的视觉闭环工作流,使智能体在每页幻灯片生成后,调用沙箱内浏览器将代码渲染为真实图片,并基于截图进行自适应检查与迭代优化,直至排版效果达到预期标准。在模型训练方面,团队设计了系统化的训练流水线。该训练流水线基于PersonaHub与arXiv等多源数据集构建高多样性任务数据,并在指令中定义页数限制、宽高比及语言等细粒度约束条件;引入独立评审机制以克服智能体的自我验证偏差,由独立模型作为外部评估者指出生成产物中的排版或逻辑缺陷;在1152个任务中筛选出802条高质量智能体轨迹用于监督微调训练,涵盖中英双语、多种宽高比及复杂指令约束场景。
为验证有效性,团队在预留的128个测试任务中使用PPTEval进行系统评测,并与多种主流幻灯片生成方案进行对比。结果显示,DeepPresenter(pptagent 2.0)9B版本获得4.19综合评分,与闭源模型GPT-5(4.22)表现接近,优于其他幻灯片生成方案。成本—性能分析表明,DeepPresenter-9B处于前沿曲线的最优平衡点位置,能以低于闭源模型的算力成本实现同等级别的生成质量。所有生成内容均输出为可编辑的pptx格式,支持用户自由修改与二次创作。
文章来源软件研究所,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第五届机器学习、云计算与智 26
-
2026年第二届计算机视觉与机器学习 627
-
2026年6月优质国际学术会议推荐 1157
-
2026年智慧教育与数据挖掘国际学术 813
-
2026年第11届生物医学信号与图像 697
-
2026资源、化学化工与应用材料国际 2559
-
2026年图像处理与数字创意设计国际 2369
-
2026年机械工程,新能源与电气技术 6849
-
2026年材料科学、低碳技术与动力工 2524
-
2026年海洋科学、水利工程与环境管 06-18
-
2026年环境工程、材料科学与循环经 06-18
-
2026年航空动力、流体力学与热物理 06-18
-
2026年地球化学、核物理与地质学国 06-18
-
2026年微机电、物理学与建模仿真国 06-18
-
2026年机械工程、电子技术与自动化 06-18
-
2026 JCR影响因子正式发布22
-
中国科协发布2025年《重要学术701
-
2026年新锐分区(原中科院期刊5279
-
2025年两院院士增选有效候选人5099
-
好学术:科研网址导航|学术头条分6650
-
2025年国际期刊预警名单发布!6856
-
2025年中科院期刊分区表重磅发24416
-
吉林大学校长张希:学术会议中的提7917
-
清华大学计算机系存储实验室团队获06-06
-
清华大学深圳国际研究生院钱翔、曲06-06
-
中国科大研制仿鱼鳞巨压容传感器 06-06
-
科研人员研发出新型复合介孔状纳米06-06
-
代谢小分子抗衰老功能研究取得进展06-06
-
南京大学物理学院张海军教授课题组06-06
-
南京大学超导电子学研究所团队利用06-06
-
福建省空间信息中心 21460

-
VSDHFUYV 2411

-
西南科技大学 18382

-
能源工程与环境保护国际会议 24470

-
大连百奥泰科技 23222

-
广州市香港科大霍英东研究院 23306

-
北京太阳花酒店 2258

-
cdv 24321

-
欧亚学院 18321

-
河南省中原工学院 18447

-
湖北学而升文化传播有限公司 8267

-
中国科学院水生生物研究所 18548

-
全国微创整形外科工作委员会 24494

-
哈尔滨医科大学附属第一医院普外科 21492

-
北京大学医学部 2587

-
WILL 8482

-
湖南科技大学 21350

-
西昌学院农学系 18409

-
沈阳理工大学 18615

-
哈尔滨工业大学 3047





















77












































