交叉信息研究院赵行课题组等提出新型符号性记忆框架ChatDB_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

第四届信息经济、数据建模与云计算国际学术会议（ICIDC 2025）

第七届光电科学与材料国际学术会议 (ICOSM 2025)

2025年计算智能与机器人国际学术会议（CIR 2025)

2025年智能计算与系统仿真国际会议(ICSS 2025)

第五届电子材料与信息工程国际学术会议 (EMIE 2025)

第二届教育人工智能国际学术会议（ISAIE 2025）

2025年先进半导体器件与集成技术国际学术会议（ASDIT 2025）

2025年地质、能源与油气勘探国际学术会议（GEOGE 2025）

第八届人文教育与社会科学国际学术会议（ICHESS 2025）

第二届信号处理与神经网络应用国际学术会议（SPNNA 2025）

第五届生物医学与生物信息工程国际学术会议 (ICBBE 2025)

第九届交通工程与运输系统国际学术会议（ICTETS 2025）

2025年低空经济论坛暨低空飞行技术与无人机应用国际学术会议（LEF & ICLU 2025）

2025年图像、信号处理与机器学习国际学术会议（ISPML 2025）

第三届算法、图像处理与机器视觉国际学术会议（AIPMV2025）

2025年人工智能、虚拟现实与交互设计国际学术会议(AIVRID 2025)

交叉信息研究院赵行课题组等提出新型符号性记忆框架ChatDB

2024/04/09

近期，清华大学交叉信息研究院赵行助理教授研究组及其合作单位的研究者们提出一种新型符号性记忆框架ChatDB，突破了此前常用的记忆框架中对储存信息操作不精确、历史信息储存形式缺乏结构性等局限。

20230628- ChatDB科研论文-截图- 01.PNG

图1.ChatDB工作流程示意图

ChatDB由一个大语言模型（如ChatGPT）和一个数据库组成，可利用符号性操作（即SQL指令），实现对历史信息长期、精确的记录、处理和分析，并帮助回应用户的需求。其框架包含三个主要阶段：输入处理（input processing），记忆链（chain-of-memory），总结回复（response summary）。第一阶段，LLMs处理用户输入需求，对不涉及使用数据库记忆模块的指令，直接生成回复；而对涉及记忆模块的指令，则生成能与数据库记忆模块交互的一系列SQL语句。第二阶段，记忆链执行一系列中间记忆操作与符号性记忆模块交互。ChatDB按照先前生成的SQL语句依次执行插入、更新、选择、删除等操作。外部数据库执行相应的SQL语句，更新数据库并返回结果。在执行每一步记忆操作之前，ChatDB会根据先前SQL语句的结果决定是否更新当前记忆操作。第三阶段，语言模型综合与数据库交互得到的结果，并对用户的输入做出总结回复。

20230628- ChatDB科研论文-截图-02.PNG

图2.ChatDB框架概览

为验证ChatDB中将数据库作为符号性记忆模块来增强大语言模型的有效性，并与其他的模型进行定量比较，研究者们构造了一家水果店运营管理的合成数据集，并命名为“水果商店数据集”，其中包含了70条按时间顺序生成的商店记录，约有3300个tokens（小于ChatGPT最大上下文窗口长度4096个）。这些记录包含水果店的四种常见操作：采购、销售、价格调整和退货。ChatDB模型中的LLM模块使用了ChatGPT（GPT-3.5 Turbo），温度参数设置为0，并使用MySQL数据库作为其外部符号性记忆模块。对比的基线模型为ChatGPT（GPT-3.5 Turbo），最大的上下文长度为4096，温度参数也设置为0。研究者们在水果商店问答数据集上进行了实验，发现相对于ChatGPT，ChatDB在这些问题的解答上展现出了显著的优势。

近日，该成果以论文“ChatDB：用数据库作为符号性记忆模块来增强大语言模型”（ChatDB: Augmenting LLMs with Databases as Their Symbolic Memory）发布于康奈尔大学ArXiv。

该论文共同第一作者为清华大学交叉信息研究院博士生胡晨旭和智源研究院研究员付杰，通讯作者为付杰和交叉信息院助理教授赵行，其他作者包括清华大学博士生杜晨壮、骆思勉，以及浙江大学助理教授赵俊博。

版权声明：
文章来源清华大学新闻，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

相关学术资讯

我国学者在重大水利水电工程场址地震危险性评估研究领域取得进展

我国学者在肿瘤免疫成像和分析方面取得进展

地空学院郭庆华课题组在Nature Communications上发文阐释中国过去30年人工林时空动态及碳存储效益

北京大学化学学院郭雪峰课题组与合作者在单分子输运机制研究中取得系列进展

我国学者在DNA转座子多样性研究和基因工程技术开发方面取得进展

南方医科大学廖玉辉教授团队在结核病的靶向光热治疗研究方面取得进展

北京大学物理学院陈基课题组与合作者揭示二维非晶凝聚态体系中新的无序度

南开大学在人造神经研究方面取得进展