交叉信息研究院赵行课题组等提出新型符号性记忆框架ChatDB
2024/04/09
近期,清华大学交叉信息研究院赵行助理教授研究组及其合作单位的研究者们提出一种新型符号性记忆框架ChatDB,突破了此前常用的记忆框架中对储存信息操作不精确、历史信息储存形式缺乏结构性等局限。

图1.ChatDB工作流程示意图
ChatDB由一个大语言模型(如ChatGPT)和一个数据库组成,可利用符号性操作(即SQL指令),实现对历史信息长期、精确的记录、处理和分析,并帮助回应用户的需求。其框架包含三个主要阶段:输入处理(input processing),记忆链(chain-of-memory),总结回复(response summary)。第一阶段,LLMs处理用户输入需求,对不涉及使用数据库记忆模块的指令,直接生成回复;而对涉及记忆模块的指令,则生成能与数据库记忆模块交互的一系列SQL语句。第二阶段,记忆链执行一系列中间记忆操作与符号性记忆模块交互。ChatDB按照先前生成的SQL语句依次执行插入、更新、选择、删除等操作。外部数据库执行相应的SQL语句,更新数据库并返回结果。在执行每一步记忆操作之前,ChatDB会根据先前SQL语句的结果决定是否更新当前记忆操作。第三阶段,语言模型综合与数据库交互得到的结果,并对用户的输入做出总结回复。

图2.ChatDB框架概览
为验证ChatDB中将数据库作为符号性记忆模块来增强大语言模型的有效性,并与其他的模型进行定量比较,研究者们构造了一家水果店运营管理的合成数据集,并命名为“水果商店数据集”,其中包含了70条按时间顺序生成的商店记录,约有3300个tokens(小于ChatGPT最大上下文窗口长度4096个)。这些记录包含水果店的四种常见操作:采购、销售、价格调整和退货。ChatDB模型中的LLM模块使用了ChatGPT(GPT-3.5 Turbo),温度参数设置为0,并使用MySQL数据库作为其外部符号性记忆模块。对比的基线模型为ChatGPT(GPT-3.5 Turbo),最大的上下文长度为4096,温度参数也设置为0。研究者们在水果商店问答数据集上进行了实验,发现相对于ChatGPT,ChatDB在这些问题的解答上展现出了显著的优势。
近日,该成果以论文“ChatDB:用数据库作为符号性记忆模块来增强大语言模型”(ChatDB: Augmenting LLMs with Databases as Their Symbolic Memory)发布于康奈尔大学ArXiv。
该论文共同第一作者为清华大学交叉信息研究院博士生胡晨旭和智源研究院研究员付杰,通讯作者为付杰和交叉信息院助理教授赵行,其他作者包括清华大学博士生杜晨壮、骆思勉,以及浙江大学助理教授赵俊博。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年11月优质学术会议推荐 16
-
2025年机器视觉、智能成像与模式识 392
-
2025年第七届控制与机器人国际会议 576
-
2025年智能光子学与应用技术国际学 1529
-
2025年机械工程,新能源与电气技术 1790
-
2025年计算机科学、图像分析与信号 2065
-
2025年材料化学与燃料电池技术国际 1861
-
2025年自动化前沿系统、智慧城市与 10-23
-
2025年信息光学、遥感技术与机器视 10-23
-
2025年数字人文、文化遗产与语言学 10-23
-
2025年神经科学、生物信息学与智能 10-23
-
2025年语言认知、人工智能与计算建 10-23
-
2025年社会科学、应用语言学与人文 10-23
-
2025年传统机械、动力学与智能装备 10-23
-
2025年图像处理、物理建模与结构设 10-23
-
2025年两院院士增选有效候选人1145
-
2025最新JCR分区及影响因子4758
-
好学术:科研网址导航|学术头条分2033
-
2025年国际期刊预警名单发布!1930
-
2025年中科院期刊分区表重磅发8447
-
中国科协《重要学术会议目录(205134
-
吉林大学校长张希:学术会议中的提2840
-
清华大学地学系阳坤课题组揭示全球10-20
-
历史时期极端干旱灾害的数据评估和10-20
-
“清华化学百年论坛:塑造化学的未10-20
-
研究揭示植物激素独脚金内酯作为跨10-20
-
清华大学联合研发的“46MW大容10-20
-
清华大学(软件学院)-九疆电力建10-20
-
中国农业大学土地学院马韫韬教授团10-20
-
电子科技大学光电学院本科生在一区10-20
-
中国地震局地壳应力研究所 23178

-
中国科学院青海盐湖研究所 21107

-
山西财经大学 21136

-
广州科奥会议服务有限公司 24016

-
云南广大科技开发中心 17975

-
世缘堂(北京)国际医学研究院 24016

-
QWE 2104

-
中国水电工程顾问集团公司中南勘测 23099

-
弘瑞财中资本学院 21034

-
中国移动通讯公司 18029

-
WILL 2121

-
同济大学 21061

-
北京盛合技术研究院 21304

-
百奥泰国际会议 23152

-
QS 24044

-
内蒙古工业大学 2270

-
武汉红矮星传媒有限公司 2459

-
中国能源学会 18073

-
香港城市大学 23216

-
香港机械工程师协会 2051

















592











































