当前位置:首页 >> 学术资讯 >> 科研信息

交叉信息研究院赵行课题组等提出新型符号性记忆框架ChatDB

2024/04/09

近期,清华大学交叉信息研究院赵行助理教授研究组及其合作单位的研究者们提出一种新型符号性记忆框架ChatDB,突破了此前常用的记忆框架中对储存信息操作不精确、历史信息储存形式缺乏结构性等局限。

20230628- ChatDB科研论文-截图- 01.PNG

图1.ChatDB工作流程示意图

ChatDB由一个大语言模型(如ChatGPT)和一个数据库组成,可利用符号性操作(即SQL指令),实现对历史信息长期、精确的记录、处理和分析,并帮助回应用户的需求。其框架包含三个主要阶段:输入处理(input processing),记忆链(chain-of-memory),总结回复(response summary)。第一阶段,LLMs处理用户输入需求,对不涉及使用数据库记忆模块的指令,直接生成回复;而对涉及记忆模块的指令,则生成能与数据库记忆模块交互的一系列SQL语句。第二阶段,记忆链执行一系列中间记忆操作与符号性记忆模块交互。ChatDB按照先前生成的SQL语句依次执行插入、更新、选择、删除等操作。外部数据库执行相应的SQL语句,更新数据库并返回结果。在执行每一步记忆操作之前,ChatDB会根据先前SQL语句的结果决定是否更新当前记忆操作。第三阶段,语言模型综合与数据库交互得到的结果,并对用户的输入做出总结回复。

20230628- ChatDB科研论文-截图-02.PNG

图2.ChatDB框架概览

为验证ChatDB中将数据库作为符号性记忆模块来增强大语言模型的有效性,并与其他的模型进行定量比较,研究者们构造了一家水果店运营管理的合成数据集,并命名为“水果商店数据集”,其中包含了70条按时间顺序生成的商店记录,约有3300个tokens(小于ChatGPT最大上下文窗口长度4096个)。这些记录包含水果店的四种常见操作:采购、销售、价格调整和退货。ChatDB模型中的LLM模块使用了ChatGPT(GPT-3.5 Turbo),温度参数设置为0,并使用MySQL数据库作为其外部符号性记忆模块。对比的基线模型为ChatGPT(GPT-3.5 Turbo),最大的上下文长度为4096,温度参数也设置为0。研究者们在水果商店问答数据集上进行了实验,发现相对于ChatGPT,ChatDB在这些问题的解答上展现出了显著的优势。

近日,该成果以论文“ChatDB:用数据库作为符号性记忆模块来增强大语言模型”(ChatDB: Augmenting LLMs with Databases as Their Symbolic Memory发布于康奈尔大学ArXiv。

该论文共同第一作者为清华大学交叉信息研究院博士生胡晨旭和智源研究院研究员付杰,通讯作者为付杰和交叉信息院助理教授赵行,其他作者包括清华大学博士生杜晨壮、骆思勉,以及浙江大学助理教授赵俊博。


版权声明:
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025生物学、环境工程与清洁能源国际会议(ICBEECE 2025)(2025-09-05)

第七届 IEEE 能源、电力与电网国际学术会议(IEEE-ICEPG 2025)(2025-09-12)

2025环境、气候变化与生物科学国际会议(ECCBS 2025)(2025-09-13)

2025年第七届先进计算机科学,信息技术与通信国际会议(CSITC2025)(2025-09-19)

第十届机械制造技术与材料工程国际学术会议(MMTME 2025)(2025-09-19)

第九届交通工程与运输系统国际学术会议(ICTETS 2025)(2025-09-26)

第六届智能计算与人机交互国际研讨会(ICHCI 2025)(2025-09-26)

第五届机电一体化技术与航空航天工程国际学术会议(ICMTAE 2025)(2025-09-26)

2025年先进制造技术、机械工程与自动化国际会议(ICAMTMEA 2025)(2025-10-01)

2025-2026年科技计划项目申报和科技创新平台建设运行科研资金全过程管理使用高级研修班(苏州)(2025-10-22)

2025年地质测绘、遥感技术与矿产勘探国际会议(IGMRTE 2025)(2025-10-29)

2025年生物医药、基因组学与智能技术国际会议(IBGT 2025)(2025-10-28)

2025年城市工程与公共交通国际会议(UEPT 2025)(2025-10-27)

2025年信号处理、通信技术与网络安全国际会议(SPCTNS 2025)(2025-10-22)

2025培训技术、社会科学与新媒体发展国际会议(TTSSNMD 2025)(2025-10-20)

2025年智慧交通、物联网与现代物理国际学术会议(ITITMP 2025)(2025-10-27)

2025声学、应用物理与工程国际会议(ICAAPE 2025)(2025-10-19)

2025年数理统计、算法与建模国际会议(ICMSAM 2025)(2025-10-31)

2025年航空科学、机械与材料国际会议(ICASMM 2025)(2025-10-29)

2025年土木建筑、工程力学与施工技术国际会议(ICEMT 2025)(2025-10-22)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。