当前位置:首页 >> 学术资讯 >> 科研信息

清华大学自动化系汪小我团队提出知识引导与数据驱动相融合的合成启动子AI设计方法

2024/03/29

近日,清华大学自动化系汪小我团队提出了一种将专家知识与大数据学习相融合的合成启动子人工智能辅助设计方法,发现了转录因子结合位点旁侧序列在启动子优化设计中的重要作用,为突破基因调控元件设计中面临的高维度、小样本的核心难题提供了新的思路。

近年来,合成生物学作为一门新兴交叉学科获得了蓬勃发展,为破解人类面临的资源、健康、环境等重大挑战提供全新解决途径。合成生物学的核心理念是通过对DNA等生物大分子的逆向设计重构获得具有特定功能的人工生物系统。然而,这些生物分子编码的组合排列空间十分庞大,序列与功能的映射关系复杂,对生物大分子序列进行精准设计极具挑战。近期人工智能技术的突破引发了自然语言处理、计算机视觉等领域的革命性进步,尤其是以ChatGPT等为代表的生成式智能模型的突破,彰显出AI在提取复杂模式、生成复杂对象上的强大潜力。基于人工智能技术逆向设计启动子等具有特定功能的生物大分子序列,将为合成生物学的发展提供强大的设计工具和丰富的基础元件。

启动子是决定基因在何时、何地以何种程度进行转录表达的合成生物学基础元件,设计具有特定功能的人工启动子是逆向构造人工基因系统的基础。启动子中连接不同转录因子结合位点的之间的旁侧序列被证明对启动子功能有着重要影响,但这些旁侧序列的特征难以被人为归纳总结为明确的知识和设计准则。同时,由于天然基因组中具有特定转录因子结合序列的启动子数量稀少,难以直接建立深度学习模型对这些启动子的序列的整体模式进行提取。这些因素导致旁侧序列在设计中被长期忽视,缺乏有效的对启动子进行整体优化设计的方法。

知识引导与数据驱动相融合的启动子辅助设计方法DeepSEED

针对这一问题,研究团队创新提出了一种知识引导与数据驱动相融合的智能设计策略:首先基于人类专家擅长在小样本中识别明确模式的特点,利用专家知识定义与启动子功能相关的重要显式模式作为“种子”序列;在此基础上,基于深度学习模型擅长在大型数据集中检测隐含弱模式的强大能力,在海量启动子数据中学习旁侧序列与种子序列的隐式匹配关系,进而基于条件生成式模型获得与特定种子序列相匹配的旁侧序列,对序列整体进行全局优化。在实际应用过程中,研究者可以任意指定已知生物调控模式序列作为“种子”序列,模型通过学习大数据中旁侧序列的调控规律对“种子”的旁侧序列进行补全,从而实现启动子的按需优化设计。研究团队成功将该方法应用于大肠杆菌内组成型启动子、IPTG诱导型启动子,以及哺乳动物细胞内Dox诱导型启动子的优化设计。模型设计生成的合成启动子在表现出高度序列多样性、与天然基因序列低相似性的同时,保留了天然序列中k-mer频率等关键统计特征,并优化了DNA序列大小沟偏好、偏转角等系统整体属性,大幅提升了合成启动子的转录活性和诱导率等关键性能。该成果有望为合成生物学研究提供基础性的设计工具和多样化的基因调控元件。

相关研究成果以“使用DeepSEED进行侧翼序列深度改造实现高效启动子设计(Deep flanking sequence engineering for efficient promoter design using DeepSEED)为题,于10月9日发表于《自然·通讯》(Nature Communications)期刊。

清华大学自动化系博士研究生张鹏程、博士研究生王昊晨与硕士研究生许涵文为该论文的共同第一作者,汪小我教授为该论文的通讯作者。清华大学的魏磊、刘莉扬、胡志睿等也对本文作出了重要贡献。该研究得到国家自然科学基金、国家重点研发计划、清华大学国强研究院项目的资助。


版权声明:
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

2026年IEEE第八届软件工程和计算机科学国际会议(CSECS 2026)(2026-04-17)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年工业建筑与混凝土材料国际会议(ICIBCM 2026)(2026-3-30)

2026年测量技术与地理信息系统应用国际会议(ICMTGISA 2026)(2026-5-31)

2025年交通管理规划与智慧城市国际会议(TMPSC 2025)(2026-3-30)

2026光学工程、先进成像与测量国际会议(OEAIM 2026)(2026-3-30)

2026年化学工业与工业催化国际学术会议(CIIC 2026)(2026-3-29)

2026年机器人、人工智能与信息学国际会议(ICRAII 2026)(2026-3-28)

2026年计算机视觉、机器人技术与人机交互国际会议(IVRHC 2026)(2026-4-30)

2026公共管理与公共关系国际会议(ICPMPR 2026)(2026-3-30)

2026年通讯技术与计算机信息国际会议(ICCTCI 2026)(2026-4-27)

2026考古、博物馆学与国际文化国际学术会议(AAMIC 2026)(2026-3-30)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年第五届云计算、计算机视觉和图像处理.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年多尺度人工智能国际会议(MAI 2.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年传感器技术、自动化与智能制造国际会.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.

2026年第七届控制, 机器人与智能系统国际.