- 医学生发sci论文常见问题 48
- 服装设计领域在英文期刊上成功发表 90
- 了解一些撰写财政学论文摘要的方法 48
- 发表教育史相关论文的中文学术期刊 77
- 关于学术会议摘要的一些特点和要素 72
- 《实用医院临床杂志》主题范围涵盖 56
- 北京大学科维理尾上匡房研究团队探 71
- 学术会议邀请时应注意的相关问题 79
- 研究生英文论文翻译成中文要检测嘛 42
- 人工智能SCI期刊难发表吗 38
- 发表SCI综述的步骤跟发表研究论 55
- 白血病相关论文的中文学术期刊有哪 70
- 了解几个管理会计方向的中文核心期 51
- 6本好投易中的气象学sci期刊 27
- 光学工程优秀论文题目合集有哪些 81
- 天津大学精仪学院 20401
- 先進成型技術學會 23393
- 工业催化杂志社 17407
- 香港维科信息产业研究中心 22383
- ACPEE 20410
- 中科院长春光学精密机械与物理研究 20384
- 无锡江南大学物联网学院技术中心 23416
- 中华口腔医学会 22420
- 会议服务有限公司 17415
- 中国腐蚀与防护学会 17444
- 北京三德纵横医院管理咨询公司 17402
- 深圳市生物医药促进会 1382
- 第二届计算机科学与人工智能国际会 23417
- 天津市电子学会 20387
- 广州正和会展服务有限公司 22410
- 河海大学 7406
- springer出版社 20411
- 武汉志明文化传播有限公司 7410
- cdtu_wang 17375
- WILL 20418
清华大学自动化系汪小我团队提出知识引导与数据驱动相融合的合成启动子AI设计方法
2024/03/29
近日,清华大学自动化系汪小我团队提出了一种将专家知识与大数据学习相融合的合成启动子人工智能辅助设计方法,发现了转录因子结合位点旁侧序列在启动子优化设计中的重要作用,为突破基因调控元件设计中面临的高维度、小样本的核心难题提供了新的思路。
近年来,合成生物学作为一门新兴交叉学科获得了蓬勃发展,为破解人类面临的资源、健康、环境等重大挑战提供全新解决途径。合成生物学的核心理念是通过对DNA等生物大分子的逆向设计重构获得具有特定功能的人工生物系统。然而,这些生物分子编码的组合排列空间十分庞大,序列与功能的映射关系复杂,对生物大分子序列进行精准设计极具挑战。近期人工智能技术的突破引发了自然语言处理、计算机视觉等领域的革命性进步,尤其是以ChatGPT等为代表的生成式智能模型的突破,彰显出AI在提取复杂模式、生成复杂对象上的强大潜力。基于人工智能技术逆向设计启动子等具有特定功能的生物大分子序列,将为合成生物学的发展提供强大的设计工具和丰富的基础元件。
启动子是决定基因在何时、何地以何种程度进行转录表达的合成生物学基础元件,设计具有特定功能的人工启动子是逆向构造人工基因系统的基础。启动子中连接不同转录因子结合位点的之间的旁侧序列被证明对启动子功能有着重要影响,但这些旁侧序列的特征难以被人为归纳总结为明确的知识和设计准则。同时,由于天然基因组中具有特定转录因子结合序列的启动子数量稀少,难以直接建立深度学习模型对这些启动子的序列的整体模式进行提取。这些因素导致旁侧序列在设计中被长期忽视,缺乏有效的对启动子进行整体优化设计的方法。
知识引导与数据驱动相融合的启动子辅助设计方法DeepSEED
针对这一问题,研究团队创新提出了一种知识引导与数据驱动相融合的智能设计策略:首先基于人类专家擅长在小样本中识别明确模式的特点,利用专家知识定义与启动子功能相关的重要显式模式作为“种子”序列;在此基础上,基于深度学习模型擅长在大型数据集中检测隐含弱模式的强大能力,在海量启动子数据中学习旁侧序列与种子序列的隐式匹配关系,进而基于条件生成式模型获得与特定种子序列相匹配的旁侧序列,对序列整体进行全局优化。在实际应用过程中,研究者可以任意指定已知生物调控模式序列作为“种子”序列,模型通过学习大数据中旁侧序列的调控规律对“种子”的旁侧序列进行补全,从而实现启动子的按需优化设计。研究团队成功将该方法应用于大肠杆菌内组成型启动子、IPTG诱导型启动子,以及哺乳动物细胞内Dox诱导型启动子的优化设计。模型设计生成的合成启动子在表现出高度序列多样性、与天然基因序列低相似性的同时,保留了天然序列中k-mer频率等关键统计特征,并优化了DNA序列大小沟偏好、偏转角等系统整体属性,大幅提升了合成启动子的转录活性和诱导率等关键性能。该成果有望为合成生物学研究提供基础性的设计工具和多样化的基因调控元件。
相关研究成果以“使用DeepSEED进行侧翼序列深度改造实现高效启动子设计”(Deep flanking sequence engineering for efficient promoter design using DeepSEED)为题,于10月9日发表于《自然·通讯》(Nature Communications)期刊。
清华大学自动化系博士研究生张鹏程、博士研究生王昊晨与硕士研究生许涵文为该论文的共同第一作者,汪小我教授为该论文的通讯作者。清华大学的魏磊、刘莉扬、胡志睿等也对本文作出了重要贡献。该研究得到国家自然科学基金、国家重点研发计划、清华大学国强研究院项目的资助。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
北京大学化学学院刘志博课题组报道“与”逻辑控制的肿瘤靶向药物递送系统
生命学院王宏伟与其合作者共同研发新型功能化石墨烯用于改善冷冻电镜优势取向问题
清华大学精仪系团队报道超高场离子云扫描技术实现高分辨生物分子异构体分析研究
生命学院颉伟课题组揭示哺乳动物基因组激活到第一次细胞命运决定转换的分子机制
清华大学深圳国际研究生院丁文伯团队在自驱动振动传感与故障诊断上取得新进展
清华大学机械系雒建斌、刘大猛课题组在超快能量耗散领域取得重要进展
中国科协组织人事部关于申报2024年度组织建设理论研究课题(第一批)的通知
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)
2024年第二届管理创新与经济发展国际学术会议(MIED 2024)(2024-06-28)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
第六届电子工程与信息学国际学术会议(EEI 2024)(2024-06-28)
第五届机械工程、智能制造与机电一体化学术会议暨 2024年汽车新材料新工艺技术论坛(MEIMM2024)(2024-07-05)
2024年文化、艺术设计与社会科学国际学术会议(ICCADSS 2024)(2024-07-25)
第三届生态系统和气候变化国际研讨会 (CECC 2024)(2024-11-15)
2024年水利,水电与能源系统国际会议(ICWRHES 2024)(2024-7-22)
2024年语言、文化与艺术交流国际学术会议(ICLCAE 2024)(2024-7-8)
2024年地球科学与环境工程国际学术会议(ICESEE 2024)(2024-7-13)
2024新材料与无机化学、机械电子国际会议(ICNMICME 2024)(2024-7-15)
2024农业技术、畜牧业与动物科学国际会议(ATAHAS 2024)(2024-7-10)
2024智能计算与生物信息学国际学术会议(ICICB 2024)(2024-7-18)
2024年第十届数字制造与自动化国际会议 (ICDMA 2024)(2024-9-20)
2024年电力、机械工程与自动化国际会议(ICPMEA 2024)(2024-6-10)
2024年第七届电子与通信工程国际会议 (ICECE 2024)(2024-12-6)