- 详细介绍EI学术会议参会流程 57
- 关于EI期刊审稿步骤 93
- 毕业论文里的数学公式会出现乱码吗 58
- 一些国内心理学核心期刊目录的介绍 58
- 《中华肝脏外科手术学电子杂志》期 37
- 使用iThenticate进行论 80
- 《电子学报》属于什么级别的期刊 111
- 向EI期刊投稿时你可以遵循的步骤 67
- 关于如何写毕业论文的基本步骤和建 60
- 探讨法律逻辑学的课题有哪些方向呢 48
- 清华大学 药学院钱锋课题组提出无 41
- 找论文文献通常有哪些途径 51
- 清华大学深圳国际研究生院周光敏、 48
- 中文核心期刊查重率多少呢 53
- 准备学术会议汇报的建议 48
- 武汉博倍会务有限公司 1381
- 武汉金钥匙会务服务有限公司 23379
- 第九届机械与电子国际学术会议 23408
- 中南财经政法大学 22407
- 上海中仿科技有限公司 22387
- 丝绸之路国际和平智库 7402
- 北京多维路桥 17402
- 宁波索达电器有限公司 20406
- 北京麦迪卫康广告有限公司 20413
- 北京沃特咨询有限公司 7454
- 湖南商康医药电子商务有限公司 20420
- 华南理工大学 17393
- we 23415
- 呼和浩特市艾瑞会议服务有限公司 1385
- 北京东方旅游公司 17405
- 上海首美展览有限公司 7403
- 哈尔滨工业大学 17396
- 全国卫生产业企业管理协会抗菌产业 22402
- 华南师范大学化学与环境学院 20418
- IWEG组委会 7378
清华大学自动化系汪小我团队提出知识引导与数据驱动相融合的合成启动子AI设计方法
2024/03/29
近日,清华大学自动化系汪小我团队提出了一种将专家知识与大数据学习相融合的合成启动子人工智能辅助设计方法,发现了转录因子结合位点旁侧序列在启动子优化设计中的重要作用,为突破基因调控元件设计中面临的高维度、小样本的核心难题提供了新的思路。
近年来,合成生物学作为一门新兴交叉学科获得了蓬勃发展,为破解人类面临的资源、健康、环境等重大挑战提供全新解决途径。合成生物学的核心理念是通过对DNA等生物大分子的逆向设计重构获得具有特定功能的人工生物系统。然而,这些生物分子编码的组合排列空间十分庞大,序列与功能的映射关系复杂,对生物大分子序列进行精准设计极具挑战。近期人工智能技术的突破引发了自然语言处理、计算机视觉等领域的革命性进步,尤其是以ChatGPT等为代表的生成式智能模型的突破,彰显出AI在提取复杂模式、生成复杂对象上的强大潜力。基于人工智能技术逆向设计启动子等具有特定功能的生物大分子序列,将为合成生物学的发展提供强大的设计工具和丰富的基础元件。
启动子是决定基因在何时、何地以何种程度进行转录表达的合成生物学基础元件,设计具有特定功能的人工启动子是逆向构造人工基因系统的基础。启动子中连接不同转录因子结合位点的之间的旁侧序列被证明对启动子功能有着重要影响,但这些旁侧序列的特征难以被人为归纳总结为明确的知识和设计准则。同时,由于天然基因组中具有特定转录因子结合序列的启动子数量稀少,难以直接建立深度学习模型对这些启动子的序列的整体模式进行提取。这些因素导致旁侧序列在设计中被长期忽视,缺乏有效的对启动子进行整体优化设计的方法。
知识引导与数据驱动相融合的启动子辅助设计方法DeepSEED
针对这一问题,研究团队创新提出了一种知识引导与数据驱动相融合的智能设计策略:首先基于人类专家擅长在小样本中识别明确模式的特点,利用专家知识定义与启动子功能相关的重要显式模式作为“种子”序列;在此基础上,基于深度学习模型擅长在大型数据集中检测隐含弱模式的强大能力,在海量启动子数据中学习旁侧序列与种子序列的隐式匹配关系,进而基于条件生成式模型获得与特定种子序列相匹配的旁侧序列,对序列整体进行全局优化。在实际应用过程中,研究者可以任意指定已知生物调控模式序列作为“种子”序列,模型通过学习大数据中旁侧序列的调控规律对“种子”的旁侧序列进行补全,从而实现启动子的按需优化设计。研究团队成功将该方法应用于大肠杆菌内组成型启动子、IPTG诱导型启动子,以及哺乳动物细胞内Dox诱导型启动子的优化设计。模型设计生成的合成启动子在表现出高度序列多样性、与天然基因序列低相似性的同时,保留了天然序列中k-mer频率等关键统计特征,并优化了DNA序列大小沟偏好、偏转角等系统整体属性,大幅提升了合成启动子的转录活性和诱导率等关键性能。该成果有望为合成生物学研究提供基础性的设计工具和多样化的基因调控元件。
相关研究成果以“使用DeepSEED进行侧翼序列深度改造实现高效启动子设计”(Deep flanking sequence engineering for efficient promoter design using DeepSEED)为题,于10月9日发表于《自然·通讯》(Nature Communications)期刊。
清华大学自动化系博士研究生张鹏程、博士研究生王昊晨与硕士研究生许涵文为该论文的共同第一作者,汪小我教授为该论文的通讯作者。清华大学的魏磊、刘莉扬、胡志睿等也对本文作出了重要贡献。该研究得到国家自然科学基金、国家重点研发计划、清华大学国强研究院项目的资助。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
生命科学学院李毓龙团队利用新型GRAB探针解析组胺在睡眠-觉醒过程中的动态变化
浙江大学与海外合作者在益生菌/人工酶活性复合材料研究方面取得进展
北京大学深研院陶虎春课题组研究成果入选Environmental Science & Ecotechnology期刊“Editor’s Choice Article”
清华大学 生命学院时松海课题组揭示调控大脑新皮层神经元空间精细结构排布和环路组装新机制
清华大学深圳国际研究生院郭烨团队在电能量-备用市场联合出清与定价领域取得新进展
北京大学物理学院谢心澄课题组及合作者对半磁性拓扑绝缘体中关于半量子化霍尔电导输运理论的研究取得重要进展
清华大学 化学系王定胜、李亚栋合作实现有机小分子催化并实现高效氯碱反应
深圳国际研究生院任政儒及合作者在海上风机自动安装研究领域取得新进展
第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)
第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)
2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
2024环境工程、动力与能源系统国际会议(ICEEPES 2024)(2024-6-23)
2024年建筑结构与物理力学国际会议(ICBSPM 2024)(2024-5-25)
2024年工程材料与机械制造技术国际会议(EMMMT 2024)(2024-7-27)
2024智能轨道、交通与电气工程国际学术会议(ICTIREE 2024)(2024-5-25)
第七届机电一体化与计算机技术工程国际学术会议(MCTE 2024)(2024-8-23)
2024年生物医药与生物信息学国际会议(ICBB 2024)(2024-5-28)
2024年计算机视觉,图形与图像处理国际会议(CVGIP 2024)(2024-6-28)
2024年互联网技术与教育信息化国际会议(ITIE 2024)(2024-6-23)
2024船舶技术与海洋工程国际会议(ICSTME 2024)(2024-6-25)
2024年心理学与行为科学国际学术会议(ICPBS 2024)(2024-6-30)