清华大学自动化系汪小我教授团队与海外合作者在神经网络解释方法领域取得进展
2024/04/12
![]() |
图 从深度卷积神经网络中提取基因调控序列的语法规则
在国家自然科学基金项目(批准号:62250007、62225307、61721003)等项目的资助下,清华大学自动化系汪小我教授团队与美国斯坦福大学统计系王永雄教授团队合作,开发了神经网络解释算法NeuronMotif,实现了从神经元中自动归纳和提取基因调控序列编码规则。研究成果以“NeuronMotif: 通过深度神经网络的逐层解耦破译基因顺式调控编码(NeuronMotif: Deciphering cis-regulatory codes by layer-wise demixing of deep neural networks)”为题,于2023年4月6日发表于《美国科学院院刊》(PNAS)期刊上。论文链接:https://www.pnas.org/doi/10.1073/pnas.2216698120。
近年来,大数据驱动的深度神经网络模型已在多个领域取得了重要进展,例如蛋白质结构和基因调控功能的高精度预测。然而,这些模型通常是不透明的黑盒,难以理解其内部机制。神经网络黑盒的透明化,可以帮助人类获取模型从数据中学习到的知识,对促进人工智能理论发展和增进相关交叉领域的认知具有重要意义。例如,在基因调控序列这一决定细胞功能和状态的DNA序列的功能预测问题上,卷积神经网络(CNN)等网络模型已经取得了很好的效果,但神经网络解释方法的缺失导致基因调控规律的解析和重构研究受到严重制约。
研究团队发现,CNN解释困难的一个主要原因在于深层神经元大多是“多面神经元”,这种神经元能够同时被多种不同序列模式激活,其直接可视化结果往往令人难以理解。其中,最大池化结构是导致多面神经元产生的关键原因。为此,研究团队提出了NeuronMotif算法:使用蒙特卡洛采样和遗传算法得到能充分激活神经元的序列集合,并通过反向逐层聚类,将序列划分到不同的子集中,最终可视化每个子集以获得易于理解的序列模式特征。
利用该方法,研究团队构建了基于结构化语法树的自动化知识提取方法,从数据中归纳转录因子结合位点序列模式、组合模式、间距、次序等调控序列语法规则,如图。相关发现得到了文献和多种生物组学数据的支撑和验证。其解释结果还可用于人工神经网络的诊断和改进,有助于解决神经网络调参困难等问题。该方法可以利用神经网络从海量数据中获取可理解的知识,从而帮助人类更加深入地理解复杂生物过程的基因调控规律,并为基因治疗等应用中定制化逆向构造人工基因调控序列提供支撑。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年1月高含金量国际学术会议合 12-12
-
第四届金融科技与商业分析国际学术会议 686
-
2026年第十一届复合材料与材料工程 1453
-
2025年机器视觉、智能成像与模式识 2126
-
2025年智能光子学与应用技术国际学 3284
-
2026年机械工程,新能源与电气技术 3476
-
2025年计算机科学、图像分析与信号 3917
-
2025年材料化学与燃料电池技术国际 3633
-
2026年交通数字化、人工智能与韧性 12-19
-
2026年社会文化与公共管理国际会议 12-19
-
2026年人文地理与语言研究国际会议 12-19
-
2026年社会发展与经济发展国际会议 12-19
-
2026年光伏材料、光电转换与可再生 12-19
-
2026年可持续发展与数字化社会国际 12-19
-
2026年管理科学、语言与教育国际会 12-19
-
2025年两院院士增选有效候选人2672
-
2025最新JCR分区及影响因子7552
-
好学术:科研网址导航|学术头条分3540
-
2025年国际期刊预警名单发布!3510
-
2025年中科院期刊分区表重磅发13412
-
中国科协《重要学术会议目录(207866
-
吉林大学校长张希:学术会议中的提4517
-
中国科大提出电化学一体化驱动策12-19
-
中国科大实现电泵浦片上集成高亮度12-19
-
西北农林科技大学【陕西新闻联播】12-19
-
中国科大实现片上非相干泵浦高品质12-19
-
中国科大中性原子量子计算研究成果12-19
-
炔烃远端C-O键的不对称活化转化12-19
-
研究揭示叶片内生真菌分子功能多样12-19
-
科研人员提出柑橘黄龙病防控新策略12-19
-
同济大学 21147

-
海洋国旅国际会展部 18043

-
北京高博特广告有限公司 21150

-
新村街二七二社区 18023

-
北京联合大学信息学院 23137

-
湖南大学 21198

-
中南大学湘雅医院 21064

-
第十六届中国微米纳米技术学会学术 18534

-
中国化工学会培训中心 21384

-
华中农业大学信息学院 21207

-
湖南大学土木工程学院 21298

-
海南大学 18061

-
清华大学材料系 21264

-
2017第二届能源工程与环境保护 24180

-
广州威凯检测技术研究院 24220

-
WWX 23144

-
中国人民大学统计学院 21232

-
上海信息公司 2181

-
中国科学院广州地球化学研究所 23028

-
北京两岸行经济文化交流有限公司 18040

















464










































