- 硕士研究生参加学术会议通过的途径 75
- 《现代口腔医学杂志》期刊简介 37
- 北京大学汇丰商学院Ehsan B 49
- 清华大学 精仪系生医仪器与应用团 79
- 如何通过出版社申请书号 56
- 高职酒店管理专业毕业论文考核评价 66
- 国内科学论文通讯作者的价值与意义 52
- 浅析学术会议指南 62
- 清华大学 化学系曲良体教授课题组 47
- 中国科学院大学材料科学与光电技术 64
- 清华大学深圳国际研究生院王学谦、 44
- SCI论文选题遵循的原则和方法 42
- 探讨关于论文润色的攻略 68
- 关于国外出版社能否出版诗集的争议 58
- 文献综述与文献分析的区别 119
- 天津市仪器仪表学会 20398
- 上海华东师范大学 17416
- 洛阳有色金属加工设计研究院 23383
- HKSME 22403
- 国防科大计算机学院 17402
- 国际工学技术出版协会 23408
- 新疆克拉玛依石西油田 17440
- 西安华线石油科技有限公司 7386
- 新天木业有限公司 17427
- 中国传媒大学 17369
- 昆明中国国旅 22399
- 湖北工程学院 1399
- 贵阳市会议公司 22408
- 中国造船工程学会工艺委员会 23410
- 云南财经大学 20382
- 中国学术云会议网-百奥泰联合承办 20410
- Global Science & 23377
- 武汉博胜学术交流有限公司 7391
- 百奥泰国际会议(大连)有限公司 23389
- 第八届信息与通信技术国际会议 22391
深研院新材料学院在《自然.通讯》发表运用代数图论与机器学习实现定量预测分子特性
2024/05/08
大数据和人工智能与化学基因和材料基因的融合正推动生物医学和新材料的前沿科学发展。近年来,机器学习,尤其是深度学习,已经成为基于数据驱动的分子尺度发现化学基因和材料基因强大方法。2019年冠状病毒病(COVID-19)暴发一年后还没有特异性的有效药物,这提醒我们生物医药是复杂的前沿科学领域,有效的药物发现涉及一系列相关的分子特性,包括结合亲和力、毒性、分配系数、溶解度、药代动力学、药效学等等。对生物医药分子特性的实验测定是非常耗时和昂贵的。此外,涉及到动物或人类的实验测试会有会有道德问题的禁区。因此,大数据和人工智能的方法在许多情况下可以产生快速的结果而不严重牺牲准确性,其中最受欢迎的方法之一是定量结构活性关系(QSAR)分析,它假定类似的分子具有类似的生物活性和理化性质。尽管科研人员在预测分子性质的方向已经进行了做大量的工作,但各种分子性质的定量预测仍然是一个挑战。
近日,北京大学深圳研究生院新材料学院的潘锋团队与密歇根州立大学数学系的魏国卫教授合作,通过融合代数图论方法和Google开发的深度自注意力变换(Transformer)的机器学习方法提出和发展了一种新型的代数图辅助的双向转化器(AGBT)框架,实现基于小样本数据有效的定量预测分子特性。这一成果近期发表在《自然.通讯》【Nature Communications, 2021,12(1), 1-9.】题目为“Algebraic graph-assisted bidirectional transformers for molecular property prediction”。
代数图论方法辅助的双向转化器(AGBT)框架
通常深度学习方法需要大量的数据集来进行训练,在小型数据集上利用深度学习模型一般很难取得有效准确的预测。在化学中,通过实验或者第一性原理确定有标签性能的数据只占少数。团队发现化学中的分子性能预测极大依赖于分子描述符或分子表示法,拓展深度学习方法来产生高质量的分子描述符可以提升预测的准确性,包括运用自然语言处理(NLP)中自监督学习方法,大量无标签的语言数据可被用于“预学习”和用于模型的训练和预测,在生物医学方面运用分子的SMILES表示的化学语言,利用自然语言处理中的相关模型实现了基于自监督学习方法的预训练。团队在研究中发现基于SMILES数据的训练模型会丢失一些分子结构的三维信息,从而影响相应的分子描述符的质量,从而自主原创设计出一种基于代数图论辅助的深度学习框架(AGBT),这种方法既利用了Transformer这种深度学习方法将大量无标签的分子数据利用起来,又借助了代数图论的方法弥补了深度学习框架(Transformers)所遗失的一些三维信息,可以实现高质量的分子描述符的产生。这种分子描述符,对小数据样本的分子特征预测的能力有较高的提升,实现快速有效的定量的分子特性预测。
一种元素特异性的多尺度加权彩色代数图论方法
此外,本工作利用代数图图论的方法,特别是特定元素的多尺度加权彩色代数图论方法,将三维分子信息嵌入图的不变量中,发展了代数图辅助的双向转化器(AGBT)框架,通过融合代数图论方法产生的分子描述符和Transformers产生的分子描述符表,实现与两种分子信息的互补,借助各种机器学习算法,包括决策树、多任务学习和深度神经网络,实现下游任务中对分子特性的预测。本工作在八个分子数据集上验证了所提出的AGBT框架,涉及定量毒性、物理化学和生理学数据集。大量的数值实验表明,所发展的AGBT是一个高效的分子特性预测模型。
文章的第一作者是北京大学深圳研究生院新材料学院的博士研究生陈冬,通信作者是潘锋和魏国卫教授。本工作得到国家材料基因工程重点专项和广东与深圳科技项目的支持。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
清华大学 环境学院黄霞团队开发纳米缺陷热控策略实现电催化膜高效降解微污染物
上海市科技成果转化创新改革试点申报:享成果所有权、激励、免责,9月20日截止
中国科学院文献情报中心:2024年《国际期刊预警名单》正式发布!
清华大学集成电路学院唐建石课题组研制出基于忆阻器的低功耗全模拟储备池计算系统
北京大学彭书时研究员与海外合作者在大气甲烷浓度增速的机制研究方面取得新进展
第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)
第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)
2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
2024年化学技术与先进材料国际会议(ICCTAM 2024)(2024-5-25)
2024年机械,测绘技术与航天航空国际会议(ICMSMTA 2024)(2024-6-25)
2024人文、教育与社会发展国际学术会议(ICHESD 2024)(2024-6-28)
2024年教育科学与人文发展国际学术会议(ICESHD 2024)(2024-6-25)
2024年计算机视觉、机器人与自动化工程国际学术会议(CRAE 2024)(2024-6-21)
2024数学科学与计算机教育国际学术研讨会(ISMSCE 2024)(2024-5-25)
2024年第二届亚洲前沿图像处理会议(AAIP 2024)(2024-7-26)
2024公共管理、人文发展与智能社会国际会议(IPAHDS 2024)(2024-6-24)
2024年计算机应用与智能控制国际学术会议(ICCAIC 2024)(2024-5-29)
2024物理学、半导体与复合材料国际会议(ICPSC 2024)(2024-6-30)