- 在学术会议上分享论文通常有哪些方 41
- 合著和独著都有的优势 58
- 专利申请对大学生的好处 55
- 《系統管理学报》期刊的相关内容 42
- 电网负载预测论文发表sci技巧有 45
- 知识产品都有哪些类型呢 63
- 清华大学深圳国际研究生院廖然、马 46
- 清华大学物理系在黑磷中实现弗洛凯 53
- 陆军军医大学陆军特色医学中心(大 41
- 投稿到国外EI期刊通常需要按照哪 50
- 计算机方向中科院一区期刊有用吗 35
- 为什么学术著作需要润色呢? 54
- 北京大学 光华管理学院彭一杰课题 56
- 园艺教育方向优秀论文题目有哪些? 39
- 复旦大学环境系王梓萌教授团队与海 53
- 北京礼瑞文化 20374
- 能源工程与环境保护国际会议 23412
- 华南理工大学 17391
- 中科博爱(北京)心理医学研究院 22389
- 上海市交通工程学会 20400
- 华中师范大学 17401
- VFESVDS 20373
- czqqzx 17378
- 广州国龙会议策划服务有限公司 23392
- 中国环境科学学会 22385
- 《医药导报》编辑部 22377
- BIT 1393
- 上海亚化商务咨询有限公司 20392
- 贝旭科(上海)投资咨询有限公司 1393
- 济南宏达公司 17436
- IETP 20395
- 中共中央党校研究生院 20395
- 辽宁工程技术大学 17391
- 重庆文理学院 17394
- 敦化市医药行业协会 23392
北京大学高歌课题组开发出基于自适应卷积核的新卷积学习方法
2024/04/28
深度学习是机器学习的一种,通常指基于表示学习的深度神经网络,如基于卷积神经层构建的卷积神经网络、基于递归神经层构建的递归神经网络等。它适合用来发现海量高维数据背后的复杂模式。近十年来,随着计算机算力的大幅提升,深度学习在图像识别、自然语言处理等领域取得了众多成果,其中可以捕捉数据局部特征的卷积神经网络已被广泛应用于组学序列数据分析、生物影像处理等多个生命科学相关领域。
卷积神经网络可利用卷积层中一系列卷积核来自动识别输入序列上频繁出现的序列片段,并通过将这些片段组合以发现其中的序列motif。然而,目前卷积层只能使用预设固定长度的卷积核,难以适应海量组学数据中复杂多变的信号模式。为此,目前的主流实现中常用多种不同大小的卷积核分层叠加以应对,但由此导致的模型参数膨胀又显著提升了训练难度。
论文截图
近日,北京大学生物医学前沿创新中心(BIOPIC)、北京未来基因诊断高精尖创新中心(ICG)、北京大学生命科学学院生物信息中心(CBI)、蛋白质与植物基因研究国家重点实验室高歌研究员课题组,在生物信息学期刊Briefings in Bioinformatics发表了题为“Identifying complex motifs in massive omics data with a variable-convolutional layer in deep neural network”的生物信息学论文,提出能够在训练中自动调整卷积核长度的新型变长卷积层vConv。vConv通过在原始卷积核上叠乘两条形状可训练的对向S型曲线,来动态遮蔽卷积核两侧元素、进而实时学习卷积核的有效长度。
vConv层结构:为了生成掩码矩阵(mask matrix),vConv使用两个对称的sigmoid函数生成了两个矩阵(A和B),然后通过叠加这两个矩阵获得了掩码矩阵(C)。在此基础上,vConv把该掩码矩阵与原始的卷积核做Hadamard积,获得了掩码内核(D),再将该掩码内核与输入序列进行卷积(E)
序列motif(sequence motif)通常是指与特定生物学功能相关的一段序列片段、及其相关碱基/氨基酸分布模式,如转录因子结合位点、蛋白质功能域等。识别、鉴定与发现序列motif是生物信息学与计算生物学的经典问题之一。多组模拟与真实数据集的测试显示,基于vConv的神经网络可于Gb级别海量组学数据中准确识别鉴定序列motif,性能显著优于经典工具及基于传统卷积层的神经网络。
vConv可直接加入现有多层神经网络模型中,可作为传统卷积层的直接替代广泛应用于数据挖掘、图像识别等多个领域。为方便使用,相关Python代码及教程已通过GitHub开源发布(https://github.com/gao-lab/vConv),与课题组前期发布的池化层ePooling方法(https://github.com/gao-lab/ePooling)相结合,可为相关应用提供平滑升级路径。
北京大学生命科学学院博士生李静一、实习生金燊(现为美国卡内基梅隆大学计算生物学系硕士)为该论文的共同第一作者,高歌、军事科学院军事医学研究院辐射医学研究所博士后丁阳为共同通讯作者,北京大学生命科学学院本科生屠鑫明在代码测试上提供了大力支持。该研究得到国家科技部、北京未来基因诊断高精尖创新中心、蛋白质与植物基因研究国家重点实验室的支持,计算分析工作于北京大学高性能计算校级公共平台与ICG高性能计算平台完成。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
华中科技大学同济医学院附属协和医院杨操教授团队在椎间盘退变机制研究方面取得进展
复旦大学公共卫生学院针对新冠病毒Omicron变异株输入我国所致疾病负担与医疗资源需求研究取得进展
北京大学材料学院占肖卫课题组及合作者通过螯合作用降低钙钛矿太阳能电池的能量无序度
山西大学张靖教授团队与国外合作者在超冷原子量子模拟方面取得新进展
第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)
第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)
2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
2024清洁能源、低碳技术与环境工程国际会议(CELCTEE 2024)(2024-5-25)
第五届运筹学及应用国际研讨会(ORA 2024)(2024-5-28)
2024年机电一体化与智能系统国际会议(ICMIS 2024)(2024-6-30)
2024年先进算法、信号处理与控制工程国际会议(AASPCE 2024)(2024-6-20)
2024物流系统、供应链管理与交通运输国际会议(ICLSSCMT 2024)(2024-5-18)
2024年能源、电气与动力工程国际研讨会(ISEEPE 2024)(2024-6-30)
2024年人工智能和机械技术应用国际学术会议(AIMTA 2024)(2024-6-19)
2024年第九届多媒体系统和信号处理国际会议(ICMSSP 2024)(2024-5-22)
2024年土木建筑与水利工程国际会议(ICCAHE 2024)(2024-6-28)
2024年消费电子、区块链与计算机工程国际会议(CEBCE 2024)(2024-5-25)