- MICROBIOLOGICAL 51
- 《中国骨与关节杂志》期刊的主题范 37
- 建筑专业可投的TOP期刊SCI一 41
- 清华大学工物系牵头的中国暗物质实 2592
- 资产评估方向上的优秀论文题目 48
- sci一区拒稿可以投二区吗 41
- 是否参与出版一部专著就能够确立职 42
- 个人出版专著需要做的重要步骤 58
- 北京大学材料学院张青课题组实现室 34
- 在国外出版物理学书籍需要遵循一系 51
- 职称晋级是否需要公开检索 46
- JOURNAL OF ORAL 43
- 研究生自费出书是否容易成功呢? 54
- 发表SCI论文具有哪些重要性? 2722
- DOI号(Digital Obj 40
- 深圳市富士康 17399
- 武汉科技大学 17396
- 天津科技大学 20369
- 外研社国际会议中心 17401
- 内蒙古集宁师范高等专科学校生化系 17406
- 中国装配式建筑网 23379
- 百奥泰(大连)国际会议有限公司 20388
- 西安石油+IPPTC 23408
- 国际工学技术出版协会 1375
- 西北工业大学 1394
- 中国电工技术学会 22433
- 重庆维普资讯有限公司 7409
- 天津工业大学 17381
- 万利达集团有限公司 20397
- 的萨达是大事我 17389
- 武汉华联帕博文化传播有限公司 22364
- 武汉会议策划公司 22365
- 北京工经联科技信息中心 17412
- VFEAVW 7345
- 广州市锐博生物科技有限公司 22377
北京大学高歌课题组开发出基于自适应卷积核的新卷积学习方法
2024/04/28
深度学习是机器学习的一种,通常指基于表示学习的深度神经网络,如基于卷积神经层构建的卷积神经网络、基于递归神经层构建的递归神经网络等。它适合用来发现海量高维数据背后的复杂模式。近十年来,随着计算机算力的大幅提升,深度学习在图像识别、自然语言处理等领域取得了众多成果,其中可以捕捉数据局部特征的卷积神经网络已被广泛应用于组学序列数据分析、生物影像处理等多个生命科学相关领域。
卷积神经网络可利用卷积层中一系列卷积核来自动识别输入序列上频繁出现的序列片段,并通过将这些片段组合以发现其中的序列motif。然而,目前卷积层只能使用预设固定长度的卷积核,难以适应海量组学数据中复杂多变的信号模式。为此,目前的主流实现中常用多种不同大小的卷积核分层叠加以应对,但由此导致的模型参数膨胀又显著提升了训练难度。
论文截图
近日,北京大学生物医学前沿创新中心(BIOPIC)、北京未来基因诊断高精尖创新中心(ICG)、北京大学生命科学学院生物信息中心(CBI)、蛋白质与植物基因研究国家重点实验室高歌研究员课题组,在生物信息学期刊Briefings in Bioinformatics发表了题为“Identifying complex motifs in massive omics data with a variable-convolutional layer in deep neural network”的生物信息学论文,提出能够在训练中自动调整卷积核长度的新型变长卷积层vConv。vConv通过在原始卷积核上叠乘两条形状可训练的对向S型曲线,来动态遮蔽卷积核两侧元素、进而实时学习卷积核的有效长度。
vConv层结构:为了生成掩码矩阵(mask matrix),vConv使用两个对称的sigmoid函数生成了两个矩阵(A和B),然后通过叠加这两个矩阵获得了掩码矩阵(C)。在此基础上,vConv把该掩码矩阵与原始的卷积核做Hadamard积,获得了掩码内核(D),再将该掩码内核与输入序列进行卷积(E)
序列motif(sequence motif)通常是指与特定生物学功能相关的一段序列片段、及其相关碱基/氨基酸分布模式,如转录因子结合位点、蛋白质功能域等。识别、鉴定与发现序列motif是生物信息学与计算生物学的经典问题之一。多组模拟与真实数据集的测试显示,基于vConv的神经网络可于Gb级别海量组学数据中准确识别鉴定序列motif,性能显著优于经典工具及基于传统卷积层的神经网络。
vConv可直接加入现有多层神经网络模型中,可作为传统卷积层的直接替代广泛应用于数据挖掘、图像识别等多个领域。为方便使用,相关Python代码及教程已通过GitHub开源发布(https://github.com/gao-lab/vConv),与课题组前期发布的池化层ePooling方法(https://github.com/gao-lab/ePooling)相结合,可为相关应用提供平滑升级路径。
北京大学生命科学学院博士生李静一、实习生金燊(现为美国卡内基梅隆大学计算生物学系硕士)为该论文的共同第一作者,高歌、军事科学院军事医学研究院辐射医学研究所博士后丁阳为共同通讯作者,北京大学生命科学学院本科生屠鑫明在代码测试上提供了大力支持。该研究得到国家科技部、北京未来基因诊断高精尖创新中心、蛋白质与植物基因研究国家重点实验室的支持,计算分析工作于北京大学高性能计算校级公共平台与ICG高性能计算平台完成。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
北京大学汇丰商学院王鹏飞与合作者发文探讨信贷扩张引发严重经济危机和缓慢经济复苏的原因
清华大学环境学院王春艳团队在微观居民家庭单元水-能耦合机制研究方面取得进展
清华大学朱听教授团队在镜像T7 RNA聚合酶研究领域取得新进展
北京大学信息工程学院杨玉超课题组在忆阻器耦合振荡动力学计算系统方面取得重要进展
南方医科大学白晓春教授团队在异位骨化形成机制研究方面取得进展
药学院饶燏团队应用雷公藤红素的靶点鉴定开发基于降解的蛋白质分析策略
第十一届先进制造技术与材料工程国际学术会议 (AMTME 2024)(2024-05-17)
第五届计算机通信与网络安全国际学术会议 (CCNS 2024)(2024-05-17)
2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)
第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
2024矿产资源、地质与资源勘探国际会议(MRGRE 2024)(2024-5-18)
2024年光子学全球会议 (PGC 2024)(2024-8-26)
2024年智慧体育、教育信息技术与健康管理国际研讨会(SSEITHM 2024)(2024-6-15)
2024年电力系统、电气技术与自动化国际会议(ICPSETA 2024)(2024-5-25)
2024算法、智能仿生与控制科学国际会议(AIBCS 2024)(2024-5-18)
2024年新闻学、传播学与新媒体国际会议(ICJCNM 2024)(2024-7-20)
2024年第四届机器人、自动化和人工智能国际会议 (RAAI 2024)(2024-12-19)
2024年机器学习与模式识别国际会议(ICMLPR 2024)(2024-5-18)
2024年自动化控制与大数据应用国际会议 (ICACBDA 2024)(2024-6-15)
2024年第13届软件与计算技术国际会议 (ICSCT 2024)(2024-7-26)