中国农业大学工学院农机装备智能化设计与制造创新团队在计算机视觉领域取得进展
2025/09/05
8月19日,农机装备智能化设计与制造创新团队杜岳峰副教授在《先进科学》(Advanced Science,IF5years=15.6)在线发表了《认知启发的神经网络建模框架在计算机视觉中的潜力》(The Potential of Cognitive-Inspired Neural Network Modeling Framework for Computer Vision)的研究论文。
本研究立足于人工智能与认知科学,聚焦于认知启发的视觉深度神经网络建模方法和视觉模型的底层范式,将抽象的认知理论形式化为数学表示,同时实现了理论和概念映射到可扩展和训练的程序代理,这一范式展示了认知启发式人工智能的广泛潜力,有望改变我们设计和理解人工智能系统的方式由纯粹的工程优化(对数据分布的有效拟合)过渡到仿生设计(结合人类智能内涵的认知机制),同时推动机器人具身智能系统由单纯的感知驱动向认知驱动转变,为机器人具身智能的安全性与可控性奠定坚实基础。
长短时记忆网络(LSTM)和胶囊网络(CapsuleNet)通常被视为人工智能与认知科学交叉的起点。由于描述认知系统运行机制的理论通常由高度抽象的“方框-箭头”图描述,且这些理论缺乏明确的数学公式或计算过程,而视觉模型强调通过数值计算从大规模训练数据中自动学习潜在的逻辑和模式。视觉模型与认知理论在功能实现上的分歧反映了人工智能与认知科学之间的差距,现阶段的研究主要集中于在视觉模型中复制人类视觉注意力的信息筛选机制,而非模拟形成注意力的复杂认知系统(图a),导致视觉模型及其基础算子的性能过度依赖于训练数据的规模和质量。因此,融合认知理论指导视觉模型底层算子和架构的开发存在功能抽象、数值建模和规则约束等众多开放且具有挑战性的问题。
为解决上述问题,该研究提出了一个允许将抽象的认知理论转化为可计算表示的建模理论(CMF)(图b),CMF包含三个步骤:功能抽象(步骤一)、算子结构化(步骤二)和程序代理(步骤三)。同时,在CMF中引入了三个核心概念:功能泛函、计算图和代理程序。这些概念使得认知功能及其之间的因果逻辑能够被嵌入到模型的计算过程中,并作为算子计算原理和学习目标的明确约束。为了在视觉模型中模拟长时记忆,创新性地提出将视觉模型的长时记忆定义为由图像中的基本特征组成的先验信息,并开发了一种名为无偏映射算法(UMA)的长时记忆建模方法(图c),该方法使用快速傅立叶变换和统计方法从大规模数据中无监督地提取先验信息;最后,基于CMF和UMA开发了视觉认知神经单元(VCNU)和视觉认知模型(VCogM)(图d),并在自然场景识别任务上进行了性能测试。为了验证该方法在农业领域的潜力,开发了一个包含17万张农业图像的基准数据集(Agri170K),并在此数据集上对VCNU与VCogM进行了性能测试。实验结果表明,VCogM和VCNU在所有任务中均获得了较先进的性能。同时,发现VCogM的学习过程与数据分布和规模无关,充分证明了认知启发式视觉模型的先进性。
(a)人脑中视觉注意力形成过程(b)认知建模框架(c)无偏映射算法(d)实例化代理程序
该项研究得到农业科技重大项目、中国农业大学学科交融拓新计划—“智慧农业及智能装备数字孪生体构建理论与方法”等项目资助。中国农业大学为唯一单位,博士研究生李国润和博士后刘磊为共同第一作者,杜岳峰副教授为通讯作者,创新团队负责人宋正河教授以及团队成员武秀恒副教授、栗晓宇老师对研究工作给予了重要支持。
该项成果展示了团队在通用计算机视觉和人工智能的基础研究实力,团队将继续围绕“智能农机装备+AI”,在跨学科交叉、理论创新和工程实践持续投入,形成具有中国农大特色的研究和理论体系。为促进行业发展,团队一致同意将该研究成果开源,以实际行动践行“强国先强农,农大作先锋”的号召与使命。详细代码已发布至:https://github.com/CAU-COE-VEICLab/Vision-Cognitive-Neural-Networks
文章来源中国农业大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年1月高含金量国际学术会议合 12-12
-
第四届金融科技与商业分析国际学术会议 686
-
2026年第十一届复合材料与材料工程 1453
-
2025年机器视觉、智能成像与模式识 2126
-
2025年智能光子学与应用技术国际学 3284
-
2026年机械工程,新能源与电气技术 3476
-
2025年计算机科学、图像分析与信号 3917
-
2025年材料化学与燃料电池技术国际 3633
-
2026年交通数字化、人工智能与韧性 12-19
-
2026年社会文化与公共管理国际会议 12-19
-
2026年人文地理与语言研究国际会议 12-19
-
2026年社会发展与经济发展国际会议 12-19
-
2026年光伏材料、光电转换与可再生 12-19
-
2026年可持续发展与数字化社会国际 12-19
-
2026年管理科学、语言与教育国际会 12-19
-
2025年两院院士增选有效候选人2672
-
2025最新JCR分区及影响因子7552
-
好学术:科研网址导航|学术头条分3540
-
2025年国际期刊预警名单发布!3510
-
2025年中科院期刊分区表重磅发13412
-
中国科协《重要学术会议目录(207866
-
吉林大学校长张希:学术会议中的提4517
-
中国科大提出电化学一体化驱动策12-19
-
中国科大实现电泵浦片上集成高亮度12-19
-
西北农林科技大学【陕西新闻联播】12-19
-
中国科大实现片上非相干泵浦高品质12-19
-
中国科大中性原子量子计算研究成果12-19
-
炔烃远端C-O键的不对称活化转化12-19
-
研究揭示叶片内生真菌分子功能多样12-19
-
科研人员提出柑橘黄龙病防控新策略12-19
-
中华医学会 21466

-
北京创维未来信息咨询中心 18031

-
HKSME 23072

-
HKSME 23183

-
西安建筑科技大学 18333

-
武汉奔诚文化传播有限公司 8541

-
安徽博励会展有限公司 24163

-
VERBI软件有限责任公司 8219

-
华南理工大学 21269

-
山东省烟台大学 21393

-
中国电池工业网 21218

-
湖北学而升文化传播有限公司 8204

-
中国科学院南海海洋研究所 18151

-
博锐国际展览有限公司 2064

-
上海理工大学生物医学热科学研究所 18351

-
北京世纪同声翻译社 2410

-
Higher Education 24319

-
WILL 21021

-
神州音业有限公司 18133

-
中国自动化学会 21065

















153












































