电子科技大学医学院陈新建教授团队在Nature子刊npj Digital Medicine发表研究成果
2025/11/07
近日,电子科技大学、苏州大学、汕头大学·香港中文大学联合汕头国际眼科中心和新加坡科技研究局等机构的研究团队开发了一种名为多标签OCT报告生成器(MORG)的深度学习模型,为这一难题带来了创新性解决方案。MORG能够自动解读视网膜OCT图像并生成专业报告,显著提升诊断效率,大幅减轻眼科医生的工作负担。这一研究成果以《A Deep Learning Based Automatic Report Generator for Retinal Optical Coherence Tomography Images》为题,发表于国际知名期刊《npj Digital Medicine》(中科院一区Top期刊,影响因子15.1)。医学院陈新建教授、新加坡科技研究局付华柱研究员、苏州大学电子信息学院王景涛博士以及汕头大学·香港中文大学联合汕头国际眼科中心林田博士为共同论文第一作者,汕头大学·香港中文大学联合汕头国际眼科中心陈浩宇教授为本文的通讯作者。
在全球范围内,数以百万计的人正受到年龄相关性黄斑变性、糖尿病视网膜病变等各类视网膜疾病的困扰,这些疾病不仅严重损害患者的视力,还对医疗系统和经济造成了沉重负担。视网膜光学相干断层扫描(OCT)作为一种非侵入性成像技术,为眼科医生提供了视网膜的精细三维结构信息,现已成为眼科领域中不可或缺的诊断工具。然而,解读OCT图像需要高度专业的医学知识和大量时间投入,在基层医院缺乏专业人员进行解读,而在大医院OCT的解读影响了诊疗效率。
在本项研究中,研究人员构建了MORG模型,该模型的算法架构基于一种创新的深度学习框架,该框架结合了双图像编码器、多尺度特征融合模块(MSFF)以及长短期记忆网络(LSTM)解码器。首先,模型使用两个共享权重的Densenet121网络作为图像编码器,分别对一组OCT图像(通常为水平和垂直视角)进行特征提取,以确保从不同视角的图像中获得一致的特征表示。
接着,提取的特征被输入到MSFF模块中,该模块通过多尺度特征融合和注意力机制,将不同尺度的特征图进行拼接,并生成特征权重图,以指导模型聚焦于图像中的关键区域。这种设计使得模型能够有效整合来自不同层次的特征信息,从而更好地捕捉图像中的细节和上下文。
最后,融合后的特征被输入到LSTM解码器中,通过逐词预测的方式生成诊断报告。LSTM解码器在生成报告的过程中,利用注意力机制不断与编码器提取的特征进行交互,确保在不同的时间步聚焦于图像的不同区域,从而生成准确且详细的诊断报告。
整体而言,MORG模型通过这种编码-融合-解码的架构,实现了从OCT图像到高质量诊断报告的自动转换,显著提高了报告生成的效率和质量。
MORG模型在文本质量、专家评分、疾病分类、时间效率和报告准确性等方面均展现出卓越性能,为视网膜OCT图像的自动报告生成提供了一种高效、可靠的解决方案。
1、相似性指标。MORG模型在文本相似度指标上表现出色,其BLEU-1至BLEU-4、ROUGE和CIDEr分数均高于其他SOTA模型,如NIC、Progressive Model、SCA-CNN和Bottom-up-to-down,表明其生成的报告与专业眼科医生撰写的报告在文本质量上更为接近。
2、视网膜专家盲评测试。在由两位视网膜专家进行的盲评测试中,MORG生成的报告获得了4.55分(满分5分),与眼科医生撰写的报告(4.63分)相当,且显著优于其他模型,如GPT-4和MiniGPT-4等大语言模型和图像描述模型。
3、分类指标。MORG在对16种视网膜病理类型的分类任务中,准确率、精确率、召回率和F1分数均表现优异,显示出强大的疾病识别能力。特别是对于具有明显特征或训练样本充足的病变类别,如视网膜水肿和增厚、神经上皮层脱离等,其F1分数均超过0.8。
4、时间效率评估。MORG模型显著提高了报告撰写效率,将眼科医生撰写报告的时间减少了58.9%。
5、定性分析。通过具体案例分析,MORG生成的报告在描述OCT图像特征时,与眼科医生的报告同样精确。相比之下,其他模型如MiniGPT-4和GPT-4在识别OCT图像中的异常或病变方面存在明显不足,且常生成与视网膜OCT图像无关的内容,导致其报告在临床实践中实用性较低。
MORG模型首次从视网膜OCT图像自动生成高质量诊断报告,其表现与专业眼科医生相当,大幅缩短报告撰写时间,有效减轻医生工作负担。该模型在多语言及多领域医学成像应用中的具有巨大潜力。MORG的推出,不仅推动了眼科视网膜图像诊断向智能化发展,还显著提升了诊断效率,改善了医疗资源的分配不均问题。未来,随着技术的不断完善和广泛应用,人工智能将在医疗健康领域扮演更加重要的角色,为守护人类健康福祉贡献更大力量。
文章来源电子科技大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2025年两院院士增选有效候选人4233
-
2025最新JCR分区及影响因子10957
-
好学术:科研网址导航|学术头条分5358
-
2025年国际期刊预警名单发布!5441
-
2025年中科院期刊分区表重磅发18046
-
中国科协《重要学术会议目录(2010920
-
吉林大学校长张希:学术会议中的提6602
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
南京大学AI4S再立新功:南京大03-11
-
北京航空航天大学 18235

-
cnct2016 23217

-
国家传染病诊断试剂与疫苗工程技术 21640

-
南昌大学工程力学实验中心 23207

-
大连百奥泰科技有限公司 21343

-
河北北方大厦 21313

-
医建科技(杭州)有限公司 24404

-
中国科学院宁波材料所 18336

-
北京市城市系统工程研究中心 创新 21308

-
北京师范大学环境学院 21319

-
河北省青少年素质教育研究会邯郸基 8397

-
Academy of Engin 2333

-
内蒙古大学化学化工学院 21405

-
永冠金属艺品有限公司 18330

-
同济医院康复科资源中心 21250

-
武汉木上文化传播有限公司 8368

-
电子科技大学 18334

-
甘肃方舟旅游公司 24248

-
合肥科文公司 21320

-
上海光同投资管理有限公司 2397

















130





















































