当前位置:首页 >> 学术资讯 >> 科研信息
小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

【 高录用,快速见刊 | 往届均已见刊检索】第八届可再生能源与发展国际研讨会(IWRED 2024)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)

【河南大学主办 | 已有ISSN号丨SPIE独立出版丨录用率高丨检索快】第四届生物医学与生物信息工程国际学术会议(ICBBE 2024)

【提交ACM-ICPS出版, EI&Scopus检索稳定 | 同步提交知网,最快见刊后一个月内知网检索】第三届信息经济、数据建模与云计算国际学术会议 (ICIDC 2024)

【JPCS出版,往届均已见刊检索,最快会后4个月EI检索】第三届智慧能源与能源物联网国际学术会议(SEEIoT 2024)

【ACM稳定EI检索 | 会议收录率高 | 有ISSN号】2024年智慧教育与计算机技术国际学术会议(IECT 2024)

【JPCS独立出版 (ISSN:1742-6596),往届已见刊并完成EI以及Scopus检索】第八届水动力学与能源电力系统国际学术会议(HEEPS 2024)

【四川省人工智能学会、中国民用航空飞行学院联合主办 | ACM出版 | EI(核心),Scopus检索】第四届大数据、人工智能与风险管理国际学术会议  (ICBAR 2024)

【北京航空航天大学主办丨SPIE独立出版丨已确认ISSN号】第三届智能机械与人机交互技术学术会议(IHCIT 2024)

【IEEE出版,浙江省高校主办 | 连续数届实现EI和Scopus稳定检索!】第四届电气工程与机电一体化技术国际学术会议(ICEEMT 2024)

【CPCI,CNKI,Google scholar】第三届经济、智慧金融与当代贸易国际学术会议(ESFCT 2024)

【EI Compendex, Scopus检索】2024年图像处理、智能控制与计算机工程国际学术会议(IPICE 2024)

【JPCS出版,华中科技大学协办 | EI (核心),Scopus检索】2024年机器人前沿技术与创新国际会议(FTIR 2024)

2024年土木工程结构与混凝土材料国际学术会议 (CESCM 2024)

2024年亚太计算技术、通信与网络国际会议(CTCNet 2024)

【IEEE精品会议,已确定ISBN号,见刊检索有保障!】第七届机电一体化与计算机技术工程国际学术会议(MCTE 2024)

2024年IEEE第五届控制,机器人与智能系统国际会议(CCRIS 2024)

【中南大学主办 | EI (核心) , Scopus检索】2024年智能驾驶与智慧交通国际学术会议(IDST 2024)

2024年第三届算法、数据挖掘和信息技术国际会议(ADMIT 2024)

2024年第七届机器学习和自然语言处理国际会议(MLNLP 2024)

2024年IEEE亚洲先进电气与电力工程会议(ACEPE 2024)

2024年第七届数据科学与信息技术国际会议(DSIT 2024)

会议展示区

【医工结合,高科技行业盛会,行业大咖,院士汇聚,ACM出版】2024年智能医疗与可穿戴智能设备国际学术会议(SHWID 2024)

【SPIE出版、高录用、快检索、往届均已检索】第六届无线通信与智能电网国际会议(ICWCSG 2024)

【IEEE出版 |  广东省高校联合主办 | 往届均已见刊检索,稳定快速!】第六届物联网、自动化和人工智能国际学术会议(IoTAAI 2024)

【浙江工业大学主办,往届均已成功被EI、Scopus检索! EI检索稳定、快速】第五届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2024)

【河南省科学院和河南大学联合主办 | SPIE出版 (ISSN: 0277-786X),往届已被EI收录检索】第二届遥感、测绘与地理信息系统国际学术会议(RSMG 2024)

第七届模式识别与人工智能国际会议 (PRAI 2024)

2024年教育创新国际论坛(IEFI 2024)

王选所穆亚东课题组发表电子商务多模态基础模型ECLIP

2024/04/09

以GPT为代表的通用基础模型(foundation model)是人工智能领域近期的研究前沿。基础模型通过预训练等方式在海量数据上学习,再进行微调后用于解决多种下游应用任务。近期,王选计算机所穆亚东长聘副教授课题组在计算机视觉领域顶级会议CVPR 2023发表题为“Learning Instance-Level Representation for Large-Scale Multi-ModalPretraining in E-commerce”的论文。针对电子商务这一垂直应用领域,该工作提出了一种旨在学习商品实体级表的多模态基础模型ECLIP(E代表E-commerce,即电子商务)。通过在上亿级的电商业务数据上进行训练,ECLIP获得了视觉语言定位的能力,并在电商领域的诸多任务中取得了优异的性能,超过了许多传统的多模态学习方法。

电子商务的蓬勃发展给人们的日常生活带来了极大的便利,也由此出现了与之相关联的多种应用任务,如商品分类、检索、推荐等。与为每个特定的任务单独设计模型相比,为多个电商应用任务同时构建一个通用的基础模型可以增强其适用性,降低训练的成本。现阶段,在电子商务领域的数据通常以多个模态呈现,例如一个商品常包含详情图、评论图、商品标题、商品属性等多种模态的数据,可以利用这些多模态信息去学习通用的特征表示。然而,商品图像和自然图像的特点截然不同。自然图像中几乎每个区域都被其对应的文本所描述,电商图片中真正有用的信息往往由它所关联的商品标题所确定,只存在于图像中的某个特定区域。如图1中,“煎锅”或“咖啡机”等商品实例只占据整个图像的一部分,而图中其他物体如“电磁炉”等则和商品文本标题无关。如果像传统的多模态模型那样,简单地将整个图像视为一个整体来与文本进行跨模态对齐,将会不可避免地混淆商品实例和嘈杂的背景物体。因此,电子商务基础模型的核心难题之一是如何学习得到和商品相关的表示(instance-level representation)。

图1 自然图像和商品图像的区别

解决这一挑战需要模型具有视觉-语言精细定位的能力,即根据描述商品的文本内容定位到相关联的特定图像区域。本工作提出一种无须海量人工标注的策略,如图2所示,一个商品相关的图片通常来自不同的源头,例如商品详情页、商品广告视频、以及买家的评论等等。这些不同来源的数据中包含相同的商品实例(例如图中的“红宝石面霜”),因此可以利用这种显式的相关性自动获得弱标注来对模型进行训练。

图2 电子商务领域中存在的多图特性

在模型架构设计上,ECLIP引入了一个样例解码器(instance decoder)结构来提取图像中和商品实体相关的部分,包含了一组可学习的样例查询(instance query)来感知电商图片中潜在的商品实例信息。此外,每个样例查询依赖于特定的多模态提示(multi-modal prompt),用于感知特定类型的商品实例。图3为ECLIP模型的设计细节。

图3(a)ECLIP模型结构图及(b)样例解码器设计

为了优化ECLIP,该工作采用了三种新的代理任务(pretext task),包括图像文本对比学习,商品间和商品内多模态学习,促使样例查询关注到图像中商品实例所在的区域,而忽视其它不相关的物体。其中商品间的多模态学习任务如图4,包含了不同商品所提取的实例特征之间的对比学习(即使得属于同一商品的两则特征之间的相似度大于不同的商品)及商品文本匹配(即提取的实例特征应与其对应的商品文本描述相互匹配)。

图4 商品间对比学习任务

ECLIP的基础版本有220M参数,而大型版本含有450M的参数。为了优化ECLIP的参数,从电子商务网站中收集了大约一亿图像文本对,包含1500万个不同的商品,涵盖了服装、日用品、仪器等约9000个不同的类别。对于每个商品样本,都有相应的文字描述和来自商品详情页、客户评论和附加广告视频的图片。为了评估ECLIP的性能优越性,该文在多个电商下游任务上进行了实验,包括零样本商品分类、零样本商品定位等。与传统的多模态模型相比,ECLIP取得了显著的性能提升,验证了提取商品实例化表示在电子商务领域中的重要性。值得注意的是,在没有任何人工标注的情况下,ECLIP在视觉定位(grounding)等定位任务上仍然获得优异的性能。这充分说明了ECLIP学到了视觉语言定位的能力。图5给出了一些可视化结果。左图展示了商品图片与文本描述之间的相似度热力图,其中深色对应更高的相似度,可以看到同传统的多模态模型CLIP相比,ECLIP更容易正确地关注到与文本描述相对应的商品实例。右图也展示了ECLIP在定位任务上的优越性能。

图5 ECLIP在跨模态定位和视觉检测任务上的可视化结果

通过在上亿级的电商业务多模态数据上进行训练和定制设计的编码器结构,ECLIP取得了优异的性能,目前已经在字节跳动的电商业务中进行部署应用。本文第一作者为前沿交叉学科研究院2020级博士生金阳,通讯作者为穆亚东,其他合作者还包括李勇志、袁泽寰(字节跳动公司)。


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)

第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)

2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)

第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)

2024年第二届管理创新与经济发展国际学术会议(MIED 2024)(2024-06-28)

2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)

第六届电子工程与信息学国际学术会议(EEI 2024)(2024-06-28)

第五届机械工程、智能制造与机电一体化学术会议暨 2024年汽车新材料新工艺技术论坛(MEIMM2024)(2024-07-05)

2024年文化、艺术设计与社会科学国际学术会议(ICCADSS 2024)(2024-07-25)

2024年应用化学、工业催化与能源研究国际会议(ACICER 2024)(2024-6-23)

2024建筑设计、流体力学与钢结构国际会议(ADFMSS 2024)(2024-7-13)

2024年应用计算智能、信息学与大数据国际会议(ACIIBD 2024)(2024-7-26)

2024年无线通信与信息安全国际会议(ICWCIS 2024)(2024-7-23)

2024电力电气与智能电网国际会议(ICEPSG 2024)(2024-6-25)

2024年粤港澳大湾区教育数字化与计算机科学国际学术会议(EDCS 2024)(2024-6-21)

2024年第9届生物医学信号与图像处理国际会议 (ICBIP 2024)(2024-8-23)

2024年企业经济管理与大数据国际会议(ICEEMBD 2024)(2024-6-31)

2024年人工智能、数字媒体技术与交互设计国际学术会议(ICADI2024)(2024-11-29)

2024年第六届电信与通信工程国际会议 (ICTCE 2024)(2024-11-22)


第五届机械工程与智能制造国际学术会议(MEIM 2024)
2024年计算机视觉、机器人与自动化工程国际学术会议(CRAE 2024)
第九届信息科学、计算机技术与交通运输国际学术会议(ISCTT 2024)
第四届教育、信息管理与服务科学国际学术会议(EIMSS 2024)
2024年土木工程结构与混凝土材料国际学术会议 (CESCM 2024)