电子科技大学AI赋能 格桑花藏地语料库建设启动
2025/04/28
4月22日,格桑花藏地语料库建设在“2025天府融媒大讲堂——主流媒体系统性变革之技术赋能”活动上正式启动。该语料库由天府融媒(四川)科技有限公司、四川省全媒信息传播研究院共同发起,尼玛扎西院士工作站(电子科技大学)、藏地阳光全媒体中心、甘孜州传媒中心、四川日报全媒体技术中心等多家机构共同建设。
党的二十大提出,要实施国家文化数字化战略,增强中华文明传播力影响力。今年,教育部、国家语委、中央网信办联合印发的《关于加强数字中文建设 推进语言文字信息化发展的意见》指出,“以加强数字中文建设为重点,以集成化、智能化、国际化为导向”,“促进中文数据的规模生产、优质集成、融合创新、规范治理和复用增效”,“加快推进语言文字信息化发展”,明确要求推进“古籍数字化整理关键技术研究”和“国家关键语料库、高质量民族语言文字语料库”建设。
格桑花代表着幸福和吉祥,是藏族人民对美好生活的向往和期盼。以“格桑花”命名,寓意语料库将像格桑花一样传承藏族文化,并为藏语在人工智能时代的应用注入新的希望和活力。
目前,格桑花藏地语料库已初步搭建藏语语料训练系统。接下来,将对已整理的超200亿字符的藏文资料、30000多小时的音视频资料进行训练,形成千万条高质量多模态藏语语料。同时,基于已有的翻译词库构建500万级“藏汉英对照”平行语料库。今后,将通过数据清洗、知识提取等智能处理,形成藏语核心语料及细分领域知识库,并借助格桑花藏地语料库建设藏语智能体综合平台,开发藏语知识问答、藏汉互译等智能体,为藏语研究、内容生产与传播提供支撑。
中国工程院院士尼玛扎西谈到,四川是我国重要的藏族聚居地,其涉藏地区涵盖了藏语三大方言中的康巴和安多两大方言。同时,藏地阳光全媒体中心、甘孜州传媒中心等四川主流媒体机构拥有的藏语数据具备素材多、质量好的优势。由这些主流媒体参与建设的格桑花藏地语料库,可以为语言学、计算机科学、民族学等多学科跨领域研究提供广泛的数据支撑。格桑花藏地语料库将在传承和弘扬中华传统文化,促进民族文化交流,增强国家文化软实力方面发挥重要作用。
文章来源电子科技大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年1月高含金量国际学术会议合 12-12
-
第四届金融科技与商业分析国际学术会议 686
-
2026年第十一届复合材料与材料工程 1453
-
2025年机器视觉、智能成像与模式识 2126
-
2025年智能光子学与应用技术国际学 3284
-
2026年机械工程,新能源与电气技术 3476
-
2025年计算机科学、图像分析与信号 3917
-
2025年材料化学与燃料电池技术国际 3633
-
2026年交通数字化、人工智能与韧性 12-19
-
2026年社会文化与公共管理国际会议 12-19
-
2026年人文地理与语言研究国际会议 12-19
-
2026年社会发展与经济发展国际会议 12-19
-
2026年光伏材料、光电转换与可再生 12-19
-
2026年可持续发展与数字化社会国际 12-19
-
2026年管理科学、语言与教育国际会 12-19
-
2025年两院院士增选有效候选人2672
-
2025最新JCR分区及影响因子7552
-
好学术:科研网址导航|学术头条分3540
-
2025年国际期刊预警名单发布!3510
-
2025年中科院期刊分区表重磅发13412
-
中国科协《重要学术会议目录(207866
-
吉林大学校长张希:学术会议中的提4517
-
中国科大提出电化学一体化驱动策12-19
-
中国科大实现电泵浦片上集成高亮度12-19
-
西北农林科技大学【陕西新闻联播】12-19
-
中国科大实现片上非相干泵浦高品质12-19
-
中国科大中性原子量子计算研究成果12-19
-
炔烃远端C-O键的不对称活化转化12-19
-
研究揭示叶片内生真菌分子功能多样12-19
-
科研人员提出柑橘黄龙病防控新策略12-19
-
广州比特城建筑工程咨询有限公司 23114

-
2018第二届现代教育与信息技术 22957

-
韩国高丽大学 24323

-
清华大学 8104

-
中国地质科学院地质研究所 23280

-
北京大学政治发展与政府管理研究中 23137

-
东莞新都会酒店 2054

-
APISE 21092

-
.FFGSBD 8166

-
中国高科技产业化研究会科技成果转 2099

-
IAASE 2464

-
WILL 8099

-
第九届全国结构计算理论与工程应用 2094

-
上海著林会展有限公司 23308

-
SHDIF 8029

-
无锡江南大学物联网学院 24247

-
沈阳博思教育咨询有限公司 23044

-
青海省海北州 18270

-
国际电子信息技术学会 23466

-
北京海逸星空会展服务有限公司 17993

















617









































