清华大学李国良带领团队在众包数据管理系统方面取得进展
2024/04/26
![]() |
图 众包数据管理系统研究示意图
现有数据管理系统很难处理复杂推理任务(例如实体识别、实体匹配等),众包数据管理系统通过人机协作的方式,充分利用人的认知与推理能力以及机器的复杂计算能力来处理复杂任务。然而众包数据管理面临异质众包群体难度量、众包数据处理难控制、复杂计算任务难优化等挑战性难题。因此亟需研究众包计算的度量模型、可控理论、优化机制,建立众包数据库的基础理论和关键技术,研制通用的众包数据库管理系统,对我国数据管理领域的发展具有深远意义。
在国家自然科学基金重点项目(批准号:61632016)的资助下,清华大学李国良带领团队在众包数据管理系统方面取得研究进展,突破了质量感知的众包群体度量模型、基于迭代决策的代价控制方法、资源受限情况下延迟优化技术,提出了基于图迭代的众包数据库查询优化模型和细粒度优化技术,在此基础上研制了一套众包数据库管理系统。该系统比现有的众包数据库系统CrowdDB(伯克利大学)、Qurk(MIT大学)、Deco(斯坦福大学)节省了5.2倍的众包计算代价。该系统应用于好未来、腾讯、国家电网等公司,用于解决复杂数据(例如教育数据、广告数据、出行数据)的融合和推理任务,产生了10多亿元的经济效益,获得了国家科技进步二等奖(2018年)、江苏省科技进步一等奖(2019年)、国家电网科技进步一等奖(2021年)(图)。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年两院院士增选有效候选人116
-
2025最新JCR分区及影响因子2461
-
好学术:科研网址导航|学术头条分641
-
2025年国际期刊预警名单发布!770
-
2025年中科院期刊分区表重磅发4295
-
中国科协《重要学术会议目录(202964
-
吉林大学校长张希:学术会议中的提1619
-
2025年国自然正式放榜!08-27
-
SCI论文中的数据引用,如何避免08-15
-
EI核心期刊和普通期刊有什么本质08-15
-
国内期刊EI与核心有什么区别?三08-15
-
怎么查找前几年的EI期刊源?科研08-15
-
如何准确验证论文是否被SCI收录08-15
-
机械类EI期刊投稿全攻略:从实验08-15
-
SCI论文DOI号查找全攻略:学08-15
-
中国地质科学院 20907
-
广东南方软实力研究院 23049
-
中国医科大学 18029
-
赛特数码有限公司 17959
-
深圳市富士康 18103
-
中南大学铁道学院 2162
-
国际工学技术出版协会 24076
-
天津市科学技术信息研究所 18077
-
西南科技大学 17991
-
贵阳原野旅游有限公司 18074
-
JC 23377
-
西北工业大学 23158
-
《广西社会科学》杂志 23253
-
上海新华投资发展有限公司 18159
-
哈尔滨工业大学 23036
-
中汇(广州)国际会展有限公司 8162
-
jieda 21161
-
山东诚城园区运营管理有限公司 8127
-
AME2017组委会 2079
-
科严文化 2000