当前位置:首页 >> 学术资讯 >> 科研信息

交叉信息研究院姚期智等三位图灵奖得主领衔阐释人工智能飞速进步时代的风险管理

2024/05/24

 人工智能正在飞速进步,全球业界正大力投入生成式人工智能,让系统能够自主行动以实现目标。随着能力及自主性的提升,人工智能的威力可能突飞猛进,也带来包括危害社会、恶意滥用、超脱人类管控等种种危机。虽然学者们已发声提出警告,但他们对于该如何管控危机仍缺乏共识。

5月20日,由三位图灵奖得主约书亚·本吉奥(Yoshua Bengio、杰佛瑞·辛顿(Geoffrey Hinton)、姚期智(Andrew Yao)领衔,连同多位专家,包括经济学诺奖得主丹尼尔·卡内曼 (Daniel Kahneman) 以及清华大学教授张亚勤、薛澜等共同著作的文章“人工智能飞速进步时代的风险管理”(Managing extreme AI risks amid rapid progress)发表于美国《科学》(Science)杂志。

文章概述了一个整体的规划:从加强科技研发与主动灵活的治理机制双管齐下,并借鉴从其他苛求安全的科技中汲取到的经验,力求做出充足的准备。

文章指出,人类正在投入大量资源来使人工智能系统变得更强大,但在安全性和减轻危害方面却投入得远远不够。虽然当前人工智能系统的自主性仍然有限,但重大突破可能随时发生,将令人措手不及。为了让人工智能成为一种福祉,应该重新定向:要能预见到新兴风险的扩大,并在巨大风险发生前就做好准备,包括在技术研发与监控治理两方面。

文中提出管控人工智能安全的一些新思路及措施。首先,惯常的“无害假设”需要及时调整。对极高端新系统的风险评估,不能等到系统发布前夕,必须在研发过程中同步进行(白盒子而非黑盒子)。文章作者认为,可以借鉴医药、航天、核电、金融等领域的管控经验,为人工智能设立风险管理的最佳实践(best practice)指南。人工智能系统开发者在研发过程中,当按照管理指南定时进行自我评估,详细记录相关风险分析,并同意接受现场审核。

治理机制需要与系统风险大小相匹配。应该保护低风险应用和学术研究,无需设置过度的官僚障碍。最紧迫的审查应关注前沿人工智能系统。少数最强大的人工智能系统——在价值数十亿美元的超级计算机上训练出的——可能最具危险性且不可预测,甚至规避人类控制的能力。

文章还指出,许多监管及立法工作,需要政府连同专家们立即展开。在法规出台之前,可先要求人工智能企业做出详细承诺(if-then commitments),自行设下红线以及危机处理办法。本文通讯作者为剑桥大学博士候选人扬·布劳纳(Jan Brauner


版权声明:
文章来源清华大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025生物学、环境工程与清洁能源国际会议(ICBEECE 2025)(2025-09-05)

第七届 IEEE 能源、电力与电网国际学术会议(IEEE-ICEPG 2025)(2025-09-12)

2025环境、气候变化与生物科学国际会议(ECCBS 2025)(2025-09-13)

2025年第七届先进计算机科学,信息技术与通信国际会议(CSITC2025)(2025-09-19)

第十届机械制造技术与材料工程国际学术会议(MMTME 2025)(2025-09-19)

第九届交通工程与运输系统国际学术会议(ICTETS 2025)(2025-09-26)

第六届智能计算与人机交互国际研讨会(ICHCI 2025)(2025-09-26)

第五届机电一体化技术与航空航天工程国际学术会议(ICMTAE 2025)(2025-09-26)

2025年先进制造技术、机械工程与自动化国际会议(ICAMTMEA 2025)(2025-10-01)

2025-2026年科技计划项目申报和科技创新平台建设运行科研资金全过程管理使用高级研修班(苏州)(2025-10-22)

2025年信息控制、密码学与网络安全国际会议(ICICCC 2025)(2025-9-17)

2025年高等教育与数字图书馆国际学术会议(HEDL 2025)(2025-10-28)

2025年语言、文化交流与文化传播国际会议(LCECC 2025)(2025-10-23)

2025年综合艺术与人文发展国际会议(ICIAHD 2025)(2025-9-24)

2025年艺术教育、人文发展与文学传播国际会议(AEHDLC 2025)(2025-9-23)

2025计算机应用、电力电子与信息系统国际会议(CAPEIS 2025)(2025-10-19)

2025年能源互联网、资源与环境工程国际学术会议(ICEIREE 2025)(2025-9-26)

第七届计算与数据科学国际学术会议(CONF-CDS 2025)(2025-9-25)

第五届能源、动力与电气工程国际学术会议(EPEE 2025)(2025-9-19)

2025土木工程、生态环境与能源材料国际会议(CEEEEM 2025)(2025-10-24)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。