交叉信息研究院姚期智等三位图灵奖得主领衔阐释人工智能飞速进步时代的风险管理_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

第三届应用经济学、管理科学与社会发展国际学术会议（AEMSS 2026）

2026年交通工程与载运工具国际学术会议（TEV 2026)

第六届机械设计与仿真国际学术会议（MDS 2026)

第五届电气、控制与信息技术国际学术会议（ECITech 2026）

2026年计算机技术与可持续发展国际学术会议(CTSD 2026)

第三届电气技术与自动化工程国际学术会议（ETAE 2026）

第十一届社会科学与经济发展国际学术会议 (ICSSED 2026)

第五届光电信息与功能材料国际学术会议（OIFM 2026）

第六届人工智能与工业技术应用国际学术会议（AIITA 2026）

第二届物理学与量子计算国际学术会议（ICPQC 2026）

第五届航空航天、空气动力学与机电工程国际学术会议（AAME 2026）

2026传感器技术与信息工程国际学术会议 (STIE 2026)

第五届绿色能源与电力系统国际学术会议（ICGEPS 2026）

2026年智能信号与图像处理国际学术会议 (ISIP 2026)

第五届电子、集成电路与通信技术国际学术会议（EICCT 2026）

第三届数字图像处理与计算机应用国际学术会议（DIPCA 2026)

交叉信息研究院姚期智等三位图灵奖得主领衔阐释人工智能飞速进步时代的风险管理

2024/05/24

人工智能正在飞速进步，全球业界正大力投入生成式人工智能，让系统能够自主行动以实现目标。随着能力及自主性的提升，人工智能的威力可能突飞猛进，也带来包括危害社会、恶意滥用、超脱人类管控等种种危机。虽然学者们已发声提出警告，但他们对于该如何管控危机仍缺乏共识。

5月20日，由三位图灵奖得主约书亚·本吉奥（Yoshua Bengio）、杰佛瑞·辛顿（Geoffrey Hinton）、姚期智（Andrew Yao）领衔，连同多位专家，包括经济学诺奖得主丹尼尔·卡内曼 (Daniel Kahneman) 以及清华大学教授张亚勤、薛澜等共同著作的文章“人工智能飞速进步时代的风险管理”（Managing extreme AI risks amid rapid progress）发表于美国《科学》（Science）杂志。

文章概述了一个整体的规划：从加强科技研发与主动灵活的治理机制双管齐下，并借鉴从其他苛求安全的科技中汲取到的经验，力求做出充足的准备。

文章指出，人类正在投入大量资源来使人工智能系统变得更强大，但在安全性和减轻危害方面却投入得远远不够。虽然当前人工智能系统的自主性仍然有限，但重大突破可能随时发生，将令人措手不及。为了让人工智能成为一种福祉，应该重新定向：要能预见到新兴风险的扩大，并在巨大风险发生前就做好准备，包括在技术研发与监控治理两方面。

文中提出管控人工智能安全的一些新思路及措施。首先，惯常的“无害假设”需要及时调整。对极高端新系统的风险评估，不能等到系统发布前夕，必须在研发过程中同步进行（白盒子而非黑盒子）。文章作者认为，可以借鉴医药、航天、核电、金融等领域的管控经验，为人工智能设立风险管理的最佳实践（best practice）指南。人工智能系统开发者在研发过程中，当按照管理指南定时进行自我评估，详细记录相关风险分析，并同意接受现场审核。

治理机制需要与系统风险大小相匹配。应该保护低风险应用和学术研究，无需设置过度的官僚障碍。最紧迫的审查应关注前沿人工智能系统。少数最强大的人工智能系统——在价值数十亿美元的超级计算机上训练出的——可能最具危险性且不可预测，甚至规避人类控制的能力。

文章还指出，许多监管及立法工作，需要政府连同专家们立即展开。在法规出台之前，可先要求人工智能企业做出详细承诺（if-then commitments），自行设下红线以及危机处理办法。本文通讯作者为剑桥大学博士候选人扬·布劳纳（Jan Brauner）。

版权声明：
文章来源清华大学新闻网，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

相关学术资讯

清华大学深圳国际研究生院周倩、倪凯课题组在海洋遥感探测领域取得新进展

我国学者在戊型肝炎疫苗长期有效性研究方面取得进展

沸石分子筛催化反应机制研究取得进展

我国学者在罕见病模型与机制研究方面取得进展

清华大学深圳国际研究生院付红岩团队在大规模多任务纳米光子集成器件逆向设计上取得新进展

陆军军医大学陆军特色医学中心（大坪医院）在lncRNA编码蛋白影响血管平滑肌细胞表型转化研究方面取得进展

清华大学核研院新型能源与材料化学团队在超高感光度光刻胶研发领域取得重要进展

清华大学清华四川能源互联网研究院牵头编制的《电解水制氢系统功率波动适应性测试方法》国家标准发布