以控制“超级智能”人工智能

为了在“超级智能对齐”（Superintelligence Alignment）领域取得进展，OpenAI正在创建新的超级对齐团队，由苏斯克维尔和莱克共同领导，该团队将有权使用OpenAI高达20%的算力资源。这个团队将与OpenAI之前的对齐部门科学家和工程师以及公司其他机构的研究人员一起，致力于在未来四年解决控制超智能人工智能的核心技术挑战。

那么，我们如何确保比人类聪明得多的人工智能系统遵循人类的意图? 这需要苏斯克维尔和莱克所描述的“人类级别的自动对齐研究员”帮助。高级目标是使用人类反馈来训练人工智能系统，训练人工智能协助评估其他人工智能系统，并最终构建可以进行对齐研究的人工智能。这里的“对齐研究”指的是确保人工智能系统达到预期的结果，或者不会偏离研究轨道。

OpenAI的假设是，人工智能可以比人类更快、更好地进行对齐研究。

“随着我们在这方面取得进展，我们的人工智能系统可以接管越来越多的对齐工作，并最终构思、实施、研究和开发比我们现在更好的对齐技术，”莱克和他的同事约翰·舒尔曼（John Schulman）、杰弗里·吴（Jeffrey Wu）在之前的一篇博客文章中假设。“它们将与人类共同努力，以确保它们自己的继任者与人类始终保持一致。人类研究人员将越来越多地把精力集中在审查人工智能系统完成的对齐研究上，而不是自己进行这类研究。”

当然，没有任何方法是万无一失的，莱克、舒尔曼以及杰弗里·吴在他们的文章中承认，OpenAI的方法存在许多局限性。他们说，使用人工智能进行评估有可能扩大人工智能中的不一致、偏见或漏洞。结果可能是，对齐问题中最困难的部分可能根本与工程无关。

但苏斯克维尔和莱克认为值得一试。他们写道：“从根本上说，超级智能对齐是一个机器学习问题，我们认为优秀的机器学习专家（即使他们还没有开始研究对齐）对解决这个问题也至关重要。我们计划广泛分享这一努力的成果，并将促进非OpenAI模型的一致性和安全性视为我们工作的重要组成部分

以控制“超级智能”人工智能

以控制“超级智能”人工智能

图片新闻

热门

推荐