当前位置: 江南文明网 > 科技 > 智能 >

CMU博士让智能体在真实世界竞技!

条评论

CMU博士让智能体在真实世界竞技!

NLP技术的发展,使得创建一个在数字世界中的智能代理成为了当下人们关注的热点。此时,来自华人主导的团队推出了WebArena,能够测试智能代理在网络环境中执行任务的实践效果,那么具体我们应该怎么做呢?

长期以来,我们一直有着在人工智能的发展下创建自主的智能代理的愿景。

人们希望这些代理能够与环境进行智能的交互,并实现人类为其设定的目标。

现有的强化学习(RL)框架在模拟的游戏或封闭的领域中取得了巨大的成功,但对于现实中复杂的物理环境却束手无策。

而今的自然语言处理技术(NLP),为人类和大模型在数字世界中的智能交互提供了独特的可扩展环境和学习优势。

例如,WebShop 是一个包含数百万种产品的购物网站环境,代理需要在其中阅读网页、键入查询和单击按钮,才能像人类一样购物。

这样的数字任务挑战了智能的一般方面:包括视觉理解、阅读理解和决策,并允许扩展到其他程序中使用更多的功能(GPT-4提供的插件程序)。

诸如此类「数字世界中的智能代理」,为人工智能的落地应用设想了一个看起来还不错的前景。

而就在7月26日,一个以华人为主团队在X(原推特)上推出了测试智能代理在网络环境中执行任务的实践效果的Web环境:WebArena。

WebArena是什么?

WebArena是一个独立的、自托管的 Web 环境。

开发者从电子商务、社交论坛、协作软件开发和内容管理这四类现实中的创建了独立的网站,在功能和数据上模仿真实世界的内容。

WebArena还将工具和知识资源嵌入为独立的网站,以此让智能代理有模拟人类解决问题的能力。

用户可以对智能代理进行自然语言指令的基准测试,实现与Web的具体交互。