昨日凌晨,OpenAI用一场低调而华丽的“GPT-4”发布会震撼了世界,低调的是“公关声量”,华丽的则是技术与应用。在这场发布会上,人们惊讶的发现,人工智能不仅能自由的编写代码,能承担文本、音频、图像的生成任务,甚至还听得懂“梗”,拥有人类般的幽默感。
无数人震撼失语,看完这场发布会,推想科技CEO陈宽称“人工智能领域的奇点在敲门”,著名经济学家朱嘉明表示,OpenAI又创造出了一个重大科技事件,AI由此达到了前所未有的“新历史高度”。
但实际上,OpenAI GPT-4的应用能力比它在发布会上展现的还要强大。
就在3月14日,GPT-4发布会前不久,OpenAI低调的更新了官网的“客户故事”一栏,披露了9个已经用上GPT-4的“大客户”,详细的介绍了这些客户是如何使用GPT-4的,以及GPT-4为他们带来了什么。
这些客户横贯金融、助残、语言、教育、视频、咨询等多个领域,包含摩根士丹利、多邻国、可汗学院等知名企业和组织,无一例外,这些客户均表示,“GPT-4为产业带来了革命性的机遇”。
1.当AI赋能公益
Be My Eyes是一家来自丹麦的科技初创企业,致力于为超过2.5亿位盲人或弱视人群创造“视觉”技术。过去,他们试图用“产品识别技术”、“语音导航技术”来帮助这些视力障碍人士,帮助他们完成数百项日常生活任务,但效果并不理想。
一个案例是网站阅读,现在,大多数网页都内嵌了屏幕语音阅读器,但对盲人来说,通过语音播放技术来浏览网页是痛苦的。比如购物网站,网页中往往存在着大量无关紧要的广告,而普通的语音播放技术只能逐字读取,这会浪费大量的时间。此外,图片无法被语音读取,这也是个大问题。
而采用GPT-4则完全不同,Be My Eyes的首席技术官Jesper Hvirring Henriksen表示,GPT-4可以通过无数小时的训练以及深度学习算法来理解网页中的“重要”部分——哪一部分应该被阅读或总结,GPT-4能够以视力正常的人自然扫描逻辑总结搜索结果,并对那些无关紧要的细节予以略过。
Henriksen认为,这不仅可以简化在线阅读新闻等任务,还可以让那些需要视觉辅助的人得以访问网络上最混乱的页面,哪怕页面上充斥着“垃圾弹窗”和广告。
网络世界外,GPT-4还能帮助视力障碍人群穿越“物理世界”。比如借助GPT-4的新视觉输入功能,Be My Eyes开始在Be My Eyes应用程序中开发“虚拟志愿”,该应用程序可以生成与人类志愿者相同水平的上下文和理解,从而帮助视力障碍人群轻松的识别现实世界中的种种物品。
Be My Eyes的首席执行官Michael Buckley表示:“在短时间内,我们就已经看到了GPT-4从视觉识别到语音播报的强大能力”,“这会对全球的视力障碍人群带来深远影响,会让他们在生活中更大程度的独立。”
2.摩根士丹利:用AI来管理金融知识
目前,摩根士丹利已经通过GPT-4来组织其庞大的金融知识库.
摩根士丹利是全球领先的财富管理者、金融操盘手,它拥有一个拥有数十万页的知识内容库,涵盖投资策略、市场研究以及分析师见解等多个领域。海量的知识信息分布其内部网站上,大部分是PDF格式,搜集并学习这些知识需要耗费大量的时间。
而凭借GPT-4,摩根士丹利管理知识的方法出现质变。
从去年开始,该公司开始探索如何利用GPT的嵌入和检索功能(最初是GPT-3,现在是GPT-4)来高效的利用其知识库系统。摩根士丹利分析、数据与创新部门主管Jeff McMillan表示,该模型将为一个面向内部的聊天机器人提供信息阅读与输出能力,该机器人可以对知识库进行全面搜索,并“有效地解锁摩根士丹利关于财富管理的相关知识”,GPT-4的最终能将所有“库存知识”转化为一种“更加可用和可操作的格式”。
McMillan表示,利用好这些知识库的内容,并将之有组织、有机的进行输出,“你将拥有金融领域最博学的人的所有知识,而且随用随取。”
他说,“你可以把它想象成让我们的首席投资策略师、首席全球经济学家、全球股票策略师和全球其他所有分析师,这些聪明的‘分析师’每天随时待命,随时解答你的困惑,这对我们公司来说是一种变革性的能力。”