当前位置: 江南文明网 > 科技 > 智能 >

基础大模型是AI中的“CPU”

条评论

基础大模型是AI中的“CPU”

随着 ChatGPT 等大模型的发布,全球人工智能掀起了新一轮发展热潮,国内外大模型技术研究与产业发展日新月异,通用人工智能进入全新发展时期。

在2023智源大会上,大会除了邀请到了图灵奖得主 Geoffrey Hinton、Yann LeCun、Joseph Sifakis、麻省理工学院未来生命研究所创始人 Max Tegmark,OpenAI 首席执行官 Sam Altman 等200余位人工智能顶尖专家以国际视角共话通用人工智能发展面临的机遇与挑战外,智源研究院发布了全面开源的“悟道3.0”系列大模型及算法,报告了在高精度生命模拟和有机大分子建模方面的最新进展。

此次悟道3.0包含的项目有「悟道・天鹰」(Aquila)语言大模型系列、FlagEval (天秤)大模型语言评测体系以及「悟道・视界」视觉大模型系列。此外 FlagOpen 飞智也带来了开源大模型技术体系最新进展。

作为北京智源人工智能研究院副院长兼总工程师,林咏华谈到此次智源发布天鹰有两个重要的亮点。

第一个亮点是高效,主要体现在两方面:一方面通过大量对训练架构的优化,提升了训练的吞吐量;一方面通过大量对数据、数字的精细化处理和清洗,达到用少的数据量来训练出一样性能甚至性能更好的模型。

第二个亮点是通过这次打造迭代循环的生产线和流水线,能够对模型的质量、安全性、价值观以及所缺乏的能力很快速的进行调整和提升。这两个亮点构成了未来大模型创新发展的良好基座。林咏华还谈到,基础模型已经成为AI大模型时代,单一“产品”投入最大的部分。打造基础大模型,就是在打造AI中的“CPU”。基础模型很大程度上决定了后续模型能力、产业落地等因素

大模型评测体系搭建时最核心的要素是什么?智源研究院发布的这套评测体系跟企业会有什么样的合作,以及具体的评测流程是怎样的?国内外开源生态的差距如何?智源“悟道”和LLaMA在发展战略上相比,有哪些独特之处?带着这些问题,网易科技与林咏华进行了深入交流。