“最近一个月,你见过盲人吗?”12月12日,由深度学习技术及应用国家工程实验室主办的WAVE SUMMIT+2021深度学习开发者峰会上,东北大学大四学生高鸿志向在场观众抛出一个问题。
中国14亿人口中有1700万视障人士,占总人口比例达1.2%,但在大街上却很少看到他们的身影。“变色”和被阻碍的盲道,成了他们出行的障碍,而全国经过训练的导盲犬只有200多只,每只导盲犬训练需3-5年,与需求相比,杯水车薪。
“我们用不到半个月的时间训练出一只机器导盲犬。”利用飞桨深度学习开源开放平台和社区,高鸿志和他的团队让一只机器导盲犬实现了基于视觉的盲道导航、常见障碍物检测、红绿灯识别引导过马路等功能,而未来,通过AI训练,除了引导避障,机器导盲犬还可以为主人提供更温暖、更安全的语音陪伴,很多现有导盲犬无法做到的事情,都将通过它变成现实。
机器导盲犬学习中
年轻的高鸿志是一名飞桨开发者技术专家(ppDE),406万飞桨开发者之一。作为我国首个自主研发的产业级深度学习平台,截至目前,飞桨已经创建了47.6万个模型,服务于15.7万企事业单位,在中国深度学习平台综合市场份额第一。
“人工智能呈现出‘融合创新’和‘降低门槛’的特点。”百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰认为,一方面,AI技术及产业的融合创新越来越多;另一方面,虽然AI技术越来越复杂,但AI开发与应用的门槛却越来越低。
这意味着,深度学习正推动人工智能进入工业大生产阶段。
峰会上,飞桨发布包括飞桨新版全景图—产业级模型库新增文心大模型、业界首个产业实践范例库、飞桨“大航海”2.0共创计划等在内的十大最新技术和生态进展。
01 一个人也可以完成的AI项目
25岁的李桑郁,是襄阳铁路段的一名铁路工人,通过自学飞桨开发套件,他开发出一套“铁路货车车身字符及标识自动检测系统”,实现了铁路货运车号的自动识别。整个项目,仅凭他一己之力。以前需要人工核对几个小时的工作,如今只需要3分钟就能完成,为襄阳车辆段节省了20多万元成本。
在飞桨平台上,和高鸿志、李桑郁一样的开发者有406万。飞桨是国内首个开源开放、功能完备的产业级深度学习平台,它将大量基础的、需要重复的代码固化为模型,利用预先构建和优化好的组件集合定义模型,深度学习研究者不需要深入了解底层算法,便可以自主快速实现从建设数据集、到模型训练、再到模型部署的整套流程,从而大大降低人工智能的使用门槛。
峰会现场,百度AI产品研发部总监忻舟现场演示了一只机器狗的5分钟。飞桨全新发布的智能边缘控制台,仅仅需要5分钟,便让一只机器狗学会了识别手势的新技能。对于高鸿志而言,一款更人性化的机器导盲犬“出街”的时间,又可以缩短了。
值得一提的是,通过多层次、低成本的硬件适配方案,大大降低了框架与芯片的适配成本。以寒武纪MLU适配为例,飞桨方案相比原方案,代码行数减少69.4%,修改的代码文件减少62.3%,人力投入成本降低60%。截至目前,飞桨和22家国内外硬件厂商完成了31款芯片的适配和联合优化工作。
02 AI进入工业化大生产期
2019年4月第一届WAVE SUMMIT+2021峰会上,王海峰曾将深度学习框架定义为“智能时代的操作系统”,它下接芯片,上承应用,尤其在大生产阶段,能够将AI技术以标准化、自动化和模块化的方式输出给各行各业,实现规模化应用;同时以平台为基础促进融合创新、共同发展,凝聚各方,通过赋能广大开发者,有力支撑AI工业大生产,促进技术创新和产业智能化升级。
飞桨开源于2016年。当年8月31日,全球开源社区GitHub上出现了第一个paddlepaddle文件——paddlepaddle v0.8.0beta.0,第二天举行的百度世界大会上,百度宣布飞桨正式对外开放。
经过五年的发展,飞桨持续突破了核心框架的创新。全新发布的开源框架v2.2,新增大量科学计算ApI,高效支持超大模型训练的端到端自适应大规模分布式训练技术;全流程加速文本任务,解决文本领域开发在性能和训推一体方面的痛点问题,在飞桨产业级模型库里,新增的知识增强文心大模型,可以让大模型真正进入产业应用。
峰会现场,国家电网上海电力公司调度中心副主任肖飞讲述了国家电网对于“人工智能”的渴望。基于双碳的目标,风能和太阳能等可再生能源在电网中的占比正在逐步提升,但对整个电网的系统管理提出了非常大的挑战,尤其是因自然条件变化产生的不确定性,可能会对整个电网产生灾难性影响。这就需要利用深度学习、监督学习、非监督等模型,对可再生能源的消纳、负荷等资源的配比精准预测。
肖飞介绍,通过百度飞桨平台,国家电网的新能源预测准确性提高了85%,智能安排从分钟级提高到了秒级,为整个电网运行奠定了非常好的基础。
百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜指出,近年来,全国各城市的AI开发者规模逐年增长,应用人工智能的企业数量,呈现出多地开花、多行业繁荣的景象。从推荐等通用场景,到客服系统智能派单等行业衍生场景,再到发电预测等行业关键场景……类似这样技术与产业的融合创新案例在飞桨平台上越来越多,也越来越专业。截至目前,飞桨服务了15.7万企事业单位,有力促进了产业智能化升级。
03 培育复合型AI人才
对于人工智能产业而言,人才是永远不过时的话题。随着AI与产业的深度融合,需要越来越多既懂AI,又具备产业经验的复合型AI人才。
“大学不要用昨天的知识教今天的学生,让他们去面对明天的需求。”上海大学计算机工程与科学学院院长谢少荣一直在思考,如何将产业界最新研发的产品及时纳入到人才的专业培养中。在他看来,对于本科生,在低年级需要做的是系统知识的培养,但到了高年级,有一定共性的专业基础后,便可以和百度这样的互联网公司合作,将先进的算法模型和开源平台引入高校,提升人才培养的联动效应。
类似的思考,存在于国内大多数院校中,对于新一代AI人才的培养,不同高校都在探索。
西安交通大学是国内知名的工科高等院校,早在十年前,便开始探索“菁英班”模式,和科技与产业前沿的龙头企业合作,由校企双方共同制定培养方案,共建课程体系,企业的导师参与学校的理论课程教学,指导学生的项目设计、科创计划,目前合作的企业包括百度、华为、中兴、360等。
通过采用多学科交叉、本硕博贯通的选拔方式,西安交通大学选择一些学有余力的好学生,成立“菁英班”后进行小班制教学,并且将学生原学习的专业和“菁英班”的前沿方向有机地融合起来进行培养。截至目前,全校已经建立了23个“菁英班”。从结果来看,参加“菁英班”学习的应届毕业生普遍认为自身的创新意识、工程设计与开发实践能力都得到了极大的提升。
互联网公司对于这样的复合型AI人才,也是无比渴望。一直以来,飞桨致力于复合型AI人才培养,与多家知名院校达成了多项人才培养计划。自2018年开始举办“全国人工智能师资培训班”以来,百度飞桨已累计培养了2900多位高校教师,覆盖690多所高校。2021年推出《AI人才产教融合培养方案》,从内容、专项合作、服务层面,为AI人才培养提供了可供参考的产学研实践方案。