4月6日,Meta发布了一个AI模型Segment Anything Model(SAM,分割一切模型),能够根据文本指令等方式实现图像分割,而且万物皆可识别和一键抠图。同时,Meta研发团队也在官网上发布了关于SegmentAnything的论文细节。在发布SAM的同时,Meta开源了目前最大的图像分割数据集SA-1B,为同类其他模型的研究打下了坚实的基础。
据了解,图像识别与分割是当前许多智能化场景的基础。例如智能驾驶中就需要对摄像头呈现出的图像进行分割与识别,从而让车辆做出反应。医学影像诊断中需要对病变位置进行分割来进行判断。过去,图像分割往往只能通过对预先打包的数据进行训练,并针对海量的特定场景进行调优,效率和成本均不占优。
国盛证券分析指出,此次Meta发布的SAM模型,能使得AI通过已有数据的训练,获得面对未知内容的自动识别能力。因此,可以把这个过程比作人类的视觉,人类所拥有看见新事物时自动处理并理解的能力。这将改变传统的图像识别训练模式,加快图像识别行业的发展。
另一方面,SAM模型带来的泛化识别能力与通用性能力,除了改变已有的自动驾驶,医学影像等传统图像识别领域的发展路径外,也拓宽了图像识别领域在日常生活,商业生产中的应用场景。
而相较于文字,图像的获取更加依赖如摄影器材,监控设备等硬件平台,因此在图像LLM领域,软硬结合的公司将会有更好的先发优势。通过已有的图像获取硬件搭建具有图像大语言识别功能的平台,将会是SAM模型渗透进入日常生活的路径。同时,对图像进行预处理的边缘算力重要性也将提升,通过边缘算力对产生的图像进行实时识别或预处理,将会成为SAM模型发挥作用的关键一环。
银河证券表示,数字中国等政策不断加码、AI新应用持续推新的背景下,数字经济新基建有望夯实助力算力网络升级,通信+新基建板块有望率先预期上修。ICT基石光网络产业链的复苏,催化光模块、光纤光缆、温控节能等需求进一步增长。