在负责小红书的大模型之前,张德兵曾担任过一年的小红书智能多媒体算法负责人,主要负责AI和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。
除了成立大模型团队以外,36氪了解到,小红书内部还有多个独立部门同时推进AIGC方向的落地探索。今年4月份,小红书还悄然上线了一款名为“Trik”的AI创作应用,主打AI绘画。
从页面上看,这款APP分为创作和广场两个板块,用户上传自拍和风景照片之后,后台的AI算法将自动生成艺术创意图。
作为内容公司,小红书布局AI大模型并不难理解。
在PCG和UCG的时代,大部分互联网内容公司,基于AI算法推荐进行信息分发,小红书的内容生产方式也以算法分发的UGC图文和视频为主,并依托内容衍生了以内容商业化为主、电商为第二增长曲线的营收模式。
而进入AIGC的时代,基于深度学习的大模型将极大提升内容生产的速度和数量,原有的内容生产与分发方式将被颠覆。大模型火热之后,小红书上出现大量“如何用ChatGPT生成小红书文案”的帖子。一位行业人士向36氪表达了担忧,“ChatGPT在C端的一个常见应用是做攻略,普及之后谁还用小红书种草?”
小红书自然不想错过AIGC时代的变革。
在小红书技术团队此前发布的一篇访谈文章中,小红书商业部技术基础NLP建设负责人秋哥就提到,ChatGPT写软文的能力很强,“风险得先预防起来”,需要探索“怎么让ChatGPT+小红书=小红书plus”。
当然,小红书也有涉足大模型的驱动力。小红书的社区内容生态当中的内容量多样且丰富,包括上亿级别的图片内容、笔记、用户评论、短视频。而这也为自然语言处理、AI辅助内容生成提供了多模态的数据基础和应用场景。
在公开访谈中,小红书大模型负责人张德兵也提到,文本、视觉、语音、音乐,任何两种模态的迁移和转换是当下重要的研究方向,比如:电商场景下的智能客服、搜索场景下对用户笔记更精确的理解、在智能创作场景下对用户素材的智能配乐/文案生成/跨模态的转换和生成创作等等。
“小红书承载了不同模态的内容,这些模态如果可以让创作模态大幅度下降,让用户记录和表达自己的生活的时候,能够根底成本、更加快捷,这是一个很有意思的方向。