当前位置: 江南文明网 > 科技 > 智能 >

OpenAI等推出AI语音翻译

条评论

OpenAI等推出AI语音翻译

1、ChatGPT将推出语音和图像输入功能

2、OpenAI发布视觉模型GPT-4V及其系统卡论文

3、Spotify合作OpenAI推出AI语音翻译功能

4、Getty合作英伟达推出生成式AI工具

5、微软招聘核技术经理 或用核电供能AI数据中心

6、百度发布首个量子领域大模型及两大AI原生应用

7、合合信息等发布业内首个古彝文基础编码数据库

8、抖音上线地方方言AI自动翻译功能

9、中美多家机构联合发布大模型可解释性技术综述

10、潞晨与澜舟将合作打造企业级LLM解决方案

11、中国电信在深圳成立含AI软件业务数智公司

12、梅安森计划推出第一代矿山安全模型

13、耐能宣布完成9700万美元B轮融资

14、AI医疗公司惠每科技宣布完成超3亿元D轮融资

15、诺和诺德合作Valo 基于AI寻求CMD新疗法

16、诺基亚将在迪拜设实验室推动AI技术应用

17、木头姐:在AI方面有比英伟达更好的赌注

18、英国政府:AI对多边体系构成了“严峻考验”

1、ChatGPT将推出语音和图像输入功能

当地时间25日,OpenAI于官网宣布将在ChatGPT中推出新的语音和图像功能,允许用户进行语音对话、上传图像。该系列功能将在两周内于Plus和企业版推出,其中,语音功能将在iOS和安卓平台提供,图像功能将在所有平台提供。据介绍,新的语音功能由新的文本转语音模型提供支持,能够仅从文本和几秒的样本语音中生成类似人类的音频,OpenAI与专业配音演员合作创作了每一个声音,并使用开源语音识别系统Whisper将用户的口语转录为文本。图像理解由多模态GPT-3.5和GPT-4提供支持,这些模型将其语言推理技能应用于各种图像,例如照片、屏幕截图以及包含文本和图像的文档。