首页科技快讯科大讯飞正式发布星火V3.5和星火语音大模型，多模态理解达到GPT-4V 91%

科大讯飞正式发布星火V3.5和星火语音大模型，多模态理解达到GPT-4V 91%

来源：晰数塔互联网快讯时间：2024年02月02日 02:31

“讯飞星火有信心在上半年赶上GPT-4目前最好水平。”

作者：杨雪

编辑：tuya

出品：财经涂鸦（ID：caijingtuya）

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会，科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。

据介绍，星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo，代码达到GPT-4 Turbo 96%，多模态理解达到GPT-4V 91%。

讯飞星火自去年5月首发以来，不断迭代升级其大模型能力。截至目前，基于讯飞听见、讯飞星火APP、讯飞输入法等应用已累计赋能亿万用户。在星火大模型的帮助下，越来越多的用户拥有专业AI助手。据统计，在讯飞开放平台上，大模型总开发者已超35万，其中企业开发者超22万。

同时，科大讯飞正式发布了星火语音大模型。“科大讯飞从创业之初的梦想和使命，就是要实现沟通无障碍。25年了，我们的目标和梦想一天都没有变。”刘庆峰指出，让机器具备学习、推理和决策的能力，就是认知大模型要干的主要工作。“简单来说，借助大模型，我们让一段语音具备更加丰富的属性，有语种、有内容、有韵律、有音色，还有情绪。”

星火语音大模型效果国际领先，中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3，而在多语种语音合成方面，星火语音大模型的首批40个语种拟人度超83%。

搭载语音大模型的讯飞翻译机，即将上线多语种自动识别和增强式翻译两个重要功能，分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷，增强式翻译技术让翻译机化身AI翻译助手。据介绍，此次讯飞翻译机多语自动识别升级，将支持35种语言，为跨语言沟通提质增效；增强式翻译提供中英双语服务，让跨语言交流更加省心出彩。

在汽车、客服、家庭、陪伴机器人等场景中，星火语音大模型还有更多用武之地，带来人机交互领域的变革。举例来说，星火语音大模型将进一步优化智能驾舱、智能座舱、智能导航等汽车交互体验，陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。

展望2024年讯飞星火大模型的发展，刘庆峰指出：“一定要在通用大模型的底层能力上持续对标国际最先进水平，从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距，当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距，讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。

刘庆峰强调，“今天的通用大模型并不一定代表人工智能的全部未来，还有很多创新要做，如脑科学互动、对抗网络的深度连接等需要整个创新的生态，但我们一定要有勇气、有期许走在最前列。”

共享源代码、开发出更好的软件，是广大开发者、高校、企业自主研发热衷于开源的关键原因，也是共建第一开发者生态的重要途径。会上，首个基于全国产化算力平台”飞星一号”的开源大模型──星火开源-13B正式发布。

发布于：上海