首页 科技快讯 科大讯飞正式发布星火V3.5和星火语音大模型,多模态理解达到GPT-4V 91%

科大讯飞正式发布星火V3.5和星火语音大模型,多模态理解达到GPT-4V 91%

来源:晰数塔互联网快讯 时间:2024年02月02日 02:31

“讯飞星火有信心在上半年赶上GPT-4目前最好水平。”

作者:杨雪

编辑:tuya

出品:财经涂鸦(ID:caijingtuya)

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会,科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。

据介绍,星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

讯飞星火自去年5月首发以来,不断迭代升级其大模型能力。截至目前,基于讯飞听见、讯飞星火APP、讯飞输入法等应用已累计赋能亿万用户。在星火大模型的帮助下,越来越多的用户拥有专业AI助手。据统计,在讯飞开放平台上,大模型总开发者已超35万,其中企业开发者超22万。

同时,科大讯飞正式发布了星火语音大模型。“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们的目标和梦想一天都没有变。”刘庆峰指出,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”

星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷,增强式翻译技术让翻译机化身AI翻译助手。据介绍,此次讯飞翻译机多语自动识别升级,将支持35种语言,为跨语言沟通提质增效;增强式翻译提供中英双语服务,让跨语言交流更加省心出彩。

在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互领域的变革。举例来说,星火语音大模型将进一步优化智能驾舱、智能座舱、智能导航等汽车交互体验,陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。

展望2024年讯飞星火大模型的发展,刘庆峰指出:“一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。

刘庆峰强调,“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”

共享源代码、开发出更好的软件,是广大开发者、高校、企业自主研发热衷于开源的关键原因,也是共建第一开发者生态的重要途径。会上,首个基于全国产化算力平台”飞星一号”的开源大模型──星火开源-13B正式发布。

发布于:上海

相关推荐

左手算力、右手星火,科大讯飞加速大模型落地应用
首个全民开放大模型!科大讯飞星火V3.5发布:能力接近GPT-4
科大讯飞星火V3.5来了:华为参与 全国产化算力训练
一年内四次迭代,讯飞星火大模型衔枚疾进
点燃国产大模型的“星火”!为什么是科大讯飞?
讯飞星火开源-13B 大模型发布,针对国产软硬件环境深度优化
加码自主可控星火认知大模型研发!科大讯飞Q2现金流净额超1亿元
科大讯飞官宣:讯飞星火认知大模型 V2.0 将在 8 月 15 日发布
讯飞星火V3.0发布:从多轮对话到主动问答再到启发式问答
科大讯飞再振翅,讯飞星火认知大模型发布会5月6日正式召开

网址: 科大讯飞正式发布星火V3.5和星火语音大模型,多模态理解达到GPT-4V 91% http://www.xishuta.com/newsview107304.html

所属分类:行业热点

推荐科技快讯