首页 科技快讯 GPT-4o语音模式首批用户体验来了,电影《her》终于成真

GPT-4o语音模式首批用户体验来了,电影《her》终于成真

来源:晰数塔互联网快讯 时间:2024年07月31日 15:50

在屡次“放鸽子”之后,OpenAI今天终于向部分Plus用户正式推送了GPT-4o高级语音模式(Advanced Voice Mode)的Alpha测试版。

不知道你是不是被选中的幸运儿?

GPT-4o高级语音模式不仅允许用户随时打断对话,而且系统还能感知并回应用户的情绪波动,仿佛电影《her》走入现实。

只不过,别急着欢呼,OpenAI还藏了一手,此前备受关注的视频和屏幕共享功能将在晚些时候推出。

也就是说,目前推送的功能尚属“阉割版”。这也是继GPT-5、Sora、SearchGPT之后,OpenAI再次埋坑。不得不说,没有人比OpenAI更懂“埋坑”。

OpenAI官方明确表示,参与此次Alpha测试的用户将会收到一封包含使用指南的电子邮件,同时手机APP也将推送相关通知消息,大概如下图所示,快去检查一下你有没有收到。

ChatGPT的计划是逐步扩大测试用户数量,预计在今年秋季,所有Plus会员都将能体验到这项功能。

不少海外网友已经拿到了GPT-4o高级语音模式的测试资格,让我们一起来看看他们是怎么玩出花的。

GPT-4o能成为你的口语外教吗?

在看完五月份OpenAI的春季发布会之后,许多人开始担忧语言类外教甚至翻译都要失业了。

为此,X网友一拿到测试资格,就立刻让GPT-4o给他当法语陪练。结果显而易见,主打情绪价值的GPT-4o与法语底子不错的网友上演了一场教科书式的课堂教学。

您目前设备暂不支持播放

听听GPT-4o的语音,你可能会惊讶地发现,它甚至可能比你的人类老师还要耐心细致。

不过,网友的评价却是褒贬不一,GPT-4o的法语发音让母语为法语的听众点头称赞,但也有人觉得它跟五月份的演示效果相比,差那么一丢丢意思。

要给GPT-4o上强度的网友也一口气测试了三种不同语言的切换。法语、西班牙语、乌尔都语,GPT-4o切换流畅自如,拿捏到位。

有没有熟悉乌尔都语的朋友们,GPT-4o发音的准确度如何,欢迎在评论区分享你的见解。

您目前设备暂不支持播放

至于中文的效果,就别提了,让GPT-4o讲故事,听起来有些机械感,有感情,但不多,给人感觉就像是以前老收音机传出的声音。

您目前设备暂不支持播放

古有仓颉造字,今有GPT-4o凭空“造”语言,网友让它用一种不存在的语言说话,然后解释这种语言是如何工作的,没啥大毛病,就是对耳朵有些不太友好。

您目前设备暂不支持播放

让GPT-4o讲个笑话、讲故事、来段绕口令

应网友@sirbughunter的提议,网友@yoimnotkesku给GPT-4o讲了一个精心准备的笑话,测试其对笑话的理解和反应。

网友:我能给你讲个笑话不?

GPT-4o:当然了!我超想听的,你的笑话是啥?

网友:为什么科学家们不相信亚当?

GPT-4o:为什么?

网友:因为他构成了一切。

GPT-4o:哈哈哈哈哈哈,确实,亚当真的“构成”了一切。

笑点:这里的“make up”既可以指“构成”,也可以指“编造(谎言)”。

您目前设备暂不支持播放

网友的评价也是两极分化,有的表示很真实,喜欢AI听完笑话的声音,甚至要爱上它了,也有的表示很糟糕。

但接下来的评论就图穷匕见了,这算盘响到我在中国都听见了。

接着应网友@sirbughunter的要求,不妨也反过来让GPT-4o讲个惊悚的故事。

您目前设备暂不支持播放

没想到,GPT-4o模拟出暴雨天的恐怖音效让网友大呼意外,仿佛真的置身于一个惊悚的环境,照这表现,估计又得干翻不少说书人的饭碗了。

普通人念段绕口令免不了舌头打结,但让它来段绕口令也没啥强度。

您目前设备暂不支持播放

B-BOX也不在话下,但怎么到后面有点喘不过气了呢?

您目前设备暂不支持播放

邀请长眼睛的GPT-4o看看我们的世界

有极少数“神通广大”的网友甚至抢先内测到了实时的视频理解功能。

例如,网友@ManuVision养了一只可爱的小猫,他利用视频模式向GPT-4o介绍了小猫的日常生活,GPT-4o也没少给予情绪上的正反馈。

您目前设备暂不支持播放

体验过后,他在X平台上赞叹道:“这感觉就像是在和一位知识渊博的朋友面对面交流”。

接着,他也分享了新的高级语音模式+视觉功能进行实时日语翻译。

‍‍‍您目前设备暂不支持播放

‍在看完上面这些测试视频后,AI在表达情感方面似乎比人类还要丰富细腻,这真不怪会有人喜欢上AI伴侣了。

目前,GPT-4o的语音模式只提供四种精心挑选的声音选项:Juniper、Breeze、Cove和Ember,这些声音均出自专业配音演员。

此前,一款名为Sky的女性配音因与好莱坞女星斯嘉丽·约翰逊的声音相似度极高而备受关注。随后OpenAI也暂停Sky声音的使用。

OpenAI还宣布,他们已经开发并部署了新的过滤器,用以识别并拒绝生成任何可能侵犯版权的音乐或其他音频内容。

自今年以来,OpenAI的产品发布节奏堪称稀碎。包括今天发布的GPT-4o高级语音模式更是反复“跳票”,才来到我们眼前。

不少观点质疑,OpenAI本身是一家没有产品基因的公司,所以才导致不少产品“难产”,但关键是,几乎没有人会质疑OpenAI的技术基因。

这就好比,吐槽归吐槽,但极少有人会质疑Sora不会发布,只是时间早晚的事情。

OpenAI的底气就在于,先前ChatGPT的成功除了印证一条业界以往罕有人迹的路线,也让不少“爱屋及乌”的人对于OpenAI的“埋坑”有了更高的期待和宽容度。

相比之下,另一个喜欢“画饼”的Google就没有这么好的舆论境遇了。

虽然擅长营销的OpenAI埋的坑多,却也总能在关键时刻填上一两个,就像是挂在毛驴前的萝卜,时不时给点甜头。今天的GPT-4o高级语音模式也是一个典型的例子。

只不过,功能是推送了,但却只是一个阉割版,我们甚至都分不清他是在憋大招,还是在加班加点解决Bug。当然,如果OpenAI的弹药库充足的话,作为用户,还是期待OpenAI能早日推出GPT-5。

相关推荐

GPT-4o语音模式首批用户体验来了,电影《her》终于成真
免费版GPT-4o来了,视频语音交互丝滑到吓人
“类人速度”新模型来了?OpenAI发布新款AI模型GPT-4o,响应时间接近人类水平,AI进入《她》时代?
从《Her》到「玩秘」,语音助理的“智能时代”何时到来?
多模态GPT-4o来了,最先嗨起来的是一波女性用户
GPT-4o 现货变期货,是什么在拖OpenAI 的后腿
OpenAI GPT-4o和谷歌Astra谁更强?前者音频更逼真,后者视觉更先进
OpenAI发布GPT-4o,“秀肌肉”给谁看?
GPT-4o是什么?是你想要的一切
ChatGPT更像人了

网址: GPT-4o语音模式首批用户体验来了,电影《her》终于成真 http://www.xishuta.com/newsview123158.html

所属分类:行业热点

推荐科技快讯