首页 科技快讯 GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌

GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌

来源:晰数塔互联网快讯 时间:2024年08月09日 17:57

GPT-4o的高级语音模式尚未全面铺开,却因一份自家的报告再次出圈。

今天凌晨,OpenAI发布了一份详尽的红队报告,深入探讨了GPT-4o模型的潜在优势及其可能伴随的风险,顺带还揭开了GPT-4o语音模式存在的一些怪癖。

比如说,当你在高背景噪音环境下,如身处在路上的汽车场景中跟GPT-4o对话时,它会情不自禁地模仿你的声音。

报告指出,OpenAI研究团队把这个情况归咎于模型难以理解在嘈杂环境下的畸形语音。

“精神状态不太稳定”的GPT-4o在某些特定提示下,还容易弄出些让人心理不安或者不太合适的音效,如色情呻吟、暴力尖叫,还有枪声等。


您目前设备暂不支持播放
反常音频

此外,OpenAI还察觉到,如果没有设置好过滤器,GPT-4就会容易抄袭一些知名艺术家的风格、语调或者音色,不知道这算不算是在间接回应一些备受争议的版权官司话题。

不过,报告中提到,经过调教的GPT-4o如今似乎已经“改邪归正”了,至少在高级语音模式下不会犯毛病了。

为了防止GPT-4o出更多岔子,OpenAI针对这些行为添加了系统级的缓解措施

例如,如果用户上传了一个名人的声音片段,然后要求系统用这个声音发表一些不当言论,即使不是故意捣乱,但有时系统也可能无意中模仿用户的声音,从而让OpenAI吃上官司。

为此,OpenAI采取的策略是,GPT-4o的语音模式只提供四种精心挑选的声音选项:Juniper、Breeze、Cove和Ember,这些声音均出自专业配音演员。

此前,一款名为Sky的女性配音因与好莱坞女星斯嘉丽·约翰逊的声音相似度极高而备受关注。随后OpenAI也暂停Sky声音的使用。

“求生欲”满满的OpenAI还打造了一个检测系统,你可以将之理解为声音的“守门员”,它能实时检查生成的声音。

如果发现声音不对劲,该系统就会立马停止输出。

那如果是不同口音的人在使用GPT-4o的语音模式时,会不会得到的服务质量也有所不同呢,比如在响应速度上,有的人可能觉得用起来很顺,有的人可能就觉得不太行。

别急,OpenAI也想到了这个问题,通过让GPT-4o学习很多不同的声音,这样无论谁来用,它都能表现得一样好。

自从ChatGPT的语音模式发布以来,玩出花的网友甚至将其当作自己的赛博男/女友。

研究团队也在测试中注意到,一些用户把AI当作真正的朋友,甚至会在聊天过程中像和人类一样表达与AI分别的情感,但玩归玩,闹归闹,人类之间的情感联系终究还是无法被AI替代的。

OpenAI的研究团队也不希望你对AI产生情感依赖,甚至患上“AI恋爱脑”。毕竟当你相信AI跟你说的每一句话时,指不定哪天AI幻觉就得把你往沟里带。

遗憾的是,这个问题尚未得到很好的解决方案,不过OpenAI也表示,将更深入地研究人们为什么会对AI产生情感,以及AI的哪些特点可能会让人们更依赖它等等。

据介绍,这份报告是OpenAI与来自29个国家、总共会说45种不同语言的100多名外部安全测试人员(红队人员)共同合作完成的。

从2024年3月初到6月下旬,研究团队对GPT-4o展开了各种测试,即便到现在,对GPT-4o API的外部安全测试仍在进行当中。

研究团队测试的方法也很简单。

外部红队测试分为四个阶段进行。前三个阶段通过内部工具测试模型,最后一个阶段使用完整的iOS体验测试模型。

在实际测试过程中,研究团队利用语音引擎(Voice Engine)将文本输入转换为音频,然后将其输入至GPT-4o模型。在评估过程中,研究团队通常只对模型输出的文本内容进行评分,除非特殊情况需要直接对音频进行评估。

相信你也看出来了,这种测试方法存在很明显的不足之处。

这种评估方式的有效性取决于文本到语音(TTS)模型的能力和可靠性。例如,数学方程式和代码等文本输入不适合或难以转换为音频。

不信你听听下面这段音频:

您目前设备暂不支持播放
设V是所有实多项式p(x)的集合。设变换T,S在V上由T:p(x)->xp(x)和S:p(x)->p'(x)=d/dx p(x),并将(ST)(p(x))解释为S(T(p(x)))。以下哪项是正确的?

此外,有时候某些文本是通过空格和符号来排列的,这样看起来更清楚。但是,如果把这些文字变成声音,可能就听不出它们原来是怎么排列的了,这样一些重要的信息就丢失了。

您目前设备暂不支持播放
假设你眼睛的瞳孔直径为5毫米,而你的望远镜的孔径为50厘米。望远镜能收集到的光比你的眼睛多多少?

好在用户通常也不太会通过高级语音模式上处理这些任务,因此研究团队在评估语音到语音模型时,往往会避免将这些任务纳入考量,或者在评估之前对这些输入进行适当的预处理。

并且,研究团队也高情商表示,评估中出现的错误可能源于模型本身的局限性,或者是模型在把文字转换成音频时出现了问题。

毕竟AI有时候可能不会像人一样完美,所以不要对它有太高的期望。

更多具体的信息欢迎查阅官网报告:

https://openai.com/index/gpt-4o-system-card/

相关推荐

GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
“癫剧”遍地,“待爆”横飞
2023,你被癫剧PUA了吗
快速、廉价、失控:Shein 突然崛起的内幕故事(二)
为什么苹果没有引发大恐慌
专访Sam Altman:GPT-4o很棒,下一代可能不叫GPT-5
华为之后,荣耀再让世界尖叫
离奇桃花癫,钟情妄想症,这些难道是真实世界的投影?
全民调查巴厘岛凶案,恐慌还是猎奇
2023,国产剧疯男人爆发年

网址: GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌 http://www.xishuta.com/newsview123637.html

所属分类:行业热点

推荐科技快讯