Meta开发出文本生成图像模型CM3Leon,号称业界最佳
IT之家 7 月 16 日消息,Meta 公司宣布开发出一款名为 CM3Leon 的人工智能模型,该模型可以根据文本生成高质量的图像,也可以为图像生成文本描述,甚至可以根据文本指令编辑图像。
IT之家注:CM3Leon 生成结果(上)对比 DALL-E 2 生成结果(下)
Meta 公司称,这款模型在文本到图像生成方面达到了业界最高水平,超过了谷歌、微软等公司的产品。CM3Leon 是一种基于 Transformer 的模型,Transformer 是一种利用注意力机制来处理输入数据的神经网络结构。相比于其他基于扩散(diffusion)的模型,Transformer 模型更加高效,训练速度更快,计算成本更低。
Meta 公司展示了 CM3Leon 在不同任务上的优异表现,包括根据复杂的文本提示生成图像,根据文本指令编辑图像,以及生成图像描述和回答。Meta 公司表示,CM3Leon 是图像生成和理解领域的一大进步,但也承认该模型可能存在数据偏见的问题,并呼吁行业加强透明度和监管。
Meta 公司使用了数百万张来自 Shutterstock 的授权图片来训练 CM3Leon,最强大的版本有 70 亿个参数,比 OpenAI 的 DALL-E 2 模型多两倍。
Meta 公司没有透露是否会公开发布 CM3Leon 模型。
发布于:山东
相关推荐
Meta开发出文本生成图像模型CM3Leon,号称业界最佳
Meta发布“类人”人工智能模型,能根据对世界的理解填补图像缺失
Meta发布“类人”人工智能模型I-JEPA,能根据对世界的理解填补图像缺失
英伟达发布最强图像生成器StyleGAN2,生成图像逼真到吓人
过去五年里,AI 图像生成技术走了多远?
Meta宣布测试生成式AI广告工具
AI写小说、绘画、剪视频,生成式AI更火了
Meta首款AI推理芯片2025年推出,还有视频处理AI芯片MSVP
刚刚,他炮轰GPT活不过5年,反手抛出“世界模型”
钛媒体科股早知道:将半导体与OLED技术相结合,MicroOLED面板成为Meta XR设备的最佳选择
网址: Meta开发出文本生成图像模型CM3Leon,号称业界最佳 http://www.xishuta.com/newsview83138.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94959
- 2人类唯一的出路:变成人工智能 19308
- 3报告:抖音海外版下载量突破1 19025
- 4移动办公如何高效?谷歌研究了 18546
- 5人类唯一的出路: 变成人工智 18409
- 62023年起,银行存取款迎来 10133
- 7网传比亚迪一员工泄露华为机密 8190
- 8顶风作案?金山WPS被指套娃 7103
- 9大数据杀熟往返套票比单程购买 7048
- 10五一来了,大数据杀熟又想来, 6922