EMO来了!通义APP推出照片唱歌功能
【环球网科技综合报道】把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。4月25日,EMO终于上线通义APP,开放给所有用户免费使用。
打开通义APP,进入“全民舞台”频道,就可来到EMO产品页面“全民唱演”。在歌曲、热梗、表情包中任选一款模板,上传肖像照片,EMO随即就能合成视频。
通义APP首批上线了80多个EMO模板,包括热门歌曲《上春山》《野狼disco》等,网络热梗“钵钵鸡”“回手掏”等。目前通义APP暂不开放用户自定义音频,用户只能选择APP预置的音频来生成视频。
EMO是通义实验室研发的AI模型,其背后的肖像说话(Talking Head)技术是当前大热的AIGC领域。EMO之前的Talking Head技术都需针对人脸、人头或者身体部分做3D建模,通义实验室在业界率先提出了弱控制设计,无需建模就可驱动肖像开口说话,不仅降低视频生成成本,还大幅提升了视频生成质量。EMO学习并编码了人类表达情绪的能力,能将音频内容和人物的表情、嘴型匹配,还能把音频的语气特征和情绪色彩反映到人物微表情上。
2月底,通义实验室公布相关论文,EMO随之成为继SORA之后最受关注的AI模型之一。现在,通义APP让所有人都可免费体验前沿模型的创造力。未来,EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。
通义APP近期爆款频出,现象级应用“全民舞王”曾在社交平台掀起“兵马俑跳科目三”“金毛跳舞”的热潮,全民舞王背后的模型Animate Anyone也出自通义实验室。近期,通义APP还陆续推出了超长文档解析、AI编码助手、AI会议助手等免费实用功能。通义大模型正在成为越来越多用户的超级AI助手。
发布于:北京
相关推荐
EMO来了!通义APP推出照片唱歌功能
阿里整大活,一张照片就能生成视频
阿里EMO模型,一张照片就能造谣
国内大模型打假胜诉第一案:阿里云起诉山寨通义千问App一审胜诉
阿里云宣布推出通义万相AI绘画大模型
iOS 15最具人文关怀的功能「数字遗产」,来了
阿里通义千问重磅升级:免费开放1000万字长文档处理
阿里云AI大模型产品“通义听悟”开放公测,拥有音视频摘要能力
对话阿里云CTO周靖人:开源是唯一出路,通义千问和ChatGPT互有胜负
从技术观望转向具体应用,新东方、同程旅行等已接入阿里云通义大模型
网址: EMO来了!通义APP推出照片唱歌功能 http://www.xishuta.com/newsview116459.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94938
- 2人类唯一的出路:变成人工智能 19132
- 3报告:抖音海外版下载量突破1 18849
- 4移动办公如何高效?谷歌研究了 18375
- 5人类唯一的出路: 变成人工智 18234
- 62023年起,银行存取款迎来 10114
- 7网传比亚迪一员工泄露华为机密 8160
- 8顶风作案?金山WPS被指套娃 7088
- 9大数据杀熟往返套票比单程购买 7037
- 10五一来了,大数据杀熟又想来, 6755