有点料·上手|豆包新技能体验:在 AI 文生图上加几个字
文 |动点科技作者|Steven Lee
排版|恩惠本文预计阅读时长4分钟
字节跳动旗下 AI 助手豆包近日升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求。
豆包大模型团队相关负责人表示,豆包文生图模型通过打通 LLM 和 DIT 构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。
图上加点字
简单来讲,这个新能力可以让你在 AI 生成的图片上加入指定文字。目前该功能已经在豆包 App 开启测试,豆包网页及电脑版也将在近期上线该能力。
注:以下测试使用 iOS 版豆包 App。
我们尝试让豆包生成市中心商务区大楼照片,大楼上方有“动点科技”四个大字。一次性给出的四张图片基本都符合预期。
第二次尝试让它生成手持显示“动点科技”四个字的手机图片,结果中有一张的手指多了一只,且手部比例失调;另一张的右手有两个拇指……
第三次尝试我们不按常规套路来,要求文字:
帮我生成一张图,学校操场运动会,人满为患,主席台大屏幕上有“动点出海”四个大字,图片比例 16:9
晃眼一看,操场部分(包括人)挺像一张照片,但大屏幕上除了要求的大字外,还出现了 AI 想象的不明字体,且其中一张图背景墙上多出一个“点”字。
另外,这四张图并没有按比例要求生成。
总结
以往用 AI 生成图片只能作为案例参考或者以玩一玩的心态试试,如今 AI 生图可以在其中加入指定文字,这着实是一项值得肯定的功能提升。不过豆包的新技能还是欠些火候,我们在尝试中遇到了“不认识的汉字”以及部分违反常识的图片要素。
上面测试的图片形式,比较适合笔者的职业内容——比如有时需要给文章配图,用 AI 生成公司名称相关的展示图,再合适不过。
顺带一提,如果你对 AI 图片功能感兴趣,豆包此前上线了图片理解能力,可识别图片中包含的元素和基本特征。用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。在试一试之前可以看看我们的体验文章。
发布于:上海
相关推荐
有点料·上手|豆包 App 试用:几近全能的 AI 助理
有点料·上手|讯飞星火 App 体验:优缺并存的 AI 创作伴侣
有点料·上手|可灵 AI App 试用:另请高明
字节跳动开始测试首款对话式APP AI对话产品“豆包”上线
独家|河马爱学并入豆包,字节打造AI产品全家桶
豆包支持带有指定文字的图片生成,App已开启测试
科氪 | 3999元起售,一加7Pro上手体验。
字节跳动发布豆包大模型,主力模型比行业价格低99.3%
三星S24体验:AI,真好用!
大厂做AI,卷到哪儿了?
网址: 有点料·上手|豆包新技能体验:在 AI 文生图上加几个字 http://www.xishuta.com/newsview130012.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94941
- 2人类唯一的出路:变成人工智能 19160
- 3报告:抖音海外版下载量突破1 18878
- 4移动办公如何高效?谷歌研究了 18405
- 5人类唯一的出路: 变成人工智 18262
- 62023年起,银行存取款迎来 10117
- 7网传比亚迪一员工泄露华为机密 8165
- 8顶风作案?金山WPS被指套娃 7090
- 9大数据杀熟往返套票比单程购买 7039
- 10五一来了,大数据杀熟又想来, 6783