AI游戏设计师问世,自学成才,无需任何先前知识
在当今数字化时代,创意产业正经历着一场由生成式人工智能(AI)引发的变革。从文本、图像到音频、视频,AI正以前所未有的速度和规模生成各种内容,为创意工作者提供了全新的工具和思路。
然而,将这些技术无缝融入创意实践并非易事,尤其是在游戏开发这一复杂且富有创意的领域。
游戏开发不仅需要生成新颖的内容,更需要在保持游戏世界一致性、多样性和用户修改持续性方面达到高度平衡。
近日,一篇发表在Nature上的研究论文World and Human Action Models towards Gameplay Ideation揭示了如何利用生成式AI模型推动游戏玩法创意的生成。
论文链接:
https://www.nature.com/articles/s41586-025-08600-3
论文报道了一个由微软研究院领导的研究团队,开发的可协助电子游戏设计师迭代设计游戏的生成式AI模型——世界与人类行动模型(World and Human Action Model,WHAM),其生成的鲁棒3D世界能遵循设计用于电子游戏的机制。
他们认为,考虑到由于WHAM无需任何先前知识,仅通过玩游戏的训练就能学会生成序列,这个工具或能轻松转换用于生成来自其他电子游戏的关卡,为游戏开发行业带来新的可能。
视频|WHAM生成的一致性、多样性和持久性的实例以及WHAM演示器的功能。
AI还可以做好游戏创意开发?
电子游戏在娱乐产业中占最大份额,全球有数十亿人玩和购买电子游戏。然而,游戏开发是一个涉及多学科、多技能的复杂过程,从概念设计、角色建模到关卡设计、游戏机制编程,每一个环节都需要创意人员投入大量的时间和精力。传统的游戏开发流程往往受限于人力和时间成本,难以快速迭代和生成多样化的游戏内容。
生成式AI为解决这一问题提供了可能。通过训练AI模型学习大量的游戏数据,理论上可以生成新的游戏玩法序列、关卡设计甚至角色行为,从而辅助创意人员更高效地进行游戏开发。
然而,现有的生成式AI模型在游戏开发领域的应用仍面临诸多挑战,如生成内容的一致性、多样性以及对用户修改的持续性支持不足等。
因此,在这项工作中,研究团队旨在开发一种能够更好地支持游戏开发创意实践的生成式AI模型。
为了深入了解游戏开发创意人员的实际需求,研究团队邀请了来自不同游戏工作室创意团队的27名电子游戏设计师,开展了半结构化访谈,这些电子游戏设计师涵盖了游戏开发的多个领域,包括工程、设计和艺术等。
在访谈过程中,研究团队使用了一种名为“设计探针”的工具,通过模拟一个虚构但具体的游戏开发场景,激发参与者对生成式AI在游戏创意中的潜在应用的思考。
参与者们积极分享了他们对AI辅助游戏创意的看法和期望,认为当前用于打造电子游戏的AI方案缺乏生成许多不同创意(发散性思维)的能力,并强调在保持游戏世界一致性的同时,实现多样化创意的重要性,以及通过设计过程来持续微调游戏各方面(迭代实践)的重要性。
具体来说,参与者们认为,生成式AI应该能够帮助他们在游戏开发过程中实现以下几个目标:
提供多样化的内容:AI模型应该能够生成多种不同的游戏玩法序列和关卡设计,以激发创意人员的灵感;
保持一致性:生成的内容应该与游戏的整体风格和机制保持一致,避免出现与游戏世界不协调的元素;
支持迭代实践:创意人员希望能够通过直接修改生成的内容来进行迭代,而不是仅仅依赖于文本提示;
持续性:用户对生成内容的修改应该能够持续地保留,而不是在后续生成过程中消失。
基于用户需求调研的结果,研究团队开发了WHAM。
图|WHAM模型(来源:论文)
WHAM模型使用了3D多玩家战斗模拟器《嗜血边缘》中大量的人类玩家玩法数据,包括游戏视觉画面和控制器动作。采用Transformer架构作为其序列预测的骨干网络,并使用VQGAN图像编码器将图像编码为离散的token序列,通过对真实人类游戏玩法数据的训练,WHAM能够准确预测游戏环境的3D结构、控制器动作的效果以及游戏的时空结构。
为游戏开发提供一种全新工具
研究团队发现,WHAM能够设计出符合《嗜血边缘》预存在机制的复杂3D电子游戏序列,其关卡设计也具有明显的多样性,且创意人员可对输出进行迭代调整。他们还开发了WHAM示范器,作为供用户操作和自定义WHAM输出的一个可视化界面。
为了评估WHAM的性能,他们还提出了一套针对生成式AI模型的评估方法,重点关注模型在一致性、多样性和持续性这三个关键能力上的表现。
在一致性评估方面,他们使用Fréchet Video Distance(FVD)指标来衡量生成的游戏玩法与真实游戏玩法在视觉和时空动态上的一致性。通过将WHAM生成的游戏画面与真实玩家的游戏画面进行对比,发现随着模型规模的增大和计算资源的增加,FVD分数逐渐降低,表明模型生成的内容与真实游戏数据的一致性不断提高。
在多样性评估方面,他们采用Wasserstein距离来衡量模型生成的动作分布与真实玩家动作分布之间的差异。结果表明,WHAM能够生成与真实玩家行为相似的动作序列,且在训练过程中,Wasserstein距离逐渐减小,说明模型在保持一致性的同时,能够生成多样化的游戏玩法。
图|WHAM模型的多样性评估
在持续性评估方面,研究人员通过手动编辑游戏图像,插入不同的游戏元素(如道具、角色和地图元素),并让WHAM在这些编辑后的图像条件下生成新的游戏画面,来评估模型对用户修改的持续性支持。实验结果显示,当模型基于更多的编辑后的图像进行生成时,插入的元素在生成画面中持续存在的比例显著提高,表明WHAM能够较好地将用户的修改融入到生成的游戏内容中。
总体而言,研究团队通过深入的用户需求调研和严谨的模型开发与评估,成功开发出了一种能够支持游戏开发创意实践的生成式AI模型。该模型在一致性、多样性和持续性这三个关键能力上表现出色,能够生成与真实游戏玩法高度一致且多样化的游戏内容,并有效地支持用户对生成内容的修改和迭代。
研究团队指出,WHAM的出现为游戏开发行业提供了一种全新的工具,能够生成多样化、一致性强的游戏内容,激发创意人员的灵感,有望在未来的游戏中创造出更加丰富、创新的游戏体验。同时,该研究也为生成式AI在其他创意领域的应用提供了有益的借鉴和启示,推动了AI技术与人类创意的深度融合。
虽然WHAM在游戏开发领域的应用已经取得了显著的成果,但也存在着一些局限性和挑战。例如,收集和处理大量真实人类游戏玩法数据是一项复杂且耗时的任务,需要投入大量的时间和资源;而且,训练和优化生成式AI模型需要大量的计算资源和专业知识,对研究团队的技术能力也提出了较高的要求。
不过,研究团队也指出,随着AI技术的不断发展,WHAM的模型架构和训练方法也可以进一步改进,不仅能够低成本高效率地以生成更加复杂、智能的游戏内容,还可以探索如何将WHAM与其他游戏开发工具和流程更好地集成,以提高整个游戏开发流程的效率和创意性。
我们有理由相信,在不久的将来,AI将在游戏开发乃至整个创意产业中发挥更加重要的作用。
相关推荐
AI游戏设计师问世,自学成才,无需任何先前知识
苹果无需设计师
AI 征服国际象棋:以前模仿人类,现在自学成才
看完 50000 张专辑封面后,AI 设计师疯狂输出
宇宙也在「自学成才」:过程类似机器学习算法,刷新物理定律
Suno的冲击:AI音乐来了
AI不是替代设计师,而是赋能设计师
AI正在成为半导体设计师
游戏版ChatGPT,要用AI实现NPC自由
飞机工厂如何寻求创新?AI设计师正在扛起重任
网址: AI游戏设计师问世,自学成才,无需任何先前知识 http://www.xishuta.com/zhidaoview31147.html
推荐专业知识

- 136氪首发 | 瞄准企业“流 3926
- 2失联37天的私募大佬现身,但 3217
- 3是时候看到全球新商业版图了! 2808
- 436氪首发 | 「微脉」获1 2759
- 5流浪地球是大刘在电力系统上班 2706
- 6招商知识:商业市场前期调研及 2690
- 7Grab真开始做财富管理了 2609
- 8中国离硬科幻电影时代还有多远 2328
- 9创投周报 Vol.24 | 2183
- 10微医集团近日完成新一轮股权质 2180