前言:追寻AI大世界的幻梦
以下观点均为通过个人的实践和思考引出。这会是一篇比较集中在 AI+游戏技术 的文章,旨在分享探索过程中的一些想法,并不考虑当前市场可行性,也未做过深入的商业调研。
自ChatGPT等大型语言模型惊艳问世以来,相信许多游戏开发者心中都燃起了一个共同的愿景:
能否创造一个世界,让玩家们和AI们真正化身主角,从故事的起点开始,便能随心所欲地行动,而整个世界——包括其中的人物、环境和剧情走向——都会因自由的行为而发生真实且深远的改变?
这,就是我们共同憧憬的 【AI大世界】 的终极幻梦。
作为一个在独立游戏领域创作了14年的老人,我深受这一愿景的感召。为了接近这个目标,我借助AI的力量,在AI虚拟恋人、AI文明进化游戏、AI驱动的ARPG(尝试)、关卡制AI跑团/剧本杀、AI赋能多媒体创作以及传统互动叙事等多个方向进行了大步流星的尝试。
经历了这一切探索,我对AI叙事的潜力和挑战有了更深的理解。本文将直接阐述我基于这些实践所构想出的、当前阶段我认为更可能逼近“AI大世界”愿景的 五种核心优化范式。
核心挑战与终极理想
在我们深入探讨这些范式之前,必须承认,实现那个“玩家进来就能为所欲为”的AI大世界,面临着巨大的挑战。简单的AI聊天缺乏深度世界互动;关卡制的AI剧本杀虽能提供局部高自由度,但整体剧情往往线性或分支有限,且割裂了世界的连续感;传统的固定分支叙事(如Twine)则无法动态响应玩家的无限可能。
我认为,最终的理想方案必然是:
事无巨细的自下而上进行模拟 (Bottom-up Simulation),模拟出每一个智慧生物的行动决策和由此引发的世界变化。
但这需要近乎天文数字的计算资源和无法想象的开发复杂度。目前的资源(无论是算力还是开发精力)都远远做不到这一点。
作为参考,斯坦福大学与谷歌研究人员合作发表的论文“Generative Agents: Interactive Simulacra of Human Behavior”,研究旨在通过AI生成Agent来模拟人类行为,创建了一个虚拟小镇,类似于《模拟人生》(The Sims)的环境。研究人员使用25个AI Agents进行了两天的模拟。模拟25个Agents两天需要“数千美元的tokens”,并且耗时数天完成。使用的模型甚至只是gpt3.5-turbo版本。
因此,我们需要寻找更聪明的、在现有条件下可行的“优化路径”。以下提出的范式,正是基于这一现实考量,旨在通过不同的侧重和优化策略,让我们离那个理想更近一步。
本文首发于作家之屋,在公众号【丶青萝卜】上同步发布
通往AI大世界的五种优化范式
1. 增强型AI剧本杀 - “导游式扰动”
- 核心: 在关卡制AI剧本杀基础上,大幅强化关卡/章节间的状态继承(情感、关系、关键信息等)与分支的丰富度和长远后果。
- 玩家体验: 玩家大致沿着一条主线前进,但在每个阶段拥有高度的互动自由,可以随心所欲地行动和表达。这些选择和行为会被系统细致记录,并能显著改变后续关卡的内容、NPC的反应乃至最终的结局,创造出一种“我在即兴修改剧本,世界因此不同”的深度参与感。
- 优点:
- 能在保持叙事结构的前提下,显著提升玩家的自由度和剧情的个性化程度。
- 缺点:
- 世界的连续性和开放性仍受限于“关卡式”设计。
- 长线影响的逻辑设计较为复杂,需要精心规划分支(这在Twine实践中也发现了)。
- 适用: 线性骨架强,但希望给予玩家扮演自由度和即时反馈的故事,像公路片、传统单线跑团等,如《JOJO的奇妙冒险》系列那样章节清晰又充满变数的冒险。
2. AI MUD - “周期性大思考与手动干预结合的涌现”
- 核心: NPC AI(尤其是关键角色/势力)基于周期性收集的游戏数据进行“离线大思考”,制定长远决策,并辅以开发者的审核与内容植入。
- 机制:
- 数据监测: 持续收集经济指数、资源分布、关键NPC状态、玩家行为模式等宏观与微观数据。
- AI“大思考”: 周期性(例如每周、每月)运行AI模型,为关键NPC或势力生成新的长期目标、战略调整或行为策略。
- 人工审核与内容植入: 开发团队审核AI生成的决策,剔除不合理部分,并将优质决策转化为游戏内的实际更新(如激活预设事件模块、调整NPC行为逻辑、更新对话库、甚至生成新的小型任务线)。
- 玩家体验: 感受到世界并非静止,NPC派系和世界格局会随着时间(例如每个月或季度)真实演变,仿佛生活在一个会“呼吸”和“成长”的虚拟社会中,自己的长期行为也可能间接促成这些变化。
- 优点:
- 能产生一定程度的、由NPC内在逻辑驱动的世界宏观变化,带来“世界在自己运转”的感觉。
- 开发成本相对可控,人力投入主要在审核和内容转化阶段。
- 缺点:
- 世界演变速度受限于“大思考”周期和人工干预环节,实时性不强。
- AI的自主性在一定程度上受人工审核的制约。
- 适用: 世界观庞大且不特别重单线剧情的沙盒游戏,需要长期运营、持续更新内容的游戏,如部分模拟经营、策略游戏或希望营造动态世界历史感的RPG。这个范式重在渐进地构建世界,让世界随时间慢慢“生长”。
3. Book Diff - “基于精确时间线剧本的强因果推演”
- 核心: 存在一个或多个为关键角色设定的、包含精确时间点行动的“原书”剧本(Master Script)。玩家的行为会与“原书”剧本产生差异(Diff),AI将基于此进行因果推演。
- 机制:
- 时间线推进: 游戏时间严格按照“原书”剧本设定的时间线流动。
- AI差异评估: 在关键时间节点或事件触发点,AI对比玩家的实际行为、状态以及世界的当前状况与“原书”剧本的设定,精确判断产生的差异。
- 因果推演与剧情演绎: AI根据预设的因果逻辑规则库,推演该差异对当前及后续事件的影响(例如:事件是否发生、发生形式如何改变、参与角色变化、结果如何转变等),并动态生成或调整相应的剧情叙述、NPC行为及环境变化。
- 后台世界演进: 即使玩家的行为导致主线剧情发生重大偏离,“原书”时间线和其他未受玩家直接影响的角色的剧本仍在后台按逻辑推进。这些角色可能会因主角的缺席或行为改变而调整自身行动,其事件可能因此改变或失败,这些变化会被记录并可能在未来与玩家的路径交汇,产生意想不到的后果。
- 玩家体验: 清晰地看到自己的每一个关键抉择如何像投入湖面的石子,精确地改变了“原定”故事的走向,形成独特的“蝴蝶效应”。即使偏离主线,也能感受到世界其他角落的故事依旧在按逻辑演进,最终可能与自己的道路重新交汇,体验到高度宿命感与自由意志交织的叙事。
- 优点:
- 能精准表达原剧本复杂交错的世界结构和多线叙事。
- 能精确展现“蝴蝶效应”,通过“原书”内的标签和逻辑使因果链清晰,故事逻辑严谨。
- 缺点:
- 对“原书”剧本的创作要求极高,需要精确到时间点、行动细节和严密的逻辑依赖关系。
- 玩家自由度在“原书”框架之外的探索,其趣味性和意义的保持是个挑战。
- 适用: 多线多视角叙事交织、时间点严格、多主角的复杂剧本,如《十三机兵防卫圈》那样对时间线和因果要求极致的作品,或是《冰与火之歌》这样的群像史诗。
4. AI戏剧 / AI肥皂剧 - “聚焦深度角色与关系演化”
- 核心: 将模拟重心彻底转向一小群核心AI角色的内在世界(情感、需求、目标、记忆、信念)和他们之间动态演变的关系网络。外部事件通常作为催化剂。
- 机制:
- 深度角色建模: 为每个核心AI角色(包括玩家角色在内的重要参与者)建立包含个性特质、实时情绪、核心需求、长期目标、关键记忆、价值观体系的复杂AI模型。
- 动态关系系统: 使用量化指标(如好感度、信任度、恐惧度等)和质化标签(如朋友、敌人、恋人、竞争对手等)来追踪角色间的关系,并设计关系因互动(对话、共同经历、冲突等)而动态变化的规则。
- 情境驱动互动: 剧情主要由角色基于自身当前的内在状态和彼此间的关系,在特定情境(可能由外部事件引发)下自发进行的互动(对话、合作、冲突、求助等)产生。
- AI驱动表现: AI不仅负责生成能反映角色内心状态和关系的对话内容,还可能驱动其非语言行为(如表情、姿态、小动作)。
- 玩家体验: 如同亲身参与一部互动剧集,玩家作为局内人,与其他AI角色建立真实的情感连接。他们的喜怒哀乐、爱恨情仇都因玩家及其他角色的互动而细腻地展现和变化。故事由角色间的“化学反应”在外部事件的催化下自然生成,充满未知和惊喜,让玩家沉浸在复杂而真实的人际关系网中。
- 优点:
- 能创造极其生动、富有情感深度的人物和细腻、充满变数的人际关系故事,代入感极强。
- 容易产生意想不到的“涌现式”情节。
- 缺点:
- 难以支撑宏大的世界观和复杂的外部驱动型情节,通常故事规模受限于核心角色数量和互动场景。
- 对AI的情感理解和表达能力要求非常高。
- 适用: “日常系”、“恋爱养成”、“后宫番”、“家庭/职场肥皂剧”、“群像剧”,或任何将角色塑造和人际关系发展作为核心体验的游戏,例如《老友记》,或类似“终末旅行”这样聚焦于玩家与少数核心角色深度关系演变的剧本。
5. LOD(Level of Detail)混合模拟 - “宏观抽象与微观细节的动态平衡”
- 核心: 结合自上而下(Top-down)的抽象模拟和自下而上(Bottom-up)的精细模拟。宏观世界采用抽象模型进行高效推演,而玩家所在的“焦点区域”则激活高精度的细节模拟。
- 机制:
- 宏观模拟层(远景): 负责推演远离玩家的区域、大型势力的战略动向、整体经济趋势、战争态势、资源流动等。此层面采用高度抽象的规则和模型,计算消耗低,但能反映世界大的变化趋势。
- 微观模拟圈(玩家“气泡”/近景): 当玩家进入某个特定区域,或某个宏观事件的影响范围波及玩家时,该区域将切换为高精度的自下而上模拟。这包括复杂的NPC个体行为AI(如具有多层逻辑的战斗AI、日常行为逻辑)、细致的物理交互、环境动态变化等。
- 层级间信息交互与转换: 设计高效合理的机制,使得微观“气泡”内发生的重要事件结果(如玩家完成关键任务、消灭某个小头目、区域资源枯竭)能够被抽象并上传影响宏观模拟层的状态;反之,宏观模拟层的变化(如邻国宣战、爆发瘟疫、贸易路线改变)也能“下达指令”或改变参数,具体影响到玩家所在的微观模拟圈的体验。
- 一致性维护: 通过影响传播算法、状态同步机制、信息传播的模拟延迟(例如,远方消息需要信使传递)等手段,努力维持玩家对世界整体性和各个层级间逻辑一致性的感知,减少“穿帮感”。
- 玩家体验: 既能在大地图上感知到远方势力的兴衰、战争的蔓延等宏观动态,一旦进入特定区域,又能立即体验到该区域内NPC的鲜活行为、细致的环境互动,实现“远观有势,近看有质”的沉浸感。感受到自己的行动既能影响身边小环境,也能通过层层涟漪对宏观世界产生可见的影响。
- 优点:
- 在现有技术和资源限制下,能够较好地兼顾世界的宏大感与玩家体验的即时性、细节性。
- 是目前看来构建大型、动态、开放世界AI体验的实用且可扩展的路径之一。
- 缺点:
- 系统设计和实现复杂度极高,尤其在层级间信息交互和一致性维护方面。
- 宏观与微观之间的转换、抽象与具象的拿捏非常考验设计功力,容易出现不一致或“穿帮”的情况,需要大量精心调试。
- 适用: 比较重玩家改变剧情,需要处理大规模冲突、广阔地域和复杂系统交互的题材,如“义体人起义”、“后末日废土重建”、“星际海盗战争”等。大型模拟经营游戏、开放世界RPG均可借鉴。
实践基础:过往探索的经验与教训
以上提出的五种范式并非空中楼阁,它们都源于我过去一系列AI+游戏实践的经验积累与反思:
1. AI虚拟恋人:精细行为模拟与机制结合
- 核心价值: 验证了AI在模拟细微情感反应和控制非语言行为(L2D动作表情)上的潜力。
- 技术探索: 涉及长记忆处理(自动压缩)、思维链应用、人设Prompt工程,以及通过好感度调控将AI的软交互(对话、情感)与游戏的硬机制(除了动作表情,还能任意拓展)结合。
- 启示: 单个NPC可以被模拟得非常生动,并能与游戏系统深度互动。这对“AI戏剧”范式(范式4)中深度角色的构建提供了基础。
- 相关介绍: 虚拟恋人项目介绍,本项目留下的资料不多,可以简单看看用例。
2. 文明进化游戏(《文明史诗》/《大文明》):宏大叙事涌现与人机共创
- 核心价值: 展示了AI驱动宏大叙事演进的可能性,并能有效激发玩家想象力。
- 独特机制: 弹幕互动联机;AI扮演规则裁判;文生图CG润色。
- 设计理念启示:
- “消灭上下文”/无状态Agent: 启发了信息可以被高度浓缩和标签化,AI不一定需要冗长的对话历史。
- “标签碰撞”: 证明了基于标签的系统交互可以驱动涌现式叙事,且易于开发者控制。这对“AI MUD”(范式2)和“LOD混合模拟”(范式5)中的状态管理有借鉴意义。
- 人机共创: 强调了玩家和AI共同创造故事的可能性。
- 登陆平台: itch
- 相关链接: 文明史诗 on itch
3. 毕业设计(全AI NPC ARPG):自下而上模拟的挑战与技术沉淀
- 核心价值: 一次直面自下而上模拟巨大复杂度的勇敢尝试。虽然项目未达预期目标,但其失败本身深刻验证了纯粹自下而上模拟的极端难度,同时也催生了宝贵的TobenotLLMGameplay插件。
- 插件功能(部分): 人物系统(多种交互组件、Agent接口)、场景/事件系统(位点、动态事件、网状叙事)、外围系统(存档、生图等)、强化API接口。
- 启示: 这套插件为后续的AI游戏开发(尤其是需要复杂NPC互动和动态事件系统的范式,如AI戏剧、LOD混合模拟等)提供了坚实的技术储备。更重要的是,这次尝试让我对“事无巨细的模拟”的挑战有了切肤之痛的理解,从而转向思考更具可行性的优化范式。
- 登陆平台: Steam
- 游戏演示: 网状叙事
- Github仓库: TobenotLLMGameplay
4. AI剧本杀(《不止于纸上的故事:银月篇》):受控环境下的高自由度互动
- 核心价值: 在“关卡制”框架内,成功实现了以玩家自由文本输入驱动剧情发展的核心体验。
- 机制亮点: 自由输入、AI NPC互动、基于规则的异能战斗系统、动态环境规则调整、实时AI绘画CG生成。
- 局限性反思与启发: 项目证明了AI驱动的自由输入交互的可行性与魅力。然而,其在关卡间的状态继承和长远影响方面的有限性,也凸显了对更强世界连续性的需求,这直接启发了本文提出的第一种范式(增强型AI剧本杀),并为思考“Book Diff”(范式3)等更复杂的连续性叙事奠定了基础。
- 登陆平台: itch
- 项目链接: 不止于纸上的故事 on itch
结语
以上提出的五种范式,本质上都是在承认当前技术和资源尚不足以实现完全“事无巨细的自下而上模拟”的前提下,所采取的优化路径和探索方向。它们各有侧重,各有优劣,或许真正的“AI大世界”需要将它们进行更深层次的融合与创新。
我深信,持续的实践、开放的思考以及真诚的交流,是推动我们不断接近那个梦想的关键。我也希望能有更多同行者加入这场激动人心的探索,共同塑造AI叙事的未来。
您对哪一种AI大世界范式最感到兴奋?我希望听到您的看法!或者,您是否构想过其他的可能性?欢迎一起探讨,让我们共同推动AI游戏的边界!