1. 核心愿景 (Core Vision)
《HumAInity》是一款 AI 原生的文明模拟游戏。
在后启示录的地球废土之上,玩家并非全知全能的神,也非孤胆英雄,而是一座幸存者聚落的**“领袖” (First Citizen)**。
-
历史跨度:从铁器余烬到信息时代 (From Iron Age to Information Age) 游戏起点设定在类似公元前 200 年(铁器时代成熟期)的废土状态。玩家需要带领智能体,重新走过人类文明的漫长历程——从农耕定居、工业革命,最终重返现代信息社会。这是一场跨越两千年的文明重燃之旅。
-
世界形态:PCG 生成的全域动态地球 (PCG-Generated Living Earth) 这不是一张静态地图。我们利用 PCG (程序化内容生成) 技术构建了一个 1:1 的超大尺度地球。
-
全域同服: 所有玩家身处同一个物理世界。你在尼罗河畔发展农业时,另一位玩家可能正在黄河建立城邦。
-
实时演化: 世界会根据文明的行为发生永久性改变。大规模的砍伐会导致沙漠化,修建大坝会改变下游生态。玩家不再是地图的过客,而是地貌的塑造者。
-
-
核心体验:沟通驱动的领袖模拟 (Communication-Driven Leadership) 我们将策略游戏的重心从单纯的“资源管理”转移到**“人与高智能 AI 的深度互动”**。
-
沟通驱动: 你不再是点击菜单的管理员,而是通过自然语言召开会议、制定愿景。
-
身先士卒: 你需要亲自带领智能体小队探索未知废土、开拓新据点、并在危机中指挥战斗。
-
组织演化: 随着文明壮大,你需要从智能体中选拔核心团队,构建并不断迭代聚落的组织架构,甚至尝试从部落制向共和制等不同政体演变。
-
1.1 为什么是现在? (Why Now?)
-
技术基石的成熟:
-
生产力的解放: 生成式 AI 在 3D 资产产出、动态代码编写层面的巨大助力,使得小团队构建一个细节丰富、物理逻辑自洽的宏大动态世界成为可能。
-
智能体的觉醒: 现在的 AI 智能体已具备长期记忆与复杂推理能力,它们不再是充当背景板的 NPC,而是有能力作为核心体验的提供者与参与者,与玩家共同推动历史。
-
-
交互深度的质变: 玩家不再满足于按键交互,而是渴望像现实中的管理者一样,通过自然语言来驱动复杂的社会分工。现在的技术终于能让这种“动口不动手”的体验变得精准且富有游戏性。
2. 核心体验切片 (Core Experience Slices)
切片 A:内政与愿景 —— “寻找水源”
场景: 废土初期,干旱导致食物短缺。你并没有具体的“水利工程图纸”。
-
【传统的任务体验】 任务面板显示“建造水井 (0/1)”。玩家跑图点击采集,机械重复十次攒齐木材,打开 UI 菜单点击“建造”,建筑凭空出现。NPC 只是背景板。 (玩家困惑:这和传统的 4X/SLG 有什么区别?)
-
【HumAInity 的愿景体验】
-
愿景 (Vision): 在周会上,面对焦虑的族人,你没有下达死命令,而是描绘未来:“我们得把河水引到田里,哪怕旱季来了,大家也不用饿肚子。”
-
自主提案 (Autonomous Proposal): 短暂的沉默后,激进的工头王五站了出来。出于对你的极度信任,他提出了一个大胆的想法:“领袖!我记得西边山脚有些特殊的蕨类植物,底下可能有暗河!我们赌一把?”
-
协同研讨 (Collaborative Refinement): 你没有只是点头,而是拉住他深聊:“好主意。但别乱挖。带上那个懂草药的老李,先找‘水脉植物’最密集的地方下铲。” (系统反馈:你的指导提升了计划成功率)
-
执行与涌现 (Execute & Emerge): 王五带着人充满信心地出发了。因为有了具体的方法论,他们不仅挖出了水,还意外发现了一种耐旱的食用菌类。
真正的领袖,是指出方向,然后与众人一起寻找出路的人。
-
切片 B:外出与危机 —— “围猎行动”
场景: 你带领一支 5 人小队外出探索,遭遇了一头狂暴的变异铁皮野猪。
-
【传统的战斗体验】 玩家框选所有单位,右键点击野猪。单位自动围上去平 A,玩家狂按技能快捷键,关注血条变化。 (玩家感觉:操作反馈平淡,视听体验甚至不如传统的 RTS 游戏。)
-
【HumAInity 的指挥体验】
-
战前部署 (Deployment): 你没有战斗技能,只能躲在后方。你低声下令:“保持距离,王五去吸引注意,其他人设陷阱!”
-
性格涌现 (Personality Emergence):
-
勇敢的王五 敲击盾牌冲了上去。
-
胆小的老六 手在发抖,陷阱布置得慢了一拍。
-
-
突发危机 (The Crisis): 野猪突然狂暴,冲破了防线,直奔还没布置好陷阱的老六。老六吓呆了。
-
临场咆哮 (Live Command): 你无法亲自上去肉搏,只能通过语音大喊:“老六!别发呆!往树上爬!王五,攻击它的眼睛!”
-
信任的回响 (Echo of Trust): 听到你的吼声,老六出于对领袖本能的服从,克服了恐惧爬上了树。王五精准地刺瞎了野猪。危机解除。
真正的力量,不是你手中的剑,而是你声音中的信念。
-
3. 核心循环 (Core Gameplay Loop)
我们构建了**“愿景-边界-研讨-执行-演化”**的五阶闭环:
阶段一:愿景提案 (Propose Vision)
-
机制: 玩家通过自然语言在特定场合提出宏观目标。
-
体验: 还原现实管理者的体验——定战略,而非定细节。
阶段二:边界划定 (Define Boundaries)
-
机制: Logos 理性引擎 介入处理,屏蔽全知指令,将模糊愿景转化为 “可行性选项列表”。
-
体验: 玩家感受到游戏世界的真实阻力与逻辑自洽。
阶段三:协同研讨 (Collaborative Refinement)
-
机制: 智能体提出自己的行动意向后,玩家可以再次介入,通过对话进行**“微调”或“指导”**。
-
体验: 通过沟通提升任务成功率,获得“共创”的成就感。
阶段四:自主执行 (Autonomous Execution)
-
机制: 个体 AI 带着玩家的建议去执行任务,过程中可能因为性格或突发事件产生涌现性结果。
-
体验: 观察与收获的乐趣。
阶段五:演化与启示 (Evolution & Inspiration)
-
机制: Mythos 叙事导演 评估前四个阶段的结果。
-
沉淀特质: 将成功经验沉淀为 [文明特质](如:连续开垦成功 → [农耕文明])。这会反向同化所有智能体的性格,使他们更倾向于种植与定居。
-
灵感植入: Mythos 根据当前状态(如“有水了但没容器”),通过环境线索或智能体之口,向玩家抛出新的需求(“领袖,水漏得到处都是,我们是不是该烧点陶罐?”)。
-
-
体验: 解决目标迷失。 玩家不需要绞尽脑汁想“下一步做什么”,而是被世界的需求自然推动,产生新的愿景,无缝重启循环。
4. 关键系统呈现 (Key Systems)
4.1 功能不对称设计 (Functional Asymmetry)
这是确立玩家“领袖”身份的设计基石。
-
设定: 玩家保留“管理者”定位,而非“打工人”。
-
限制: 玩家只有基础物理交互能力(移动/跳跃/拾取/简单攻击),无法进行复杂的精细生产活动(如烹饪、锻造、精密建造)。
-
目的: 在物理机制层面构建玩家对 AI 的刚性依赖。迫使玩家必须通过沟通、组织与指挥来驱动 AI 完成文明建设,彻底规避“玩家亲自下场当保姆”的皮囊陷阱。
4.2 双子中枢系统 (The Gemini Core System)
为了解决“逻辑自洽”与“动态节奏”的矛盾,我们设计了双AI架构,它们是游戏体验的幕后推手:
-
理性引擎:Logos (逻各斯) —— [下行链路]
-
定义: 每个玩家专属的动态逻辑阀门,随文明时代实时进化。
-
职能 A - 知识屏蔽 (Knowledge Shielding): 防止 AI 因为 LLM 的百科全书属性而“穿越”。确保石器时代的 AI 对“内燃机”毫无反应,维护沉浸感。
-
职能 B - 愿景锚定 (Vision Anchoring): 解决“指令太模糊”的问题。自动扫描环境资源,为玩家的宏观愿景填充物理细节。
-
职能 C - 选项生成 (Option Generation): 不强制 AI 执行单一动作,而是划定一个“逻辑上可行的圆”,提供多种方案,将最终选择权交给智能体的主观能动性。
-
-
叙事导演:Mythos (米索斯) —— [上行链路]
-
定义: 文明的潜意识缪斯与隐形导演。
-
职能 A - 灵感植入 (Inspiration Injection): 解决“目标迷失”。当玩家迷茫时,Mythos 会选中特定智能体,植入“发现鱼群”或“尝试种植”的灵感,让他们主动向玩家提案。
-
职能 B - 动态张力 (Dynamic Tension): 解决“垃圾时间”。当发展过于平淡时,制造社会议题或外部压力(如干旱),倒逼技术变革。
-
职能 C - 文明性格编织 (Ethos Weaving): 将玩家的长远决策沉淀为**[文明特质]**(如:尚武、农耕、理性)。这些特质会反向同化所有智能体的性格,让文明真正活出独特的灵魂。
-
5. 技术方案:核心逻辑与表现增强 (Core Logic & Experience Enhancers)
我们将技术模块划分为“核心支柱”与“体验增强”两部分,前者是游戏成立的基础,后者是沉浸感的升华。
5.1 [核心支柱] 宏观大脑:双子中枢 (The Cloud Brain)
-
技术栈: 高参数量云端 LLM + Agentic Workflow。
-
应用场景:
-
Logos: 处理复杂语义解析,执行时代锁与能力锁校验。
-
Mythos: 实时编写剧本,调节游戏节奏张力。
-
-
核心价值: 如果没有它,游戏将退化为普通的沙盒建造,缺乏目标感与历史厚度。
5.2 [核心支柱] 微观个体:智能体驱动 (The Agent Drive)
-
技术栈: 端侧 SLM (小语言模型) + 感知-思考-行动循环。
-
运转逻辑:
-
感知: 多模态模型识别玩家的意图与动作。
-
决策: 结合 [性格]、[信任] 和 [Logos 选项] 进行加权推理。
-
-
核心价值: 如果没有它,NPC 将变回只会巡逻的木偶,玩家将失去“管理”的乐趣。
5.3 [核心支柱] 记忆与关系引擎 (Memory & Relation Engine)
-
技术栈: 向量数据库 (Vector DB) + 图数据库 (Graph DB)。
-
运转逻辑:
-
记忆检索: 存储并检索关键情感时刻(而非流水账),让 AI “记得”玩家的恩惠或背叛。
-
社会图谱: 实时计算数百个智能体之间的动态关系网(派系、家族、仇恨链)。
-
-
核心价值: 它是“社会涌现”的基石。没有它,每一次交互都是一次性的,无法形成长期的社会后果。
5.4 [核心支柱] 动态世界引擎 (Dynamic World Engine)
-
技术栈: PCG (Procedural Content Generation) + 生态仿真模型 (Eco-Simulation)。
-
运转逻辑:
-
超大生成: 利用 PCG 技术生成 1:1 真实比例的地球地貌,包含动态的气候与水文系统。
-
实时改变: 记录文明行为对环境的物理影响。过度砍伐导致水土流失(Logos 物理规则生效),过度捕猎导致物种迁徙。环境的变化反过来成为 Mythos 制造危机的来源。
-
-
核心价值: 提供文明演进的物理载体和资源约束,实现“文明重塑地球”的宏大体验。
5.5 [体验增强] 动态交互:环境与动作生成 (Generative Interaction)
-
技术栈: Motion Synthesis (动作合成) + Runtime 3D Generation。
-
应用场景:
-
生成式动作: 实时生成 AI 复杂的挖掘、搬运、互动动作,适配无限的地形。
-
生成式资产: 实时生成符合当前工艺水平的器具(如陶罐、工具)。
-
-
核心价值: 极大提升沉浸感与视觉多样性,让“文明演进”在视觉上清晰可见。但从玩法逻辑上,可以用预制资源暂时替代。
6. 研发规划与里程碑 (R&D Roadmap & Milestones)
为了规避技术与设计风险,我们将采取 “MVP 验证 → 垂直切片 → 单机闭环 → 联机共存 → 全域同服” 的 5 步稳健迭代战略。
6.1 里程碑 I:最小可玩 Demo (MVP: The Tribe Pulse)
-
预期时间: 3 个月
-
核心目标: 验证“自运转村落”与“沟通”。证明多个智能体可以组成一个社会雏形,并能理解玩家的自然语言愿景。
-
产出内容:
-
场景: 预制的小型山谷村落(非 PCG)。
-
角色: 1 名玩家 + 10-20 名拥有独立性格的智能体。
-
系统: 基础版 Logos(处理采集/建造指令),初步的社会关系网。
-
体验: 玩家通过沟通解决村落的生存问题(如食物分配、住所分配),观察智能体之间的闲聊与自发社交。
-
-
技术验证: 端侧 SLM 在多人场景下的性能表现、多模态意图识别准确率。
6.2 里程碑 II:垂直切片 (Vertical Slice: 200 BC)
-
预期时间: + 3 个月
-
核心目标: 验证“文明模拟”的深度与涌现性。在一个固定的时代(公元前 200 年)内,展示游戏的所有核心系统。
-
产出内容:
-
时代: 锁定在铁器时代成熟期。
-
规模: 聚落扩充至 30+ 智能体,出现社会分工与层级。
-
系统: 完整的双子中枢(Logos + Mythos)、记忆与关系引擎上线。
-
体验: 玩家面临更复杂的社会问题(派系冲突、资源分配),需要通过会议和制度来管理。
-
-
技术验证: 几十个智能体同时运行时的记忆检索效率、Mythos 叙事生成的连贯性。
6.3 里程碑 III:单机演化版 (Single-Player Evolution / Steam EA)
-
预期时间: + 6 个月
-
核心目标: 验证“文明演进”的时间跨度。投放到 Steam Early Access 获取核心玩家反馈。
-
产出内容:
-
演进: 开放 1-2 个时代的跨度(如:铁器 → 蒸汽前夜),玩家能感受到科技与社会形态的质变。
-
世界: 基于 PCG 生成的区域性大地图(单一大陆),包含动态天气与生态。
-
模式: 纯单机体验,侧重于玩家与自己部落的深度羁绊。
-
-
技术验证: PCG 地形生成的稳定性、长时间游玩下的 Save/Load 数据一致性。
--- 训练营目标分割线 (Bootcamp Goal Line: 1 Year) --- 在此节点,我们将完成核心玩法的闭环验证与单机产品的 Early Access 发布,达成训练营的结项要求。后续里程碑为长线开发规划。
6.4 里程碑 IV:联机共存版 (Multiplayer Co-Existence)
-
预期时间: + 12 个月
-
核心目标: 验证“多文明博弈”的社交乐趣。
-
产出内容:
-
模式: 基于房间的联机模式(Room-based),支持 4-8 名玩家在同一张 PCG 大地图上游玩。
-
交互: 玩家之间可以进行贸易、结盟或战争。
-
系统: 引入多文明 Logos 参数碰撞(不同文化圈的科技树差异)。
-
-
技术验证: 多人网络同步架构、不同玩家 Logos/Mythos 逻辑的冲突仲裁机制。
6.5 里程碑 V:终极形态 (The Living Earth)
-
预期时间: 长期愿景 + 1 - 2 年
-
核心目标: 实现“全域同服,真实地球”的宏大社会实验。
-
产出内容:
-
世界: 1:1 真实地球,所有玩家处于同一服务器。
-
历史: 完整的、不可回档的地球编年史。
-
技术:
-
端云混合: 落实“算力下放”策略,实现低成本运营。
-
Global Dynamic PCG: 实现全球地貌的动态生成与演变(如气候变迁、海平面上升)。
-
-
7. 商业化愿景:智能即服务 (Intelligence-as-a-Service)
不同于传统数值付费(Pay-to-Win),《HumAInity》建立在 “为体验付费” 的逻辑之上。
7.1 基础门槛:买断制 (Buy-to-Play)
-
核心逻辑: 覆盖研发成本、客户端开发及端侧 SLM 授权费用。
-
权益: 包含完整的游戏内容、单人/多人模式权限,以及足以支撑正常游戏进程的基础云端算力配额。
7.2 模因扩展包:文明模拟参数集 (Memetic Expansion Packs)
-
核心逻辑: 我们不出售数值强弱,而是出售**“文明的灵魂”**。玩家可以购买基于真实历史或架空设定的完整模拟参数集,在废土上重演“古希腊”或“大汉”的辉煌。
-
包含内容 (Simulation Assets):
-
英雄智能体 (Hero Agents): 预训练的高精度智能体,拥有历史人物的性格模型与记忆。
- 例: [苏格拉底](擅长启发式对话,提升科研速度)、[韩信](性格隐忍但战术天才)。
-
定制化双核参数 (Customized Core):
-
Logos 规则: 特殊的社会架构(如“元老院” vs “三公九卿”)与特色科技树。
-
Mythos 风格: 叙事调性调整(如“希腊悲剧风” vs “王朝史诗风”)。
-
-
文明特质 (Ethos Seeds): 预设的文明初始性格(如 [礼乐]、[思辨]、[尚武])。
-
美学资产 (Aesthetics): 配套的建筑风格、服饰与器物模型生成规则。
-
7.3 长期成本战略:端云混合架构 (Long-term Strategy: Hybrid AI)
-
核心挑战: 如何解决 AI 原生游戏随玩家时长增加而线性增长的“Token 成本”问题(Success Tax)。
-
解决方案: 算力下放 (Offloading Compute)。
-
随着 NPU 硬件与端侧大模型(On-device LLM)技术的成熟,我们将逐步把 Logos 的逻辑校验和 Mythos 的基础叙事生成下放到玩家本地设备运行。
-
终极目标: 实现 “零边际成本” 的运营模式。云端仅负责全球同服的数据同步与复杂的大型事件生成,日常的高频交互完全消耗玩家本地算力,确保游戏像传统单机一样,一次买断,永久游玩,无需持续为算力付费。
-
8. 招募计划:AI 原生 5 人特种部队 (The 5-Man Squad)
采用 “1 策划 + 2 程序 + 2 美术” 的精简配置。在 GenAI 的加持下,每个人都不再是流水线上的螺丝钉,而是统领 AI 生产力的**“指挥官”**。
8.1 策划 ( Game Designer)
-
角色: cooperzheng
-
定位: 项目的“灵魂”
-
职能:
-
系统设计: 确立核心循环,撰写 Logos(逻辑锁)与 Mythos(导演机)的底层规则书。
-
AI 调优 (Prompt Engineering): 亲自调试核心智能体的 System Prompt,确立文明的性格与叙事调性。
-
灰盒原型: 利用 AI 辅助编程工具(如 Cursor)快速验证玩法原型,为程序提供明确需求。
-
8.2 AI 核心工程师 (AI Core Engineer)
-
角色: 构建“大脑” (The Brain)
-
职能:
-
双核架构: 负责双子中枢的云端/本地架构,处理 LLM 的 Agentic Workflow。
-
记忆工程: 搭建向量数据库 (Vector DB) 和 RAG 系统,确保智能体拥有长期、连贯的记忆。
-
模型微调: 负责对开源模型进行 Fine-tuning,使其适应游戏特定的逻辑和时代背景。
-
8.3 Gameplay 工程师 (Gameplay Engineer)
-
角色: 构建“世界” (The World)
-
职能:
-
引擎开发: 负责 Unity/Unreal 引擎内的具体功能实现、物理交互与千人同屏优化。
-
PCG 算法: 编写 1:1 地球生成的程序化算法,处理地形、水文与气候的动态模拟。
-
交互实现: 将 AI 传回的 Action Plan 转化为具体的游戏内行为(寻路、动画状态机)。
-
8.4 技术美术 (Technical Artist / TA)
-
角色: 构建“管线” (The Pipeline)
-
职能:
-
AIGC 工作流: 搭建从“文生图”到“3D 资产/贴图”的自动化生成管线,确保美术资产量产效率。
-
Shader 与渲染: 统一 AI 生成资产的视觉风格(如废土写实风),处理生成式资产的性能优化。
-
动作系统: 集成 Motion Synthesis 技术,解决 AI 在复杂地形下的动作适配问题。
-
8.5 美术风格与 UI 专家 (Art Style & UI Lead)
-
角色: 构建“外观” (The Face)
-
职能:
-
风格把控: 对 AI 生成的资产进行审美把关和二次修饰,确保世界观的统一性。
-
场景整合: 利用 PCG 素材搭建关键地标和氛围场景。
-
UI/UX 设计: 这是核心体验的一部分。 设计自然语言交互界面(Chat UI)与愿景管理面板,确保“沟通”的体验流畅且具有沉浸感。
-
AI 共创者管理: 筛选并整合社区玩家利用 AI 生成的优秀创意资产。
-
8.6 AI 共创者 / 探索者 (AI Co-Creator)
-
角色: 任何有激情的玩家 (The Passionate One)
-
门槛: 零 (Zero Barrier)
- 在 AI 原生时代,技术不再是硬门槛。我们相信,只要你对游戏有足够的热爱,有独特的审美,并且愿意拥抱 AI 工具,你就有能力将脑海中的世界变为现实。
-
职能:
- 自由创作: 利用 GenAI 辅助,参与从剧情编写、资产生成到玩法原型的任何环节。