1. 核心愿景 (Core Vision)

《HumAInity》是一款 AI 原生的文明模拟游戏。

在后启示录的地球废土之上,玩家并非全知全能的神,也非孤胆英雄,而是一座幸存者聚落的**“领袖” (First Citizen)**。

  • 历史跨度:从铁器余烬到信息时代 (From Iron Age to Information Age) 游戏起点设定在类似公元前 200 年(铁器时代成熟期)的废土状态。玩家需要带领智能体,重新走过人类文明的漫长历程——从农耕定居、工业革命,最终重返现代信息社会。这是一场跨越两千年的文明重燃之旅。

  • 世界形态:PCG 生成的全域动态地球 (PCG-Generated Living Earth)不是一张静态地图。我们利用 PCG (程序化内容生成) 技术构建了一个 1:1 的超大尺度地球

    • 全域同服: 所有玩家身处同一个物理世界。你在尼罗河畔发展农业时,另一位玩家可能正在黄河建立城邦。

    • 实时演化: 世界会根据文明的行为发生永久性改变。大规模的砍伐会导致沙漠化,修建大坝会改变下游生态。玩家不再是地图的过客,而是地貌的塑造者。

  • 核心体验:沟通驱动的领袖模拟 (Communication-Driven Leadership) 我们将策略游戏的重心从单纯的“资源管理”转移到**“人与高智能 AI 的深度互动”**。

    • 沟通驱动: 你不再是点击菜单的管理员,而是通过自然语言召开会议、制定愿景。

    • 身先士卒: 你需要亲自带领智能体小队探索未知废土、开拓新据点、并在危机中指挥战斗

    • 组织演化: 随着文明壮大,你需要从智能体中选拔核心团队,构建并不断迭代聚落的组织架构,甚至尝试从部落制向共和制等不同政体演变。

1.1 为什么是现在? (Why Now?)

  • 技术基石的成熟:

    • 生产力的解放: 生成式 AI 在 3D 资产产出、动态代码编写层面的巨大助力,使得小团队构建一个细节丰富、物理逻辑自洽的宏大动态世界成为可能。

    • 智能体的觉醒: 现在的 AI 智能体已具备长期记忆与复杂推理能力,它们不再是充当背景板的 NPC,而是有能力作为核心体验的提供者与参与者,与玩家共同推动历史。

  • 交互深度的质变: 玩家不再满足于按键交互,而是渴望像现实中的管理者一样,通过自然语言来驱动复杂的社会分工。现在的技术终于能让这种“动口不动手”的体验变得精准且富有游戏性。

2. 核心体验切片 (Core Experience Slices)

切片 A:内政与愿景 —— “寻找水源”

场景: 废土初期,干旱导致食物短缺。你并没有具体的“水利工程图纸”。

  • 【传统的任务体验】 任务面板显示“建造水井 (0/1)”。玩家跑图点击采集,机械重复十次攒齐木材,打开 UI 菜单点击“建造”,建筑凭空出现。NPC 只是背景板。 (玩家困惑:这和传统的 4X/SLG 有什么区别?)

  • 【HumAInity 的愿景体验】

    1. 愿景 (Vision): 在周会上,面对焦虑的族人,你没有下达死命令,而是描绘未来:“我们得把河水引到田里,哪怕旱季来了,大家也不用饿肚子。”

    2. 自主提案 (Autonomous Proposal): 短暂的沉默后,激进的工头王五站了出来。出于对你的极度信任,他提出了一个大胆的想法:“领袖!我记得西边山脚有些特殊的蕨类植物,底下可能有暗河!我们赌一把?”

    3. 协同研讨 (Collaborative Refinement): 你没有只是点头,而是拉住他深聊:“好主意。但别乱挖。带上那个懂草药的老李,先找‘水脉植物’最密集的地方下铲。” (系统反馈:你的指导提升了计划成功率)

    4. 执行与涌现 (Execute & Emerge): 王五带着人充满信心地出发了。因为有了具体的方法论,他们不仅挖出了水,还意外发现了一种耐旱的食用菌类。

    真正的领袖,是指出方向,然后与众人一起寻找出路的人。

切片 B:外出与危机 —— “围猎行动”

场景: 你带领一支 5 人小队外出探索,遭遇了一头狂暴的变异铁皮野猪。

  • 【传统的战斗体验】 玩家框选所有单位,右键点击野猪。单位自动围上去平 A,玩家狂按技能快捷键,关注血条变化。 (玩家感觉:操作反馈平淡,视听体验甚至不如传统的 RTS 游戏。)

  • 【HumAInity 的指挥体验】

    1. 战前部署 (Deployment): 你没有战斗技能,只能躲在后方。你低声下令:“保持距离,王五去吸引注意,其他人设陷阱!”

    2. 性格涌现 (Personality Emergence):

      • 勇敢的王五 敲击盾牌冲了上去。

      • 胆小的老六 手在发抖,陷阱布置得慢了一拍。

    3. 突发危机 (The Crisis): 野猪突然狂暴,冲破了防线,直奔还没布置好陷阱的老六。老六吓呆了。

    4. 临场咆哮 (Live Command): 你无法亲自上去肉搏,只能通过语音大喊:“老六!别发呆!往树上爬!王五,攻击它的眼睛!”

    5. 信任的回响 (Echo of Trust): 听到你的吼声,老六出于对领袖本能的服从,克服了恐惧爬上了树。王五精准地刺瞎了野猪。危机解除。

    真正的力量,不是你手中的剑,而是你声音中的信念。

3. 核心循环 (Core Gameplay Loop)

我们构建了**“愿景-边界-研讨-执行-演化”**的五阶闭环:

阶段一:愿景提案 (Propose Vision)

  • 机制: 玩家通过自然语言在特定场合提出宏观目标。

  • 体验: 还原现实管理者的体验——定战略,而非定细节。

阶段二:边界划定 (Define Boundaries)

  • 机制: Logos 理性引擎 介入处理,屏蔽全知指令,将模糊愿景转化为 “可行性选项列表”

  • 体验: 玩家感受到游戏世界的真实阻力与逻辑自洽。

阶段三:协同研讨 (Collaborative Refinement)

  • 机制: 智能体提出自己的行动意向后,玩家可以再次介入,通过对话进行**“微调”或“指导”**。

  • 体验: 通过沟通提升任务成功率,获得“共创”的成就感。

阶段四:自主执行 (Autonomous Execution)

  • 机制: 个体 AI 带着玩家的建议去执行任务,过程中可能因为性格或突发事件产生涌现性结果

  • 体验: 观察与收获的乐趣。

阶段五:演化与启示 (Evolution & Inspiration)

  • 机制: Mythos 叙事导演 评估前四个阶段的结果。

    • 沉淀特质: 将成功经验沉淀为 [文明特质](如:连续开垦成功 → [农耕文明])。这会反向同化所有智能体的性格,使他们更倾向于种植与定居。

    • 灵感植入: Mythos 根据当前状态(如“有水了但没容器”),通过环境线索或智能体之口,向玩家抛出新的需求(“领袖,水漏得到处都是,我们是不是该烧点陶罐?”)。

  • 体验: 解决目标迷失。 玩家不需要绞尽脑汁想“下一步做什么”,而是被世界的需求自然推动,产生新的愿景,无缝重启循环。

4. 关键系统呈现 (Key Systems)

4.1 功能不对称设计 (Functional Asymmetry)

这是确立玩家“领袖”身份的设计基石

  • 设定: 玩家保留“管理者”定位,而非“打工人”。

  • 限制: 玩家只有基础物理交互能力(移动/跳跃/拾取/简单攻击),无法进行复杂的精细生产活动(如烹饪、锻造、精密建造)。

  • 目的: 在物理机制层面构建玩家对 AI 的刚性依赖。迫使玩家必须通过沟通、组织与指挥来驱动 AI 完成文明建设,彻底规避“玩家亲自下场当保姆”的皮囊陷阱。

4.2 双子中枢系统 (The Gemini Core System)

为了解决“逻辑自洽”与“动态节奏”的矛盾,我们设计了双AI架构,它们是游戏体验的幕后推手:

  • 理性引擎:Logos (逻各斯) —— [下行链路]

    • 定义: 每个玩家专属的动态逻辑阀门,随文明时代实时进化。

    • 职能 A - 知识屏蔽 (Knowledge Shielding): 防止 AI 因为 LLM 的百科全书属性而“穿越”。确保石器时代的 AI 对“内燃机”毫无反应,维护沉浸感。

    • 职能 B - 愿景锚定 (Vision Anchoring): 解决“指令太模糊”的问题。自动扫描环境资源,为玩家的宏观愿景填充物理细节。

    • 职能 C - 选项生成 (Option Generation): 不强制 AI 执行单一动作,而是划定一个“逻辑上可行的圆”,提供多种方案,将最终选择权交给智能体的主观能动性

  • 叙事导演:Mythos (米索斯) —— [上行链路]

    • 定义: 文明的潜意识缪斯隐形导演

    • 职能 A - 灵感植入 (Inspiration Injection): 解决“目标迷失”。当玩家迷茫时,Mythos 会选中特定智能体,植入“发现鱼群”或“尝试种植”的灵感,让他们主动向玩家提案。

    • 职能 B - 动态张力 (Dynamic Tension): 解决“垃圾时间”。当发展过于平淡时,制造社会议题或外部压力(如干旱),倒逼技术变革。

    • 职能 C - 文明性格编织 (Ethos Weaving): 将玩家的长远决策沉淀为**[文明特质]**(如:尚武农耕理性)。这些特质会反向同化所有智能体的性格,让文明真正活出独特的灵魂。

5. 技术方案:核心逻辑与表现增强 (Core Logic & Experience Enhancers)

我们将技术模块划分为“核心支柱”与“体验增强”两部分,前者是游戏成立的基础,后者是沉浸感的升华。

5.1 [核心支柱] 宏观大脑:双子中枢 (The Cloud Brain)

  • 技术栈: 高参数量云端 LLM + Agentic Workflow

  • 应用场景:

    • Logos: 处理复杂语义解析,执行时代锁与能力锁校验。

    • Mythos: 实时编写剧本,调节游戏节奏张力。

  • 核心价值: 如果没有它,游戏将退化为普通的沙盒建造,缺乏目标感与历史厚度。

5.2 [核心支柱] 微观个体:智能体驱动 (The Agent Drive)

  • 技术栈: 端侧 SLM (小语言模型) + 感知-思考-行动循环

  • 运转逻辑:

    • 感知: 多模态模型识别玩家的意图与动作。

    • 决策: 结合 [性格]、[信任] 和 [Logos 选项] 进行加权推理。

  • 核心价值: 如果没有它,NPC 将变回只会巡逻的木偶,玩家将失去“管理”的乐趣。

5.3 [核心支柱] 记忆与关系引擎 (Memory & Relation Engine)

  • 技术栈: 向量数据库 (Vector DB) + 图数据库 (Graph DB)

  • 运转逻辑:

    • 记忆检索: 存储并检索关键情感时刻(而非流水账),让 AI “记得”玩家的恩惠或背叛。

    • 社会图谱: 实时计算数百个智能体之间的动态关系网(派系、家族、仇恨链)。

  • 核心价值: 它是“社会涌现”的基石。没有它,每一次交互都是一次性的,无法形成长期的社会后果。

5.4 [核心支柱] 动态世界引擎 (Dynamic World Engine)

  • 技术栈: PCG (Procedural Content Generation) + 生态仿真模型 (Eco-Simulation)

  • 运转逻辑:

    • 超大生成: 利用 PCG 技术生成 1:1 真实比例的地球地貌,包含动态的气候与水文系统。

    • 实时改变: 记录文明行为对环境的物理影响。过度砍伐导致水土流失(Logos 物理规则生效),过度捕猎导致物种迁徙。环境的变化反过来成为 Mythos 制造危机的来源。

  • 核心价值: 提供文明演进的物理载体和资源约束,实现“文明重塑地球”的宏大体验。

5.5 [体验增强] 动态交互:环境与动作生成 (Generative Interaction)

  • 技术栈: Motion Synthesis (动作合成) + Runtime 3D Generation

  • 应用场景:

    • 生成式动作: 实时生成 AI 复杂的挖掘、搬运、互动动作,适配无限的地形。

    • 生成式资产: 实时生成符合当前工艺水平的器具(如陶罐、工具)。

  • 核心价值: 极大提升沉浸感与视觉多样性,让“文明演进”在视觉上清晰可见。但从玩法逻辑上,可以用预制资源暂时替代。

6. 研发规划与里程碑 (R&D Roadmap & Milestones)

为了规避技术与设计风险,我们将采取 “MVP 验证 垂直切片 单机闭环 联机共存 全域同服” 的 5 步稳健迭代战略。

6.1 里程碑 I:最小可玩 Demo (MVP: The Tribe Pulse)

  • 预期时间: 3 个月

  • 核心目标: 验证“自运转村落”与“沟通”。证明多个智能体可以组成一个社会雏形,并能理解玩家的自然语言愿景。

  • 产出内容:

    • 场景: 预制的小型山谷村落(非 PCG)。

    • 角色: 1 名玩家 + 10-20 名拥有独立性格的智能体。

    • 系统: 基础版 Logos(处理采集/建造指令),初步的社会关系网。

    • 体验: 玩家通过沟通解决村落的生存问题(如食物分配、住所分配),观察智能体之间的闲聊与自发社交。

  • 技术验证: 端侧 SLM 在多人场景下的性能表现、多模态意图识别准确率。

6.2 里程碑 II:垂直切片 (Vertical Slice: 200 BC)

  • 预期时间: + 3 个月

  • 核心目标: 验证“文明模拟”的深度与涌现性。在一个固定的时代(公元前 200 年)内,展示游戏的所有核心系统。

  • 产出内容:

    • 时代: 锁定在铁器时代成熟期。

    • 规模: 聚落扩充至 30+ 智能体,出现社会分工与层级。

    • 系统: 完整的双子中枢(Logos + Mythos)、记忆与关系引擎上线。

    • 体验: 玩家面临更复杂的社会问题(派系冲突、资源分配),需要通过会议和制度来管理。

  • 技术验证: 几十个智能体同时运行时的记忆检索效率、Mythos 叙事生成的连贯性。

6.3 里程碑 III:单机演化版 (Single-Player Evolution / Steam EA)

  • 预期时间: + 6 个月

  • 核心目标: 验证“文明演进”的时间跨度。投放到 Steam Early Access 获取核心玩家反馈。

  • 产出内容:

    • 演进: 开放 1-2 个时代的跨度(如:铁器 蒸汽前夜),玩家能感受到科技与社会形态的质变。

    • 世界: 基于 PCG 生成的区域性大地图(单一大陆),包含动态天气与生态。

    • 模式: 纯单机体验,侧重于玩家与自己部落的深度羁绊。

  • 技术验证: PCG 地形生成的稳定性、长时间游玩下的 Save/Load 数据一致性。

--- 训练营目标分割线 (Bootcamp Goal Line: 1 Year) --- 在此节点,我们将完成核心玩法的闭环验证与单机产品的 Early Access 发布,达成训练营的结项要求。后续里程碑为长线开发规划。

6.4 里程碑 IV:联机共存版 (Multiplayer Co-Existence)

  • 预期时间: + 12 个月

  • 核心目标: 验证“多文明博弈”的社交乐趣

  • 产出内容:

    • 模式: 基于房间的联机模式(Room-based),支持 4-8 名玩家在同一张 PCG 大地图上游玩。

    • 交互: 玩家之间可以进行贸易、结盟或战争。

    • 系统: 引入多文明 Logos 参数碰撞(不同文化圈的科技树差异)。

  • 技术验证: 多人网络同步架构、不同玩家 Logos/Mythos 逻辑的冲突仲裁机制。

6.5 里程碑 V:终极形态 (The Living Earth)

  • 预期时间: 长期愿景 + 1 - 2 年

  • 核心目标: 实现“全域同服,真实地球”的宏大社会实验

  • 产出内容:

    • 世界: 1:1 真实地球,所有玩家处于同一服务器。

    • 历史: 完整的、不可回档的地球编年史。

    • 技术:

      • 端云混合: 落实“算力下放”策略,实现低成本运营。

      • Global Dynamic PCG: 实现全球地貌的动态生成与演变(如气候变迁、海平面上升)。

7. 商业化愿景:智能即服务 (Intelligence-as-a-Service)

不同于传统数值付费(Pay-to-Win),《HumAInity》建立在 “为体验付费” 的逻辑之上。

7.1 基础门槛:买断制 (Buy-to-Play)

  • 核心逻辑: 覆盖研发成本、客户端开发及端侧 SLM 授权费用。

  • 权益: 包含完整的游戏内容、单人/多人模式权限,以及足以支撑正常游戏进程的基础云端算力配额。

7.2 模因扩展包:文明模拟参数集 (Memetic Expansion Packs)

  • 核心逻辑: 我们不出售数值强弱,而是出售**“文明的灵魂”**。玩家可以购买基于真实历史或架空设定的完整模拟参数集,在废土上重演“古希腊”或“大汉”的辉煌。

  • 包含内容 (Simulation Assets):

    • 英雄智能体 (Hero Agents): 预训练的高精度智能体,拥有历史人物的性格模型与记忆。

      • 例: [苏格拉底](擅长启发式对话,提升科研速度)、[韩信](性格隐忍但战术天才)。
    • 定制化双核参数 (Customized Core):

      • Logos 规则: 特殊的社会架构(如“元老院” vs “三公九卿”)与特色科技树。

      • Mythos 风格: 叙事调性调整(如“希腊悲剧风” vs “王朝史诗风”)。

    • 文明特质 (Ethos Seeds): 预设的文明初始性格(如 [礼乐][思辨][尚武])。

    • 美学资产 (Aesthetics): 配套的建筑风格、服饰与器物模型生成规则。

7.3 长期成本战略:端云混合架构 (Long-term Strategy: Hybrid AI)

  • 核心挑战: 如何解决 AI 原生游戏随玩家时长增加而线性增长的“Token 成本”问题(Success Tax)。

  • 解决方案: 算力下放 (Offloading Compute)

    • 随着 NPU 硬件与端侧大模型(On-device LLM)技术的成熟,我们将逐步把 Logos 的逻辑校验和 Mythos 的基础叙事生成下放到玩家本地设备运行。

    • 终极目标: 实现 “零边际成本” 的运营模式。云端仅负责全球同服的数据同步与复杂的大型事件生成,日常的高频交互完全消耗玩家本地算力,确保游戏像传统单机一样,一次买断,永久游玩,无需持续为算力付费

8. 招募计划:AI 原生 5 人特种部队 (The 5-Man Squad)

采用 “1 策划 + 2 程序 + 2 美术” 的精简配置。在 GenAI 的加持下,每个人都不再是流水线上的螺丝钉,而是统领 AI 生产力的**“指挥官”**。

8.1 策划 ( Game Designer)

  • 角色: cooperzheng

  • 定位: 项目的“灵魂”

  • 职能:

    • 系统设计: 确立核心循环,撰写 Logos(逻辑锁)与 Mythos(导演机)的底层规则书。

    • AI 调优 (Prompt Engineering): 亲自调试核心智能体的 System Prompt,确立文明的性格与叙事调性。

    • 灰盒原型: 利用 AI 辅助编程工具(如 Cursor)快速验证玩法原型,为程序提供明确需求。

8.2 AI 核心工程师 (AI Core Engineer)

  • 角色: 构建“大脑” (The Brain)

  • 职能:

    • 双核架构: 负责双子中枢的云端/本地架构,处理 LLM 的 Agentic Workflow。

    • 记忆工程: 搭建向量数据库 (Vector DB) 和 RAG 系统,确保智能体拥有长期、连贯的记忆。

    • 模型微调: 负责对开源模型进行 Fine-tuning,使其适应游戏特定的逻辑和时代背景。

8.3 Gameplay 工程师 (Gameplay Engineer)

  • 角色: 构建“世界” (The World)

  • 职能:

    • 引擎开发: 负责 Unity/Unreal 引擎内的具体功能实现、物理交互与千人同屏优化。

    • PCG 算法: 编写 1:1 地球生成的程序化算法,处理地形、水文与气候的动态模拟。

    • 交互实现: 将 AI 传回的 Action Plan 转化为具体的游戏内行为(寻路、动画状态机)。

8.4 技术美术 (Technical Artist / TA)

  • 角色: 构建“管线” (The Pipeline)

  • 职能:

    • AIGC 工作流: 搭建从“文生图”到“3D 资产/贴图”的自动化生成管线,确保美术资产量产效率。

    • Shader 与渲染: 统一 AI 生成资产的视觉风格(如废土写实风),处理生成式资产的性能优化。

    • 动作系统: 集成 Motion Synthesis 技术,解决 AI 在复杂地形下的动作适配问题。

8.5 美术风格与 UI 专家 (Art Style & UI Lead)

  • 角色: 构建“外观” (The Face)

  • 职能:

    • 风格把控: 对 AI 生成的资产进行审美把关和二次修饰,确保世界观的统一性。

    • 场景整合: 利用 PCG 素材搭建关键地标和氛围场景。

    • UI/UX 设计: 这是核心体验的一部分。 设计自然语言交互界面(Chat UI)与愿景管理面板,确保“沟通”的体验流畅且具有沉浸感。

    • AI 共创者管理: 筛选并整合社区玩家利用 AI 生成的优秀创意资产。

8.6 AI 共创者 / 探索者 (AI Co-Creator)

  • 角色: 任何有激情的玩家 (The Passionate One)

  • 门槛: 零 (Zero Barrier)

    • 在 AI 原生时代,技术不再是硬门槛。我们相信,只要你对游戏有足够的热爱,有独特的审美,并且愿意拥抱 AI 工具,你就有能力将脑海中的世界变为现实。
  • 职能:

    • 自由创作: 利用 GenAI 辅助,参与从剧情编写、资产生成到玩法原型的任何环节。