游戏行业报告-AI生成3D:关注游戏行业“AI拐点”
报告出品方:国泰君安
以下为报告原文节选
------
1. 游戏产品的趋势:3D 化、UGC、碎片化
1.1. 3D 化:3D 建模成为头部产品标配
头部手游已经进入全面 3D建模时代。根据sensor tower 发布的统计数据,过去 48 个月中,曾进入全球手游收入 top10 的游戏共 38 款,上榜超过10 次的游戏有 16 款,其中大多都涉及到 3D 建模,7 款游戏为绝对头部,上榜超过 30 次,其中 5 款游戏依赖于 3D 建模视角(《王者荣耀》《绝地求生》《ROBLOX》《原神》《Pokemon GO》)。随着手机终端的性能提升和价格下降,玩家游玩 3D 游戏的门槛在持续降低,而 3D 在画面展现的丰富度和美观度上要优于传统 2D,自然会受到更广泛玩家群体的认可。
1.2. UGC 化:平台提供基础玩法,用户自己生产内容
游戏本质是“内容”和“玩法”的体验,后者可重复体验,更容易留住用户。游戏玩家在游戏中希望收获好的内容认知或是游玩体验,大多数游戏都可以在“内容”或“玩法”的二元划分中找到自己更偏向的一级。
从近年来的头部游戏产品来看,偏向“玩法”属性的明显更多,如《王者荣耀》《绝地求生》等,这些游戏并不重视故事性,玩家重复体验相似的玩法;而“内容”属性的包括《原神》《PokemonGO》等,玩家更关注主线故事或人设故事的体验。
具体而言,“内容”就是要“讲好一个故事”,游戏通过线性叙述(如各类单机游戏)、丰富而具体的人设(如二次元向、收集类)等获得玩家的认同,因此游戏运营方要持续进行内容更新和投入,如不断推出新内容、资料片,从而延长游戏的内容时长,留下玩家,因此大型 MMORPG的主线剧情会持续更新,如《剑网 3》需要运营团队十几年来持续保持每年 2-4 次的资料片更新频率,《魔兽世界》的每次更新都伴随着大量的主线剧情的更新,给用户以“追剧”般的体验。
而“玩法”核心是“一次好的体验”,玩家重复游玩相似的内容,只是过程和结果不尽相同,玩家希望从游戏中收获的是体验或成就,关注玩法的创新性、体验的顺畅性,所以如 MOBA、“大逃杀/吃鸡”类等游戏,每个赛季的更新主要是推出新主题、新英雄/装备、新装饰/商品,从而丰富玩法中的各类元素,核心工作量在于对游戏模型的更新。如《王者荣耀》每 3 个月为一个赛季,最新的 S34 赛季,贴合新春时期,采用了“天穹节”的设定,相应推出了一系列皮肤、战令计划、组队功能方面的更新,而核心玩法或者剧情并没有大幅变化。
UGC 已经成为过去十年新玩法出现的重要来源。近年来的头部游戏中,“MOBA”、“大逃杀/吃鸡”、“自走棋”等玩法占据重要位置,相对传统的 MMORPG、三消、卡牌等玩法,已经成为了重要的游戏类型,这些玩法都是脱胎于玩家的二次创作,或是借助成熟游戏中的 UGC 功能,是玩家创意的体现,玩家会通过 MOD 的形式修改游戏的外观或玩法,一些游戏产品官方直接提供各类 UGC 板块,如地图编辑器、创意工坊等,玩家可以通过对游戏提供的现有元素进行组合,设计出新的玩法,再进行发扬光大,形成了最后商业成熟的玩法。
如“MOBA”就是来自《魔兽争霸》的地图编辑器。“MOBA”也被称为“类 DotA”,其原型来自经典即时战略游戏《魔兽争霸》中地图编辑器的一张地图《defense of the ancients》,该地图奠定了上中下三路防守、攻破对手大本营、操控单一英雄升级和购买装备等基本玩法要素,经由《Dota》、《Dota2》《英雄联盟》《王者荣耀》等产品一路发展至今,核心玩法基本没有改变,可以说“MOBA”的核心就是来自玩家创意。
再比如“大逃杀/吃鸡”玩法来自《武装突袭》的玩家 MOD。“大逃杀/吃鸡”出处是日本电影《大逃杀》中提到的竞争淘汰机制,游戏《武装突袭》的 DayZ MOD 设定了拾取随机装备、压缩生存空间、最后一人胜出的玩法,爱尔兰玩家格里尼做了进一步设计,将原 MOD 中的僵尸元素剔除,形成了如今拾取枪械和物资、对抗其他竞争者的形态。之后《DayZ》独立成为一款游戏,这种玩法也出现了更多竞品,如《H1Z1》《PUBG》,甚至手游端的《小米枪战》《荒野行动》《和平精英》,在这个基础上也增加了很多其他元素,衍生出包括《APEX》《堡垒之夜》《永劫无间》之类的“吃鸡+”的玩法。
除了玩法外,玩家也可以通过逻辑和剧情触发的方式创造内容。如《魔兽争霸》的编辑器提供了剧情触发的选项,通过角色的动作设计和镜头设计,玩家可以调整画面观察视角,使用 3D 模型演绎事先编辑好的剧情。像素风的模拟创意游戏《Minecraft》中,大量玩家借助基本元素搭建自己的地图世界,制作游戏,甚至制作剧集内容,如 2014 年由神游八方制作的《我的三体》第一季,前 8 集由初期团队借助《Minecraft》的游戏引擎制作而成。
1.3. 碎片化:小游戏崛起,适合更广泛受众的轻量需求
由于网络基础设施改进和供给的极大丰富,移动互联网用户注意力被短视频为代表的碎片化内容进一步分散。从使用时长占比上看,短视频的时长占比从 2019 年的 15.2%逐年提升到了 2022 年的 28.5%,即时通讯与在线视频的时长占比被相对压缩。
类似短视频,小游戏由于轻量化、便捷的特点,近几年活跃度明显提升。
用户规模角度来看,截至 2023 年 6 月,微信小游戏累计服务用户超 10亿,MAU 超 4 亿,背后是截至 2023 年达到 30 万的庞大开发者群体。
抖音方面,截至 2023 年 12 月,抖音 DAU 超 6 亿,其中小游戏人群占比 49%,抖音小游戏 DAU达 3 亿,相比 2021 年的 0.8 亿增幅超过 200%。
抖音小游戏榜 Top50 中,一半左右的游戏为偏轻度玩法。近两年来抖音小游戏活跃用户增长迅速,2023 年增速较上年增加近 3 倍。
小游戏吸引了更多原本不玩游戏的用户,扩大了游戏基本盘。根据微信公开课 PRO,微信小游戏的用户中,游戏流失用户及非游戏用户来源占比分别为 41%和 22%,仅 37%为原本游戏活跃用户。
小游戏玩家付费仍有提升空间。在 2022 年的调查中发现,纯小游戏付费用户单价整体较低,53.2%只玩小游戏的用户每月在游戏中消费金额不到 50 元,相对而言,纯 APP 游戏的付费用户中 70%以上的月花费超过 50 元,说明近期还在培养消费习惯的阶段。
微信小游戏市场或将在 23 年达到 400 亿,关注变现成长趋势。小游戏依托微信、抖音等超级流量平台,借助“点击即玩”的轻量模式,快速触达大量用户,又以简单、快节奏、高粘性的玩法留存,用户规模长足增长,市场已经迈过了发展的早期阶段,微信小游戏市场规模预计 2023年可达 400 亿以上,增速达 50%,体现了这一细分方向的潜力。
2. “AI 生成 3D”作用于核心环节,可影响 B/C 两端
2.1. 目前生成式 AI 多作用于游戏的脚本、原画设计等环节
游戏产品是文本、图片、音频、视频、动画、编程代码等多种内容形式的综合,从规划到上线运营涉及复杂的生产过程,一般而言可划分为四个环节:1)概念阶段,主要是文字形式,如各种提案、脚本的文档,策划人员需要讨论并确立游戏项目的玩法、世界观、风格等主基调方向,从而完成系统、剧情、关卡等内容的策划工作,为后续的正式开发奠定基础,因此该内容需要尽量详细和严谨。
2)demo 开发,一般涉及简单的开发工作,开发者会做出一个“草稿”从而对策划概念进行验证和调整。
3)开发阶段,一旦确认游戏的方向,产品进入正式开发,就涉及到程序(代码)、美术(图像、3D、视频)、音频音效等多个生产环节,中间也会有各种测试,这一阶段也是游戏生产需要人员、时间、金钱最多的环节。
4)上线运营阶段,游戏开发完毕后上线,进入宣发和运营状态,游戏产品与其他内容产品的一个巨大差异在于,其上线后仍然需要持续更新和维护,如推出新资料片、新的付费项目等,或多或少仍然涉及各类开发工作。
生成式 AI 经历一年多发展,但目前仍主要用在文本、图像环节。游戏行业使用 AI 由来已久,如画面渲染、程序逻辑等环节,AI 可以辅助提升效率,而随着 2023 年 ChatGPT 为代表的生成式 AI 大发展,这种辅助作用呈现扩大化、低门槛化的趋势。由于 AI 在不同领域发展水平不一,在游戏的不同环节发挥的作用也有不同。
脚本设计、文档写作、智能 NPC:相对最成熟的文本类 AI(ChatGPT、NewBing、文心一言等)已经可以较好的胜任脚本写作等工作内容,甚至一定程度上接管智能 NPC 的角色。
代码编写:GitHub Copilot 等 AI 依据庞大的代码数据训练基础,能够一定程度上扮演程序员的辅助角色。
美工:画图 AI 如 Midjourney、SD、DALL-E 等也已经能够较好完成任务,AI 绘图已经较多用于素材、原画、宣传图等 视频动画:Runway、Pika 等工具的生成长度和一致性相对还不成熟,更多用于要求不高的宣传材料上, 模型设计:暂不能形成足够质量的内容,目前只能用作参考辅助用。
2.2. B 端:3D 生产过程复杂,生成式 AI 可极大改进效率
3D 模型的生产一般包括多个环节,建模的上游是策划和美工提供的概念设计,基于对方给定的原画、2D 概念图,建模师需要构思出 3D 造型并通过多个建模软件逐步实现,整体而言要经历模型设计(制作中模、雕刻高模、拓扑低模)、UV 拆分、贴图、绑定骨骼、制作动画等过程,然后再交给工作流下一环节的程序员,进行代码编辑和导入引擎,建模过程可能用到 MAYA、Zbrush、Substance Painter 等多个软件,上手难度较大、耗时较长。
3D 模型制作效率提升对大型游戏进展有重要影响。以 2024 年初大卖的Steam 游戏《幻兽帕鲁》为例,根据创始人的分享,其一开始制作时,一个建模师制作一个帕鲁(游戏中的生物)的 3D 模型花费了一个月,由于不同帕鲁的体型差异巨大,骨骼匹配无法简单复用,每个帕鲁需要独立设计动作,每个帕鲁需要约 20 个动作,按照每个动作 1 天工作量,则还需要额外的 20 个工作日。该游戏中共有 100 余种帕鲁,如果全都按照原有方式制作,理论上完成全部 100 个帕鲁模组需要花费 5000 天以上,而游戏工作室最终在 3 年时间完成了这部作品。
影眸科技发布的演示视频展示了其 Rodin Gen-1 模型的使用效果,能够借助图生 3D 的能力,直接拖拽一张宝可梦图片,通过选项生成提示词,在 10 秒内完成一个表面光滑、细节尖锐的高质量白模。
2.3. C 端:一键定制化模型,高自由、低门槛 UGC 游戏可期
游戏内容制作的效果一般与制作难度成正比,前者体现为自由度、精美程度等,后者则体现在工具上手难度等,游戏内容制作包括多种类型:
专业游戏制作人员开发的游戏,效果最强,但也需要用到各类编程、建模的专业开发,专业性极强;
其次是 MOD 开发,一般来自第三方团队或比较有技术力的个人,官方也可能参与其中,是以游戏补丁的形式添加进游戏内容;
再次是各类创意工坊或地图编辑器,沙盒类游戏会鼓励玩家利用这类功能进行创作,并与其他用户交流;
最低的是面向玩家的游戏内的创造玩法,如搭建房屋、制作道具等,作为玩法的一部分,组合和功能一般有限,但是上手难度也极低。
“一键生成”式的 3D 创建可降低创作门槛到 C 端,打破制作效果和制作难度的正相关性。“AI 生成 3D”的进步或将直接影响创意工坊/地图编辑器的运行逻辑,通过一键生成定制化 3D 模型的方式,UGC 效果有望提升至 MOD 开发的水平,而上手难度能够降低至“游戏内创造玩法”,从而打破效果与难度的相关性,帮助游戏玩法丰富化、内容厚度提升。
3. 技术积累、新工具频出,“AI 生成 3D”或有加速
3.1. 技术积累:数据积累触及突破边缘,各模态依序推进
3.1.1. Objaverse 与 OpenUSD 推动训练数据积累
3D 资产数据集 Objaverse-XL 达到千万级别,且具备较强多样性。2023年发布的 Objaverse-XL 包含约 1020 万个 3D 模型,远超过半年前Objaverse 1.0 的 80 万个,相比目前 2D 图像领域最大的开源数据集LAION 还有较大差距,但这一数量级已经接近 ImageNet,后者是当前多个图像人工智能模型的训练基础数据集。从构成来看,Objaverse-XL包含的 3D 模型主要从 Github、Sketchfab 及 Thingiverse 等平台爬取,包括手动设计的物体、地标和日常物品的摄影测量扫描,以及历史和古董的专业扫描,具备相当强的多样性。这意味着“AI 生成 3D”的数据限制已经接近突破。
Objavers 已经催生出了一些 3D 生成模型。2023 年 12 月 14 日,图片生成 3D 模型 Stable Zero 123 发布,Stability.ai 从 Objaverse-XL 中筛选出高质量、精确和数据标注准确的模型,以便 Stable Zero 123 在生成过程中更有效地理解和创建 3D 模型。单图生成 3D 模型的 TripoSR 基于 LRM原始算法,并通过精细筛选和渲染的 Objaverse 数据集子集以及一系列的模型和训练改进,显著提高了从有限训练数据中泛化的能力,增强了3D 重建的保真度。3 月 19 日,基于视频扩散模型的 3D 生成模型 Stable Video 3D(SV3D)发布,其同样使用 Objaverse 数据集训练。
OpenUSD 联盟力推 3D 格式标准统一,成员数量规模持续扩大。3D 应用广泛,但由于场景丰富、生产环节繁多,长期缺乏统一的标准和格式。
2023 年 8 月,皮克斯、Adobe、苹果、Autodesk、NVIDIA 与 Linux 基金会下属的联合发展基金会共同宣布成立 OpenUSD 联盟(AOUSD),OpenUSD 联盟旨在通过提升 OpenUSD 格式的发展来推动 3D 生态系统标准化,NVIDIA 宣布将通过 NVIDIA Omniverse 与新的技术组合、ChatUSD 和 RunUSD 等云应用编程接口(API)以及全新 NVIDIA OpenUSD 开发者计划来推进 OpenUSD 的发展。2023 年 12 月,AOUSD宣布新增 Cesium、IKEA 等 12 位成员,2024 年 3 月又增加 Intel、Siemens等 8 名成员,联盟成员规模进一步扩大。我们认为 USD 格式的推广有利于 3D 模型数据的积累,对 3D 生成相关 AI 算法的推进有基石作用。
在 GTC2024,将有 7 场会议讨论 OpenUSD,涉及其与生成式 AI 的结合(NVIDIA)、与 Adobe 的集成(Adobe)、半导体制造厂数字孪生(三星)、AI 视觉(西门子)、实景娱乐产业(Moment Factory),英伟达表示将继续投资发展 USD 在媒体、娱乐等行业工作流中的应用,以实现工业数字化工作流以及下一代计算机视觉和生成式 AI。
AOUSD 计划 2024 年完成核心规范审查和反馈修订。根据 AOUSD 官方发布的时间表,24 年第一季度,AOUSD 将发布核心规范的初步大纲,经过 Q2 和 Q3 的正式审查后,在 Q4 发布修订,最终在 2025 年 Q3 之前完成最终批准。
3.1.2. “视频生成”扩大到场景层面,将与“3D 生成”相互促进
“视频生成”扩大到场景层面,需要 3D 重建技术来保证一致性。视频生成技术在 2023 年底以来快速发展,Runway Gen2、Pika 1.0、sora 的效果和视频内容丰富度持续提升。不同于早期的单一物体对象和小幅度运镜,仅需要在生图过程中通过 Control Net 等方式,即可满足物体层面的一致性水平要求,sora 将行业标准抬升到穿梭镜头、航拍镜头的水平,这种时候只有通过 3D 重建,才能确保场景的一致性,因此视频生成的进步会反过来要求和促进 3D 生成的发展。
OpenAI 文生视频模型 Sora 可体现物体关系雏形。2 月 16 日,OpenAI发布文生视频模型 Sora,据官方介绍,此次发布的 sora 是一个 diffusion Transformer 模型,从效果上而言:1)其能够生成具有多个角色、特定运动类型、主体和背景的准确细节的复杂场景,模型能够理解物品是如何存在于现实世界中的;2)模型对语言有深度理解,使得其能够精准解析提示词,从而生成有生动情感的角色,能够保持高度一致性的生成多个镜头。
部分演示视频被认为体现了 3D 关系的雏形。在 Sora 生成的“海盗船在咖啡杯中缠斗”视频中,两艘微缩船只在“咖啡海”中互相追逐环绕,视频体现了液体的动力学效果,包括波浪和船只移动时液体的流动,还需要精确模拟光线,包括咖啡的反光、船只的阴影,以及可能的透光效果,展现了“类 3D”的效果。而在“视频拼接”功能的展示中,基于给定的“西部世界”和“海底城市”两端视频,sora 可以借助物体的遮挡关系,在运镜后展示“西部世界”背后的“海底世界”,从而实现拼接的效果,这个过程中也展现了模型对于物体相对关系的理解。
图像生成 3D 视频模型 Stable Video 3D 明确融合 3D 重建技术。2024 年3 月 19 日,Stability AI 开源了 SV3D,包括两个版本: SV3D_u,支持单个图像生成轨道视频,无需相机调节; SV3D_p 扩展了 SVD3_u 的功能,支持单个图像和轨道视图,从而可以生成沿特定的摄像机路径创建 3D 视频。
SV3D 的生成质量、多视角、一致性等相比之前的 Stable Zero123、Zero123XL 都有大幅度提升,该模型就是借助了其视频模型 SVD 模型优秀的视频生成能力,提升了 3D 重建水平,从而确保 3D 视频的一致性。
3.1.3. 3D 生成显著落后其他模态,具备向上压力
一个内容形态下的 AI 产品发展可以划分为三个阶段,分别以“模型”、“产品”、“成本”为中心,这是由数据的积累和应用落地的逻辑而形成的变化:“模型效果”阶段会有层出不穷的新模型(特别是开源)超越之前的模型;而到了“产品落地效果”阶段,AI 产品开始考虑用户体验,从而获取更多的用户和数据反馈,形成持续改进;最成熟的“成本压缩”阶段,AI 产品已经具备数据基础,开始降价或实质降价,进行市场份额竞争和利润获取。
3D 形态是目前 AI 生成领域最早期的阶段,模型层面还未定型,将吸引更多关注。相比之下发展阶段最靠前的是文本形态,已经在尝试成本压缩;图片生成也已经基本稳定技术路径,开始关注产品使用门槛;视频生成仍在尝试确立技术效果标准的初期,sora 有望确立标杆。
--- 报告摘录结束 更多内容请阅读报告原文 ---
报告合集专题一览 X 由【报告派】定期整理更新
(特别说明:本文来源于公开资料,摘录内容仅供参考,不构成任何投资建议,如需使用请参阅报告原文。)
精选报告来源:报告派
科技 / 电子 / 半导体 /
人工智能 | Ai产业 | Ai芯片 | 智能家居 | 智能音箱 | 智能语音 | 智能家电 | 智能照明 | 智能马桶 | 智能终端 | 智能门锁 | 智能手机 | 可穿戴设备 |半导体 | 芯片产业 | 第三代半导体 | 蓝牙 | 晶圆 | 功率半导体 | 5G | GA射频 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圆 | 封装封测 | 显示器 | LED | OLED | LED封装 | LED芯片 | LED照明 | 柔性折叠屏 | 电子元器件 | 光电子 | 消费电子 | 电子FPC | 电路板 | 集成电路 | 元宇宙 | 区块链 | NFT数字藏品 | 虚拟货币 | 比特币 | 数字货币 | 资产管理 | 保险行业 | 保险科技 | 财产保险 |