索尼游戏AI:互动娱乐的未来

索尼游戏AI

早在2020年,索尼AI决定挑战一件相当大胆的事情:打造一个能够真正击败世界上最好的《Gran Turismo》车手的AI。不仅仅是与他们竞争,而是击败他们。到2021年,他们做到了。但这一突破实际上只是索尼更大游戏AI愿景的开端。

索尼在游戏AI革命中处于前沿。他们的方法很有趣,因为这不是为了取代人类的创造力,他们对此非常坚持。相反,他们在多个领域利用机器学习:像人类一样学习的赛车代理、AI驱动的升级技术、下一代游戏机架构和智能游戏开发工具。让我们深入了解索尼游戏AI到底是什么,这项技术如何运作,以及它对开发者和玩家可能意味着什么。

什么是索尼游戏AI?

Sony Gaming AI是一个全面的AI技术生态系统,旨在提升互动娱乐的各个方面。与遵循预定脚本的传统基于规则的游戏AI不同,Sony的方法使用了一种称为 深度强化学习 创建通过经验真正学习的自适应AI代理,就像人类一样。

在其核心, Sony的AI哲学很简单:AI应该增强创造力,而不是取代它。这一原则指导着从公司210个团队的50,000多名员工如何使用公司的企业LLM平台,到AI如何集成到PlayStation主机和游戏中。

公司与专注于法律、隐私和伦理的团队合作,建立AI使用的明确指南。他们特别关注防止未经授权的内容复制。索尼还通过建立能够检测被盗或不当使用内容的系统来保护创作者的作品。

索尼的AI方法:超越基于规则的系统

传统的游戏AI基于严格的规则运作:“如果玩家做X,则NPC做Y。”这很可预测。Sony通过使用 深度强化学习 在游戏生态系统中训练AI代理。这项技术使开发者能够设计和提供更丰富的体验,这些体验可以适应、学习和进化。

强化学习在游戏中的运作方式

强化学习(RL)代理通过在环境中反复练习来学习任务。可以把它想象成教人开车:他们反复练习,获得对其行为的反馈,并通过试错逐渐改进。

索尼AI的方法奖励积极行为并惩罚不良行为,这使得AI能够通过迭代训练不断改进。现代电子游戏需要精确的控制和创造性的解决方案,为这些代理提供了理想的训练场所。为游戏开发的创新也可能适用于其他现实世界领域。

Gran Turismo Sophy

Gran Turismo Sophy:突破性的AI赛车代理

赛车AI解析

Gran Turismo Sophy (GT Sophy)代表了Sony最受赞誉的AI成就。一个自主赛车代理,不仅与世界上最好的Gran Turismo车手竞争,而且在展示出极其人性化的赛车技巧的同时击败了他们。

它源于Sony AI、Polyphony Digital和Sony Interactive Entertainment之间的独特合作。 GT Sophy实现了许多人认为不可能的事情: superhuman racing performance combined with genuine sportsmanship.

The achievement earned recognition as a cover article in Nature in February 2022. It also won Sony AI the 2022 ACM SIGAI Industry Award for Excellence in Artificial Intelligence.

GT Sophy如何学习赛车

GT Sophy以专业车手的方式学习赛车:通过广泛的练习。AI在每条赛道上驾驶数千次,与其他车辆比赛以掌握正确的赛道行为和赛车技艺。

GT Sophy使用强化学习来发展直观的理解,而不是遵循预编程的赛车路线:

  • Contemplates overtaking opportunities rather than just executing scripted maneuvers
  • Exhibits restraint when aggressive moves might cause accidents
  • Adapts racing lines based on opponent positioning and race conditions
  • Balances competitive drive with clean racing practices learned through reinforcement

This adaptive strategy produces racing behavior that feels genuinely human rather than mechanical. GT Sophy不仅仅遵循最佳路径——它根据比赛的发展做出实时战略决策。

赛道上的情商

赛道上的情商

Perhaps GT Sophy最显著的特点 是其情感维度。AI使用显示在其车上方的视觉“表情符号”在比赛期间传达情绪状态:

  • 在被撞或被超越时显示“悲伤”
  • 在成功超车时显示“快乐”
  • 听觉提示信号情绪变化

这反映了GT Sophy对赛车心理学和竞争动态的复杂理解。它帮助玩家将AI视为赛车对手,而不仅仅是一个算法。

GT Sophy对玩家的好处

灵活的训练伙伴

The March 2025 release of GT Sophy 2.1 transformed the AI from a superhuman opponent into customizable training partner. Players now have unprecedented control over their racing experience:

  • 从19种车型和赛道中选择
  • 选择圈数和比赛条件
  • 使用升级和调校规格定制GT Sophy的车辆
  • 设置轮胎和燃料消耗率
  • 调整难度以匹配个人技能水平

提升的赛车技能

GT Sophy帮助玩家提升赛车能力:

  • 在任何技能水平上提供一致的、适应性的竞争
  • 展示正确的赛车礼仪和体育精神
  • 创造实验新策略的机会
  • 提供对玩家战术做出真实反应的挑战性对手

更丰富的游戏体验

GT Sophy展示了AI可以创造更具吸引力和动态的游戏玩法。与其让玩家快速学习如何利用的可预测对手,GT Sophy不断适应,使每场比赛都感觉新鲜和充满竞争。

GT Sophy背后的技术

GT Sophy背后的技术

多代理学习

几乎所有电子游戏都涉及与其他代理或人类打交道,而交战规则往往没有正式化。 没有明确的成本函数或访问所有可能的行为游戏中的AI代理需要比传统AI领域更强大和可调。

GT Sophy同时与多个代理和人类玩家互动,学习在赛道上驾驭复杂的社交动态。由于几乎所有现实世界的领域都涉及多个代理,例如自动驾驶汽车和机器人,索尼为GT Sophy开发的多代理学习技术可以广泛应用于游戏之外的领域。

可扩展的训练基础设施

Modern reinforcement learning and AI algorithms require massive compute and data resources. Sony AI developed a sophisticated engineering ecosystem that enables:

  • 现代 RL 算法的大规模计算资源
  • 快速部署在视频游戏上训练的大规模学习算法
  • 适用于生产环境的可信赖且可重复的强化学习过程
  • 在多样化的游戏场景中高效训练AI代理

该平台代表了多年来在构建专门为游戏 AI 训练设计的工程生态系统方面的研究,并继续发展以支持日益复杂的 AI 应用。

PlayStation光谱超分辨率

PlayStation Spectral Super Resolution (PSSR):AI驱动的升级技术

什么是PSSR?

PlayStation Spectral Super Resolution (PSSR) 是索尼的 AI 渲染技术 由 PS5 Pro 上专用的机器学习处理器驱动。PSSR 将于 2024 年 11 月首次亮相,代表了首个在家用游戏机上实施的机器学习升级器,将以前专属于高端 PC 游戏的技术带给主流观众。

类似于 NVIDIA 的 DLSS(深度学习超级采样)技术, PSSR利用神经网络 使用高分辨率图像进行训练。机器学习教会网络如何添加和推断图像细节,从低分辨率渲染中创建清晰的视觉效果。

PSSR解释

PSSR允许游戏以较低分辨率(如1080p全高清或1440p四高清)渲染,然后使用AI算法确定这些图像在更高分辨率(如2160p或4K)下的外观。

图像以较低分辨率渲染,但给人一种它们在更高分辨率下运行的印象。这大大减少了图形处理单元(GPU)需要做的工作,从而提高了图形性能和帧率,同时生成超越原生渲染能力的清晰图像。

Mike Fitzgerald from Insomniac Games explains:“我们可以在较低分辨率下渲染,将其提升到完整的4K,并从图像中获得大量额外细节。”

PSSR如何学习和改进

PSSR如何学习和改进

What distinguishes PSSR from traditional upscaling is its learning capability. 顽皮狗的特拉维斯·麦金托什强调了这一点:“[PSSR]比以前的超分辨率器产生了更好的结果,因为它不仅可以在我们的游戏上训练,还可以在许多其他游戏上训练,并且在每次迭代中学习和改进。”

PSSR背后的神经网络在多个游戏中进行训练,而不是针对单个游戏进行优化。这种跨游戏学习使PSSR能够:

  • 自动修复图形错误和伪影
  • 通过专业训练改善如树叶渲染等具有挑战性的元素
  • 随着更多开发者实施该技术,随着时间推移提供更好的结果
  • 适应各种艺术风格和视觉方法

随着神经网络的持续学习,驱动技术的算法得到改进,惠及整合PSSR的开发者和体验增强图像的玩家。

PSSR对玩家和开发者的好处

更快的帧率

以更高每秒帧数(fps)运行的游戏通常表现更好更快,尽管所需的FPS因游戏需求而异。大多数游戏在至少30 fps下表现理想,而动作丰富的游戏通常以60 fps或更高为目标。

PSSR通过在要求较低的分辨率下渲染来大幅加速帧率,同时实现4K视觉质量,释放GPU资源以获得更高性能。

图像增强

在更高fps下运行游戏可能会影响视觉效果,导致卡顿或延迟。PSSR有助于抵消这一点,提供增强和更清晰的图像质量,媲美您在更高原生分辨率下的期望。

例如,PSSR提供了2160p(4K)图像的额外像素和视觉输出,而实际上以较低功率的1080p分辨率渲染帧,保持视觉保真度而不增加性能成本。

性能提升

在更高设置下运行的游戏可能会显著消耗显卡并影响性能。性能因GPU是否运行光线追踪、所玩的特定游戏以及硬件配置而异。

PSSR helps improve system performance even when running at higher settings by efficiently using machine learning processors to deliver dramatically better results than previous console upscaling methods.

PSSR与竞争技术的比较

Digital Foundry进行了广泛的测试 使用《Ratchet & Clank: Rift Apart》比较PSSR与竞争对手的超分辨率技术,精确匹配分辨率以确保PSSR、AMD FSR 3.1和 NVIDIA DLSS 3.7.

结果:

  • PSSR显著优于传统的主机放大
  • 在许多情况下接近DLSS的质量
  • 在复杂的视觉元素和边缘细节方面特别强大

对于主机玩家来说,PSSR代表了视觉质量的代际飞跃,而无需成比例地增加GPU功率,使以前仅限于PC玩家的昂贵显卡技术普及化。

紫水晶项目:PlayStation游戏的未来

索尼和AMD的下一代合作

紫水晶项目代表了一个重要的游戏技术合作伙伴关系 索尼和AMD之间旨在定义PlayStation 6及以后的图形架构的合作。开发始于2023年,当时PS5 Pro基本完成,明确目标是利用AI和机器学习来改善游戏视觉效果和性能。

The codename Amethyst combines PlayStation blue with AMD red,创造出紫色——象征着他们对游戏未来的统一愿景。

Mark Cerny对机器学习游戏的愿景

Mark Cerny,PS5和PS5 Pro的首席架构师,声明:“基于机器学习的处理是未来。”目标是 “更少的像素,更漂亮的像素,结合机器学习库来提高分辨率或添加帧,或以各种方式协助光线追踪。”

这代表了游戏硬件哲学的根本转变,优先考虑智能处理而不是蛮力计算。

紫水晶项目的三大支柱

1. 神经阵列(性能)

神经阵列代表了一组计算单元 连接成一个集中的AI引擎。它们被设计为比传统GPU设计更高效地处理大型机器学习工作负载,支持下一代神经渲染,专用硬件用于AI超分辨率、帧生成和光线追踪增强,减少对标准GPU核心的计算负担。

2. Radiance Cores(沉浸感)

专用光线遍历硬件设计 用于高性能实时光线追踪和路径追踪。Radiance Cores将密集的光线追踪任务从着色器核心中卸载出来,使其能够处理其他场景元素,同时提供更高的fps和沉浸式视觉效果。这使得光线追踪和反射的计算在主机上成为可能,将以前仅限于昂贵PC设置的视觉质量带入主流游戏。

3. 通用压缩(效率)

一种压缩系统,可以评估和压缩GPU内的所有可用数据,而不仅仅是纹理。这大大减少了内存带宽的使用,以更高的效率实现新的性能水平。 它解决了一个关键瓶颈 in modern GPU design.

时间表和可用性

AMD的Jack Huynh透露 他们在RDNA 5上共同设计的机器学习加速硬件直接是与索尼合作的结果。此技术将出现在:

  • RDNA 5 graphics cards: AMD下一代GPU的首次公开确认
  • 2026-2027年发布窗口:下一代游戏机的预期时间框架
  • 跨平台收益: Technologies appearing in both PlayStation 6 and AMD Radeon graphics cards

FSR Redstone:共享AI升级创新

索尼和AMD共同开发了一种新的AI升级算法 作为AMD的FSR Redstone基础,于2025年在Computex上宣布。算法从卷积神经网络(CNN)转向Transformer模型架构,旨在创建比当前代技术更清晰的升级图像。

马克·塞尔尼强调互操作性:“算法将作为FSR的实现和作为Spectral的实现……但事实是它们将非常接近,因为我们希望游戏开发者具有互操作性。”

这种方法使开发者受益,他们可以在PC和游戏机平台上实现类似的AI升级,而无需额外的工作量,同时玩家无论硬件如何都能享受一致的质量。

帧生成即将登陆主机

紫水晶项目的下一阶段 包括基于机器学习的虚拟帧生成——目前在PC上可用的技术即将登陆PS5 Pro和未来的游戏机。AI创建完全新的帧,这些帧插入到渲染帧之间,大幅提高帧率而不增加相应的GPU负载。

Cerny强调在此实现中的玩家选择:“我们可以通过降低分辨率渲染和更激进的超分辨率来支持高帧率。我们也可以通过使用帧生成来支持高帧率。一旦这种选择出现,索尼就可以更多地了解玩家的需求。”

游戏开发中的AI:索尼的内部工具

AI 驱动的质量保证

索尼开创了基于机器学习的游戏测试 显著提高 QA 效率和准确性,解决随着游戏变得更大和更复杂而对测试成本的日益关注。

双代理QA系统

索尼开发了两个互补的AI代理用于自动化测试:

Replay Agent excels at replicating exact button combinations。它可以在游戏内 UI 和 PS5 硬件菜单中导航,将角色从出生点移动到关卡过渡,并测试需要完美一致性的场景。

Imitation Agent introduces variability 反映真实世界的游戏玩法。它再现了具有自然变化的人类游戏模式,使用在人工游戏数据上训练的机器学习模型,并适应动态游戏元素,如敌人 AI 和摄像机控制。

案例研究:Astro’s Playroom

索尼展示了他们的AI QA系统 通过《Astro's Playroom》的开发。人工测试人员每个部分玩了 10-20 次以创建代表性样本。机器学习模型从这些游戏数据中学习,然后 AI 代理自动测试游戏部分。

已实现的好处:

  • 在许多情况下显著减少测试时间
  • 在开发周期中更早地检测到错误
  • 提高游戏发布时的整体质量

限制:

  • 一些游戏需要大量的训练数据以进行有效测试
  • 游戏参数的变化需要新的机器学习模型
  • 系统仍然需要人工监督

人类等效游戏自动化

在 CEDEC 2024 上,索尼展示了 AI 技术 实现 PS5 上的自主游戏玩法,复制人类玩家条件。该系统仅使用屏幕信息,结合模仿学习、控制器操作记录/重放和图像识别,并根据视觉提示进行模型切换。

这自动化了在最终用户条件下的 PS5 系统软件功能测试,降低了 QA 成本,并在开发早期识别缺陷——这在测试需求随着游戏复杂性增长的情况下尤为重要。

其他AI创新

预测性AI:预测玩家动作

索尼提交了一项揭示AI的专利 能够在发生之前预测玩家的下一个按钮按压。 该技术使用摄像头监控玩家动作 在游戏过程中,AI 学习识别模式并根据物理动作预测即将到来的输入。

潜在的好处:

  • 通过在执行前预测动作来消除输入延迟
  • 通过毫秒级的时机改进提供竞争优势
  • 无缝处理互联网中断,通过自动完成中断的命令

预测辅助系统建议 未来 PlayStation 游戏机中的专用 AI 处理器(神经处理单元),可能实现加速光线追踪、改进的性能模式和游戏过程中自适应提供的实时战略提示。

AI 驱动的 NPC:互动 Aloy 原型

索尼的先进技术组创建了一个 AI 驱动的版本 of Aloy from Horizon Forbidden West that demonstrates conversational AI in gaming. 原型结合了OpenAI Whisper (语音转文本)、GPT-4 和 Llama 3(对话和决策)、索尼的语音合成系统和索尼的 Mockingbird 技术(音频到面部动画)。

The demonstration showcased 艾洛伊响应玩家语音提示 具有 AI 生成的语音和逼真的面部表情,所有这些都在 PS5 游戏机上测试,性能影响最小。尽管它仍是一个内部原型,尚未确认公开发布,但它展示了 NPC 自然语言对话的可能性,角色根据玩家历史调整对话,以及语音互动取代传统对话树。

内容保护和增强

索尼通过 AI 保护知识产权,系统检测内容是否被盗用或不当使用,并监控未经授权的复制。AI 应用还扩展到媒体增强,包括遗留内容恢复和 PS5 图像质量改进。

支持 PSSR 的游戏机

支持的硬件和未来的集成

支持 PSSR 的游戏机

PSSR在2024年11月发布的PlayStation 5 Pro上可用。该技术利用集成到游戏机定制GPU架构中的专用机器学习处理器,实现所有实施该功能的游戏的AI升级。

PlayStation 6 的预期功能

Mark Cerny 的声明 “基于机器学习的处理是未来” 表明 AI 将在下一代游戏机中发挥重要作用:

AI 原生架构: RDNA 5 GPU配备专用神经处理单元,Project Amethyst 技术(神经阵列,辐射核心,通用压缩),以及从头开始为 AI 工作负载设计的硬件。

Advanced upscaling and frame generation: PSSR 的演变,改进的算法,AI 生成的帧提升性能,以及通过机器学习增强的实时光线追踪。

Developer flexibility: 支持各种 AI 模型,包括 ChatGPT(如果开发者选择),AMD FSR 和 PlayStation Spectral 升级之间的互操作性,以及专注于最大化硬件能力的库。

Player choice: 在高帧率下选择激进的升级或帧生成、可定制的 AI 助手功能,以及通过 AI 分析的自适应难度。

支持索尼AI技术的游戏和引擎

GT Sophy 的可用性

Gran Turismo Sophy 2.1 is available 在《Gran Turismo 7》的自定义比赛模式中,为玩家提供前所未有的定制和对 AI 赛车体验的控制。

支持 PSSR 的游戏

不断扩展的游戏库支持PS5 Pro上的PSSR。索尼第一方工作室和第三方开发者的主要作品正在实施这项技术。随着更多开发者采用PSSR,神经网络继续学习和改进,惠及所有使用该升级系统的游戏。

索尼AI:使命与负责任的AI原则

组织使命

索尼AI于2020年4月成立 to pursue research in AI and robotics within entertainment. Their mission statement captures the philosophy: “释放人类想象力和创造力与 AI。”

索尼 AI 与全球的艺术家、创作者和制作者合作,专注于六大战略挑战,包括开发可信的传感平台、改变数字环境互动、以道德 AI 为先导,并发现 AI 激发前所未有的创造力的领域。

核心价值观

Sony has articulated clear principles governing AI development:

  • AI 应该增强人类的创造力,而不是取代它
  • 道德考量必须指导AI的实施
  • 隐私和法律合规是必不可少的
  • 创作者的知识产权必须得到保护
  • 透明化AI的优势和局限性是必要的

索尼AI驱动的游戏愿景的未来

当索尼游戏AI技术首次开发时,每个应用程序都需要单独的训练和实施。现在,通过像PSSR和跨平台FSR Redstone合作这样的项目,索尼提供了更通用的AI网络,可以在多个游戏和平台上工作。

随着索尼AI技术背后的神经网络不断学习,驱动它们的算法也在改进。这使得在游戏中实施这些技术的开发者和体验更快帧率、增强图像、更丰富AI互动和更沉浸式游戏体验的玩家受益。

索尼的全面AI战略将公司定位为跨多个维度的游戏创新领导者,从突破性成就如Gran Turismo Sophy到在升级和质量保证中的实际应用。公司的投资不仅仅代表增量改进——它们标志着对游戏创建、玩耍和体验方式的根本性重新构想。

从展示超人技能同时保持体育精神的AI赛车代理到提供4K视觉效果而无需4K渲染成本的升级技术,索尼正在构建一个平衡的AI驱动游戏未来:

  • Technological excellence: 一流的AI实现推动边界
  • Human creativity: AI作为增强工具,而非替代品
  • Ethical responsibility: Clear governance protecting creators and users
  • Player enjoyment: Technology serving gameplay

下一代游戏不仅仅是关于更强大的硬件——它是关于更智能的硬件,能够学习、适应并增强游戏体验的各个方面。随着技术延伸到2020年代后期以及定义未来游戏机架构的合作伙伴关系,索尼不仅仅是在参与游戏的AI驱动未来;他们正在积极塑造它。


About the Author
本文探讨了索尼在游戏人工智能领域的全面方法,研究了如Gran Turismo Sophy、PlayStation Spectral Super Resolution和Project Amethyst等突破性技术,这些技术正在为下一代重塑互动娱乐。

伊万·科尔

Evan Cole 从小就对塑造互联网文化的早期留言板充满了好奇,这种好奇心从未离开过他。他撰写关于论坛的演变、新兴科技平台以及人工智能在数字社区中日益增长的角色的文章。他的作品将实用的见解与对在线互动未来发展的清晰视野相结合,帮助读者理解当今的工具如何塑造明天的对话。