0

0

索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类

WBOY

WBOY

发布时间:2023-04-09 08:21:02

|

1613人浏览过

|

来源于51CTO.COM

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

索尼AI击溃顶级真人赛车手,以1.5秒优势打败人类

“这是什么情况?”艾米丽·琼斯(Emily Jones)不敢相信自己竟然落后了。

艾米丽·琼斯是一名多次夺冠的顶级 GT 游戏赛车手,她拍打着她的电子竞技专用方向盘,眼睛盯着面前的屏幕:“我尽力了,但还是追不上它——它是怎么做到的?”

在游戏 GT(Gran Turismo)中,琼斯以每小时 120 英里的速度驾驶着她的赛车。为了追上世界上最快的“玩家”,她几度把车速飙到了每小时 140、150 英里。

这位“玩家”实际上是名为 GT Sophy 的人工智能。它是由索尼人工智能研究实验室在 2020 年发布的,利用人工智能技术在 GT 游戏中学习如何操控赛车。在 2021 年举行的一系列闭门活动中,索尼安排了该人工智能与顶尖 GT 赛车手同台竞技。

2021 年 7 月,琼斯作为电竞战队 Trans Tasman Racing 的一员,参与了索尼组织的活动,但当时的她并不知道会发生什么。

“没人给我提供任何信息。只是跟我说不需要做任何练习,也不要在意圈速。”她回忆道。“我的态度也很单纯,保密就保密吧,这肯定不是什么坏事。”

最后,GT Sophy 以 1.5 秒的优势击败了琼斯的最佳成绩——人类赛车手刷新 GT 纪录基本都是以毫秒为单位的,1.5 秒意味着巨大的差距。

但索尼很快了解到,仅凭速度并不足以让 GT Sophy 成为赢家。它在单人赛道上超越了人类车手,以不可思议的成绩打破了三个不同赛道的纪录。

然而当索尼将其与多个人类车手放在一起比赛时,它却输掉了——多人竞赛不仅需要速度,还需要一定的智慧。GT Sophy 有时因过于激进和鲁莽而招来罚分,有时则过于怯懦,在不需要的时候让步。

索尼重新训练了人工智能,并在 2021 年 10 月进行了第二轮比赛。这一次,GT Sophy 轻松地赢下了人类玩家。它做出了什么改变?

首先是索尼打造了一个更大的神经网络,程序的性能更加强大,但本质上的不同之处在于 GT Sophy 学会了“赛道礼仪”。

美国负责人彼得·沃曼()表示,这种礼仪被人类车手广泛遵守,其实质是平衡攻击性和让步的能力,在时刻变化的赛场中动态选择最合适的行为。

这也是使 GT Sophy 超越赛车游戏人工智能的原因。他说,车手在赛道上的互动和礼节是一个特殊例子,其中展示的动态的、情境感知的行为,正是机器人在和人互动时应该具备的。

认识到何时冒险、何时安全行事,对于人工智能来说十分有用,无论是在制造车间、家庭机器人,还是无人驾驶汽车上。

说:“我认为我们还没有学会关于如何处理必须遵循的人类规范的一般原则。但这是一个好的开始,希望它能让我们深入了解这个问题。”

GT Sophy 只是许多击败过人类的人工智能系统中的其中一个,从国际象棋到星际争霸和 DOTA2,人工智能都击败了世界上最好的人类选手。不过 GT 这个游戏给索尼提供了一种新的挑战。

与其他的、特别是那些回合制的游戏不同,GT 要求顶尖玩家在逼近物理极限(超高车速)的情况下实时控制车辆。在竞赛中,所有其他玩家都在做相同的事情。

虚拟赛车以每小时 100 英里的速度疾驰而过,车身与弯道边缘的距离只有几英寸。在这样的速度下,微小的误差都会导致碰撞。

据悉,GT 游戏以详尽地捕捉、并复刻真实世界的物理学而闻名,它模拟了赛车的空气动力学和轮胎在赛道上的摩擦。这一游戏有时甚至被用来训练和招募真实世界的赛车手。

瑞士苏黎世大学机器人和感知小组的负责人(Davide Scaramuzza)说:“它在真实程度方面做得很好。”他并没有参与 GT Sophy 项目,但他的团队曾使用 GT 游戏来训练人工智能驾驶员,目前尚未进行过针对人类的测试。

GT Sophy 参与游戏的方法与人类玩家不同。它不读取屏幕上的像素,而是获取有关自身在赛道上的位置和周围汽车的位置的数据。它还会收到关于影响其车辆的虚拟物理力量的信息。

作为回应,GT Sophy 控制汽车转弯或刹车。这种 GT Sophy 与游戏之间的交互每一秒进行 10 次,及其同事声称,这与人类玩家的反应时间相似。

索尼使用了强化学习,通过试错的方法从零训练 GT Sophy。起初,人工智能只能努力让汽车保持在路上行驶。

但经过在 10 台 PS4 上的训练后(每台运行 20 个程序实例),GT Sophy 在大约 8 小时内提升到了 GT 的内置人工智能水平,相当于业余玩家。在 24 小时内,它就接近了包含 17700 名人类玩家最佳成绩排行榜的最顶端。

GT Sophy 花了 9 天时间不断缩短圈速。最后,它比任何人类玩家都要快。

可以说,索尼的人工智能学会了如何在游戏允许的极限下驾驶,完成了人类玩家力所不能及的动作。令琼斯最为印象深刻的是 GT Sophy 的转弯方式,将刹车提前、以实现用更紧的走线加速出弯。

editGPT
editGPT

一款浏览器插件,让ChatGPT修改、校对英语文章

下载

她说:“GT Sophy 以一种奇怪的方式对待走线,做了一些我甚至从未想过的事情。”例如 GT Sophy 经常把一个轮胎开到赛道边缘的草地上,然后滑进弯道。一般人不会那样做,因为太容易犯错了。这就像是你在控制一起碰撞事故。给我一百次机会,我也许只能成功一次。”

GT Sophy 很快就掌握了这个游戏的物理学,不过更大的问题是裁判。在职业赛场上,GT 比赛由人类裁判监督,他们有权对危险驾驶扣分。

累积惩罚是 GT Sophy 在 2021 年 7 月的第一轮比赛中失利的一个关键原因,尽管它比任何一个人类车手都要快。在几个月后的第二轮比赛中,它学会了如何规避惩罚失分,结果就大不相同了。

在 GT Sophy 上投入了数年的精力。他桌子后面的墙上挂着一幅两辆车争抢位置的画。“这是 GT Sophy 正在超越 Yamanaka,”他说。

他指的是顶尖 GT 日本车手 Tomoaki Yamanaka,他是 2021 年与 GT Sophy 比赛的四名日本职业模拟赛车手之一。

他不记得这幅画是哪一局比赛。如果是 2021 年 10 月的比赛,Yamanaka 很可能会乐在其中,因为他面对的是一个强大但公平的对手。如果这是 2022 年 7 月份的活动,他很可能会咒骂电脑莫名其妙。

Yamanaka 的队友 Takuma Miyazono 通过翻译软件向我们简单描述了 2022 年 7 月份的比赛。他说:“有几次我们被(GT Sophy)撞出赛道,因为它的过弯方式太过激进。这让我们很生气,因为人类玩家会在转弯时减速,以避免开出赛道。”

说,训练人工智能公平竞技且不失去竞争优势是十分困难的。人类裁判会做出取决于环境的主观判罚,这让人们很难将它们转化为人工智能可以学到的东西,比如哪些行为可以做,哪些不可以做。

索尼的研究人员尝试给人工智能提供许多不同的线索,供其调用和调整,希望能找到一种有效的组合。如果它偏离赛道或撞到围栏上,造成了车辆碰撞或可能被裁判判罚,那么它就会受到惩罚。

他们对每种惩罚的力度进行了实验、观察和调试,并且检查了 GT Sophy 的驾驶方式会如何发生变化。

索尼还增加了 GT Sophy 在训练中面临的竞争。在此之前,它主要针对自身的老版本进行训练。

在 2021 年 10 月份的重赛之前,索尼每隔一两周就会邀请顶级 GT 车手帮助测试人工智能,再综合结果不断调整。

“这给了我们所需的反馈,以便在攻击性和让步之间找到合适的平衡,”说。

这起到了效果。三个月后,当 Miyazono 与 GT Sophy 比赛时,后者的激进表现消失了——但它并不是简单地退缩。“当两辆车并排进入一个弯道时,GT Sophy 会给人类车手留下足够通过的空间,”他表示,“这让你感觉是在和另一个真人比赛。”

他补充说:“面对这种反应,车手会得到一种不同的激情和乐趣。这真的给我留下了深刻的印象。”

对索尼的工作印象深刻。他说:“我们用人类的能力来衡量机器人技术的进步。”但是,他的同事埃莉亚·考夫曼(Elia Kaufman)指出,仍然是人类研究人员主导了 GT Sophy 学习行为的训练。

“良好的赛道礼仪是由人类教给人工智能的,”他说,“如果这能以自动化的方式实现,那将真的很有趣。”这样的机器不仅会有良好的赛场风范,更主要的是可以理解什么是赛场风范,并且能够改变它的行为来适应新的设置。

的团队现在正在将其 GT 赛车研究,应用到现实世界的无人机比赛中,使用原始视频输入而不是模拟数据来训练人工智能飞行。2022 年 6 月,他们邀请了两名世界冠军级别的无人机飞手对抗电脑。

他说:“在看到我们的人工智能比赛后,他们的表情说明了一切。他们被震撼到了。”

他认为,对机器人技术的真正进步必须要拓展到现实世界。“在模拟和现实世界之间,总是会有一种不匹配的情况,”他说,“当人们谈论人工智能取得了令人难以置信的进步时,这一点就被遗忘了。在战略方面,是的。但就部署到现实世界而言,我们还差得很远。”

目前,索尼仍坚持将技术仅用在游戏中。它计划将 GT Sophy 用于未来版本的 GT 游戏中。“我们希望这能成为产品的一部分,”美国的执行总监彼得·斯通()说。“索尼是一家娱乐公司,我们希望这能让游戏更加有趣。”

琼斯认为,一旦人们有机会观摩 GT Sophy 的驾驶过程,那么整个模拟赛车社区都可以从中学到很多东西。“在许多赛道上,我们会发现很多沿袭了多年的驾驶技巧都是有缺陷的,实际上存在更快的方法。”

Miyazono 已经在尝试复制人工智能在弯道的走线方式,因为它已经展示了这是可以实现的。琼斯说:“如果基准水平发生变化,那么每个人的技术都会提升。”

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

2

2026.03.16

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

90

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

136

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

380

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

64

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

111

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

113

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

245

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

723

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
光速学会docker容器
光速学会docker容器

共33课时 | 2.1万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号