0

0

老司机开车了!用飞桨玩AirSim智能驾驶

P粉084495128

P粉084495128

发布时间:2025-07-28 11:02:55

|

308人浏览过

|

来源于php中文网

原创

本文介绍如何用飞桨PARL强化学习框架在微软AirSim仿真环境实现智能驾驶。先说明环境配置,包括安装Win10、VS2019、虚幻引擎、AirSim等及验证方法;再讲用Python控制汽车的步骤;最后详述基于飞桨PARL的DQN算法实现,含代码清单、逻辑,还提及相关训练地图和视频。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

老司机开车了!用飞桨玩airsim智能驾驶 - php中文网

老司机开车了!用飞桨玩AirSim智能驾驶

https://www.bilibili.com/video/BV1UY4y1e7s5?share_source=copy_web

老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网        

训练过程视频:PARL_AirSim_DQN.mp4

前言

PARL 是由百度大脑出品的、高性能、易用的国产强化学习(RL)框架。
微软AirSim环境是基于Unreal游戏引擎开发的,面向四轴无人机和无人驾驶汽车的虚拟现实环境。
AirSim目前star数高达12.9k,是微软公司最火的人工智能项目之一。
百度PARL的RL程序目前还无法在AirSim环境中运行。
本文实现了AirSim环境中运行基于PARL的强化学习算法。

一、环境要求与配置

  • win10操作系统
  • Anaconda Navigator
  • Python3.7+
  • PaddlePaddle2.x
  • PARL2.x
  • 宽带网络+加速器
  • 内存16G或更多
  • 显卡NVIDIA RTX3060Ti以上

注册账号

  • 注册微软统一账号:Win10系统菜单中找到windows 商店注册即可。
  • 注册Unreal账号:打开游戏引擎官网https://www.unrealengine.com/zh-CN 注册账号,并打通github.com认证授权(二次开发Unreal代码需要用到)。

下载软件

  1. 下载Visual Studio Community 2019

    1. 使用C++的桌面开发
    2. 安装组件:Window 10 SDK(10.0.18362.0)
  2. 下载Epic Game Launcher并安装4.26以上版本的“虚幻引擎”

  3. 重启Epic Game Launcher并关联项目文件

    慧中标AI标书
    慧中标AI标书

    慧中标AI标书是一款AI智能辅助写标书工具。

    下载
  4. 下载AirSim源代码:git clone https://github.com/Microsoft/AirSim.git

本地编译AirSim源代码(Windows环境)

  1. 打开Developer Command Prompt for VS 2019,在项目根目录下输入命令:build.cmd
  2. 检查插件目录:$ProjectRoot\Unreal\Plugins\ 看插件是否生成。

验证安装

  1. 打开Developer Command Prompt for VS 2019,在$ProjectRoot\Unreal\Environments\Blocks目录下输入命令:update_from_git.bat
  2. 弹出窗口点击确定,关联当前引擎
  3. 进入目录双击Blocks.sln, VS2019自动启动。
  4. 编译选项设置为:Development_Editor + Win64
  5. 点击菜单“调试”-->“开始调试”,虚幻编辑器启动,看一遍教程
  6. 点击“运行”,点击确定,出现下图表示AirSim环境安装成功!

老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网        

二、使用Python控制汽车

1. 配置Anaconda环境

2. pip安装AirSim依赖包

    # 安装Unreal和python之间的通讯协议
    pip install msgpack-rpc-python    # 安装airsim的python库
    pip install airsim
       

3. 下载并安装Unreal 的 Landscape Mountains环境

请参考: 《下载与安装示例》章节,不再赘述。

4. 启动VS Code,打开文件夹PythonClient\car\,运行hello_car.py,效果如下:

老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网        

三、使用飞桨PARL强化学习算法驾驶汽车

下载AirSim预编译的windows版本的训练地图: 老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网        

AirSim_Paddle
│  setup_path.py│
│  agent.py│  model.py│  replay_memory.py│  train.py│  
└─airgym
    │  __init__.py
    │  
    └─envs
            airsim_env.py
            car_env.py
            drone_env.py
            __init__.py
       

环境代码清单:

  1. setup_path.py AirSim环境设置
  2. airgym目录
    1. __init__.py python包配置
    2. envs目录
      1.      airsim_env.py   基础环境配置
                                   
      2.      car_env.py    汽车训练环境配置
                                   
      3.      `__init__.py`    python包配置
                                   

DQN算法代码清单:

  1. train.py 主程序,训练DQN模型
  2. model.py 飞桨PARL三件套之一
  3. agent.py 飞桨PARL三件套之一
  4. replay_memory DQN系列算法的“记忆回放”

代码逻辑

  1. 初始化AirSim_Gym 游戏环境
  2. 初始化飞桨PARL库的DQN算法
  3. 预热“记忆回放”
  4. 循环开始触发动作,训练自动驾驶
    ...
    while True:
        step += 1
        # 获取记忆回放中的4帧
        context = rpm.recent_obs()        # 把当前动作返回帧加进去
        context.append(obs)        # 数组增加一维
        context = np.stack(context, axis=0)        # 选择一个动作,e-greedy算法
        action = agent.sample(context)        # 触发动作
        next_obs, reward, isOver, _ = env.step(action)        # 回写记忆回放
        rpm.append(Experience(obs, action, reward, isOver))        # train model
        if (len(rpm) > MEMORY_WARMUP_SIZE) and (step % LEARN_FREQ == 0):            # s,a,r,s',done
            (batch_all_obs, batch_action, batch_reward, batch_done) = rpm.sample_batch(BATCH_SIZE)            # 抽帧
            batch_obs = batch_all_obs[:, :CONTEXT_LEN, :, :]            batch_next_obs = batch_all_obs[:, 1:, :, :]            # 把抽出的帧放入learn方法中学习
            train_loss = agent.learn(batch_obs, batch_action, batch_reward,                                     batch_next_obs, batch_done)            loss_lst.append(float(train_loss))
            print("loss" + str(train_loss))

        total_reward += reward
        obs = next_obs
        if isOver:            break    return total_reward, step, np.mean(loss_lst)
       
  1. 保存训练结果。

四、源代码和演示视频

训练视频:PARL_AirSim_DQN.mp4 完整源代码在work目录

五、项目总结

本项目在AirSim仿真环境中首次集成了飞桨PARL强化学习框架。
使用了飞桨PARL库自带的DQN系列算法,验证了AirSim环境中使用飞桨框架的可行性。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

769

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

661

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

764

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

639

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1325

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

549

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

709

2023.08.11

Java编译相关教程合集
Java编译相关教程合集

本专题整合了Java编译相关教程,阅读专题下面的文章了解更多详细内容。

9

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 10.5万人学习

Django 教程
Django 教程

共28课时 | 3.3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号