0

0

c++如何实现一个简单的神经网络推理框架_c++ ONNX Runtime集成【AI】

尼克

尼克

发布时间:2025-12-15 14:25:39

|

511人浏览过

|

来源于php中文网

原创

推荐集成ONNX Runtime而非手写推理框架,因其专为高效推理设计,支持多硬件后端、量化、图优化及原生C++ API,只需加载ONNX模型并执行推理即可。

c++如何实现一个简单的神经网络推理框架_c++ onnx runtime集成【ai】

用 C++ 实现一个“从零开始”的完整神经网络推理框架工程量大、易出错,不推荐;实际项目中更高效可靠的做法是集成成熟推理引擎——ONNX Runtime 是目前最主流、跨平台、高性能且对 C++ 友好的选择。

为什么选 ONNX Runtime 而不是手写?

它不是模型训练框架,而是专为**高效推理**设计的运行时:支持 CPU/GPU(CUDA / DirectML / Vulkan)、量化、图优化、多线程、内存复用,并原生提供稳定 C++ API。你只需加载 ONNX 模型(由 PyTorch/TensorFlow 导出),喂入数据,拿到输出,无需管理张量内存、算子实现或调度逻辑。

快速集成步骤(Windows/Linux/macOS 通用)

前提:已有一个导出好的 .onnx 模型(例如 resnet18.onnx)

  • 下载预编译库:访问 ONNX Runtime 官方 Release 页面,选对应系统和硬件后端(如 onnxruntime-win-x64-gpu-1.18.0.zip)
  • 解压后,将 include/ 头文件目录和 lib/onnxruntime.lib(Windows)或 lib/libonnxruntime.so(Linux)加入你的 C++ 工程
  • 链接时添加 onnxruntime 库,启用 C++17(必需)
  • 代码结构精简清晰:环境 → 会话 → 输入/输出绑定 → 运行

C++ 核心调用示例(无 OpenCV 依赖,纯推理)

以下是最小可运行片段(省略错误检查,实际需加 try/catch 和 status 判空):

一键职达
一键职达

AI全自动批量代投简历软件,自动浏览招聘网站从海量职位中用AI匹配职位并完成投递的全自动操作,真正实现'一键职达'的便捷体验。

下载

立即学习C++免费学习笔记(深入)”;

// 1. 创建环境(全局一次)
Ort::Env env{ORT_LOGGING_LEVEL_WARNING, "test"};

// 2. 配置会话选项(可启用 graph optimization / intra-op thread pool) Ort::SessionOptions session_options; session_options.SetIntraOpNumThreads(4); session_options.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL);

// 3. 创建会话(加载模型) Ort::Session session{env, L"resnet18.onnx", session_options};

// 4. 获取输入输出信息(用于分配内存和校验 shape) auto input_node_names = session.GetInputNames(); auto output_node_names = session.GetOutputNames(); auto input_shape = session.GetInputTypeInfo(0).GetTensorTypeAndShapeInfo().GetShape();

// 5. 准备输入张量(例如 float32 的 1x3x224x224 图像) std::vector input_tensor_values(1 3 224 * 224, 0.5f); // dummy data std::vector input_tensor_shape{1, 3, 224, 224}; auto memory_info = Ort::MemoryInfo::CreateCpu(OrtArenaAllocator, OrtMemTypeDefault); Ort::Value input_tensor = Ort::Value::CreateTensor( memory_info, input_tensor_values.data(), input_tensor_values.size(), input_tensor_shape.data(), input_tensor_shape.size());

// 6. 推理执行 auto output_tensors = session.Run(Ort::RunOptions{nullptr}, input_node_names.data(), &input_tensor, 1, output_node_names.data(), 1);

// 7. 读取输出(例如分类 logits) float* output_data = output_tensors[0].GetTensorMutableData(); int64_t output_count = output_tensors[0].GetTensorTypeAndShapeInfo().GetElementCount();

常见问题与建议

  • 模型输入预处理必须和训练时完全一致:归一化(如 ImageNet 的 mean=[0.485,0.456,0.406], std=[0.229,0.224,0.225])、通道顺序(CHW vs HWC)、插值方式等,建议用 OpenCV 或 stb_image + 手动排列
  • GPU 推理需安装 CUDA/cuDNN 并使用 onnxruntime-gpu 包;CPU 版默认开启 AVX2/SSE 优化,无需额外配置
  • 若需动态 batch 或 shape(如 -1 in shape),确保模型导出时已设 dynamic_axes,且 ONNX Runtime 版本 ≥1.14
  • 性能瓶颈常在数据搬运(host ↔ device)和预处理,而非推理本身;可用 Ort::IoBinding 绑定 GPU 内存减少拷贝

基本上就这些。不需要造轮子,用好 ONNX Runtime 就是当前 C++ AI 推理最务实的选择。

相关专题

更多
线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

482

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

143

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

5

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

11

2026.01.21

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

687

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1125

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

799

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

454

2023.08.02

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 7.4万人学习

C 教程
C 教程

共75课时 | 4.2万人学习

C++教程
C++教程

共115课时 | 13.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号