0

0

C# TorchSharp加载模型 C#如何读取PyTorch的.pt或.pth模型文件

星降

星降

发布时间:2026-03-18 15:16:01

|

197人浏览过

|

来源于php中文网

原创

<p>TorchSharp 无法直接使用 PyTorch 的 torch.load(),仅支持加载 TorchScript 格式(.pt)模型,需通过 TorchJit.Load() 加载;state_dict 文件须在 C# 中手动重建网络结构并调用 LoadStateDict()。</p>

c# torchsharp加载模型 c#如何读取pytorch的.pt或.pth模型文件

torch.Load() 在 TorchSharp 中根本不能直接用

PyTorch 的 torch.load() 是 Python 侧的函数,TorchSharp 没有等价的通用反序列化解析器。它不支持直接加载任意 .pt.pth 文件——尤其是那些用 torch.save(model.state_dict(), ...)torch.save(model, ...) 保存的、含 Python 闭包/类定义的文件。强行调用会抛出 System.NotImplementedException 或更隐蔽的 InvalidDataException

真正能走通的路径只有一条:模型必须是 **TorchScript 格式**(即通过 torch.jit.tracetorch.jit.script 导出的 .pt),且导出时没依赖未注册的自定义算子或 Python 层逻辑。

  • 检查你的原始 PyTorch 代码是否调用了 torch.jit.trace(model, example_input)torch.jit.script(model)
  • 导出后用 Python 跑 torch.jit.load("model.pt") 确认能加载成功,再交给 C#
  • 如果保存的是 state_dict(常见于训练中间存档),TorchSharp 无法重建模型结构,必须在 C# 里手动复现网络定义

TorchSharp 加载 TorchScript 模型的正确写法

核心是用 TorchSharp.TorchJit.Load(),不是 TorchSharp.Torch.Load()。路径必须是本地绝对路径或可被 .NET File API 访问的路径(不支持嵌入资源或 URL)。

using TorchSharp;
<p>var model = TorchJit.Load(@"C:\models\resnet18_traced.pt"); // 注意:必须是 .pt,且是 TorchScript
var input = torch.randn(new long[] { 1, 3, 224, 224 });
var output = model.Forward(input); // 不是 model.forward(),大小写敏感
  • TorchJit.Load() 返回 ITorchScriptModule,只能调用 Forward(),不能访问 named_parameters() 或修改结构
  • 输入张量的 shape、dtype、device 必须和 traced 时一致;常见坑是 Python 侧用了 float32,C# 默认是 float64,得显式写 torch.randn(..., torch.float32)
  • Windows 上路径斜杠用 @"" 或双反斜杠,单反斜杠会触发转义错误

模型结构不匹配?你可能得手写 C# 版 Network 类

如果你只有 state_dict.pth(比如 Hugging Face 某些仓库只发权重),TorchSharp 不提供类似 PyTorch 的 load_state_dict() 绑定机制。你必须在 C# 里用 nn.Module 子类完整重写模型结构,再逐层加载参数。

百灵大模型
百灵大模型

蚂蚁集团自研的多模态AI大模型系列

下载

例如加载一个简单 CNN:

public class MyCNN : nn.Module
{
    public MyCNN() : base("MyCNN")
    {
        conv1 = nn.Conv2d(3, 32, 3);
        fc1 = nn.Linear(32 * 224 * 224, 10);
        RegisterComponents(); // 必须调用,否则 save/load 不生效
    }
    public override Tensor forward(Tensor input) => ...
}
  • 所有层必须用 nn.Xxx 构造,不能用原生 C# 数组模拟
  • 权重加载靠 model.LoadStateDict(stateDict),但 stateDict 得先用 Python 把 .pth 读成字典,再用 JSON 或 ONNX 中转——TorchSharp 不解析原始 PyTorch state_dict 二进制格式
  • 层命名必须和 Python 侧完全一致(包括 features.0.weight 这种),否则 LoadStateDict() 会静默跳过

CUDA 支持不稳定,CPU 是默认安全区

TorchSharp 的 CUDA 后端依赖 libtorch 的对应版本,且目前仅支持 Windows + CUDA 11.x(官方未明确支持 12.x)。即使配置正确,也常出现 CUDA error: initialization error 或 tensor 在 GPU 上计算结果为 NaN。

  • 开发阶段一律用 torch.set_device(DeviceType.CPU) 开头,确认逻辑正确后再切 GPU
  • 加载模型后立刻调用 model.ToDevice(DeviceType.CPU),别依赖自动 placement
  • libtorch.dll 必须和 TorchSharp NuGet 包版本严格匹配(如 TorchSharp 0.97 对应 libtorch-win-shared-with-deps-1.13.1);混用会导致 AccessViolationException

最麻烦的点其实是模型导出环节——Python 侧 trace 时若用了动态控制流(比如 if x.sum() > 0:),TorchScript 会静默失败或生成不兼容的图,而这个错误在 C# 加载时才暴露,且报错信息毫无指向性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c#是什么意思
c#是什么意思

C#是一种通用的面向对象编程语言,它在.NET框架上运行,可用于开发各种类型的应用程序。本专题为大家提供c#相关的各种文章、以及下载和课程。

279

2023.08.08

什么是c#
什么是c#

C#(读作C Sharp)是一种现代的、通用的、面向对象的编程语言。它由微软公司开发,于2000年首次发布,主要用于开发Windows桌面应用程序、Web应用程序、移动应用程序以及游戏开发等领域。C#是一种类型安全和托管的编程语言,它结合了C++的强大性能和C语言的简单易学特点,并引入了许多新的特性和概念,如委托、属性、泛型和异步编程等,以提高开发效率和代码可维护性。

185

2023.08.31

C#中base关键字的用法
C#中base关键字的用法

在C#中,base关键字用于访问当前类的基类成员,这包括基类的字段、属性、方法、构造函数、索引器以及事件。想了解更多C#的相关内容,可以阅读本专题下面的文章。

327

2024.03.13

C#Task用法
C#Task用法

Task在C#中是用于表示异步操作的对象,它位于System.Threading.Tasks命名空间中。想了解更多C#中各种用法的相关内容,可以阅读本专题下面的文章。

380

2024.03.14

C# 并发与异步编程
C# 并发与异步编程

本专题系统讲解 C# 异步编程与并发控制,重点介绍 async 和 await 关键字、Task 类、线程池管理、并发数据结构、死锁与线程安全问题。通过多个实战项目,帮助学习者掌握 如何在 C# 中编写高效的异步代码,提升应用的并发性能与响应速度。

29

2026.02.03

C# 多线程与异步编程
C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧,包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目,帮助开发者掌握 如何在 C# 中构建高并发、低延迟的异步系统,提升应用性能和响应速度。

107

2026.02.06

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

415

2026.03.11

抖漫入口地址合集
抖漫入口地址合集

本专题整合了抖漫入口地址相关合集,阅读专题下面的文章了解更多详细地址。

109

2026.03.17

多环境下的 Nginx 安装、结构与运维实战
多环境下的 Nginx 安装、结构与运维实战

本专题聚焦多环境下Nginx实战,详解开发、测试及生产环境的差异化安装策略与目录结构规划。深入剖析配置模块化设计、灰度发布流程及跨环境同步机制。结合监控告警、故障排查与自动化运维工具,提供全链路管理方案,助力团队构建灵活、高可用的Nginx服务体系,从容应对复杂业务场景挑战。

13

2026.03.17

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 11.6万人学习

C 教程
C 教程

共75课时 | 5.6万人学习

C++教程
C++教程

共115课时 | 22.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号