C# TorchSharp加载模型 C#如何读取PyTorch的.pt或.pth模型文件

星降

发布时间：2026-03-18 15:16:01

197人浏览过

来源于php中文网

原创

<p>TorchSharp 无法直接使用 PyTorch 的 torch.load()，仅支持加载 TorchScript 格式（.pt）模型，需通过 TorchJit.Load() 加载；state_dict 文件须在 C# 中手动重建网络结构并调用 LoadStateDict()。</p>

c# torchsharp加载模型 c#如何读取pytorch的.pt或.pth模型文件

torch.Load() 在 TorchSharp 中根本不能直接用

PyTorch 的 torch.load() 是 Python 侧的函数，TorchSharp 没有等价的通用反序列化解析器。它不支持直接加载任意 .pt 或 .pth 文件——尤其是那些用 torch.save(model.state_dict(), ...) 或 torch.save(model, ...) 保存的、含 Python 闭包/类定义的文件。强行调用会抛出 System.NotImplementedException 或更隐蔽的 InvalidDataException。

真正能走通的路径只有一条：模型必须是 **TorchScript 格式**（即通过 torch.jit.trace 或 torch.jit.script 导出的 .pt），且导出时没依赖未注册的自定义算子或 Python 层逻辑。

检查你的原始 PyTorch 代码是否调用了 torch.jit.trace(model, example_input) 或 torch.jit.script(model)
导出后用 Python 跑 torch.jit.load("model.pt") 确认能加载成功，再交给 C#
如果保存的是 state_dict（常见于训练中间存档），TorchSharp 无法重建模型结构，必须在 C# 里手动复现网络定义

TorchSharp 加载 TorchScript 模型的正确写法

核心是用 TorchSharp.TorchJit.Load()，不是 TorchSharp.Torch.Load()。路径必须是本地绝对路径或可被 .NET File API 访问的路径（不支持嵌入资源或 URL）。

using TorchSharp;
<p>var model = TorchJit.Load(@"C:\models\resnet18_traced.pt"); // 注意：必须是 .pt，且是 TorchScript
var input = torch.randn(new long[] { 1, 3, 224, 224 });
var output = model.Forward(input); // 不是 model.forward()，大小写敏感

TorchJit.Load() 返回 ITorchScriptModule，只能调用 Forward()，不能访问 named_parameters() 或修改结构
输入张量的 shape、dtype、device 必须和 traced 时一致；常见坑是 Python 侧用了 float32，C# 默认是 float64，得显式写 torch.randn(..., torch.float32)
Windows 上路径斜杠用 @"" 或双反斜杠，单反斜杠会触发转义错误

模型结构不匹配？你可能得手写 C# 版 Network 类

如果你只有 state_dict.pth（比如 Hugging Face 某些仓库只发权重），TorchSharp 不提供类似 PyTorch 的 load_state_dict() 绑定机制。你必须在 C# 里用 nn.Module 子类完整重写模型结构，再逐层加载参数。

百灵大模型

蚂蚁集团自研的多模态AI大模型系列

下载

例如加载一个简单 CNN：

public class MyCNN : nn.Module
{
    public MyCNN() : base("MyCNN")
    {
        conv1 = nn.Conv2d(3, 32, 3);
        fc1 = nn.Linear(32 * 224 * 224, 10);
        RegisterComponents(); // 必须调用，否则 save/load 不生效
    }
    public override Tensor forward(Tensor input) => ...
}

所有层必须用 nn.Xxx 构造，不能用原生 C# 数组模拟
权重加载靠 model.LoadStateDict(stateDict)，但 stateDict 得先用 Python 把 .pth 读成字典，再用 JSON 或 ONNX 中转——TorchSharp 不解析原始 PyTorch state_dict 二进制格式
层命名必须和 Python 侧完全一致（包括 features.0.weight 这种），否则 LoadStateDict() 会静默跳过

CUDA 支持不稳定，CPU 是默认安全区

TorchSharp 的 CUDA 后端依赖 libtorch 的对应版本，且目前仅支持 Windows + CUDA 11.x（官方未明确支持 12.x）。即使配置正确，也常出现 CUDA error: initialization error 或 tensor 在 GPU 上计算结果为 NaN。

开发阶段一律用 torch.set_device(DeviceType.CPU) 开头，确认逻辑正确后再切 GPU
加载模型后立刻调用 model.ToDevice(DeviceType.CPU)，别依赖自动 placement
libtorch.dll 必须和 TorchSharp NuGet 包版本严格匹配（如 TorchSharp 0.97 对应 libtorch-win-shared-with-deps-1.13.1）；混用会导致 AccessViolationException

最麻烦的点其实是模型导出环节——Python 侧 trace 时若用了动态控制流（比如 if x.sum() > 0:），TorchScript 会静默失败或生成不兼容的图，而这个错误在 C# 加载时才暴露，且报错信息毫无指向性。

C# SignalR组播方法 C#如何向特定的组发送消息

C#怎么将字符串转为枚举类型_C#如何使用Enum.Parse方法【代码】

C#怎么获取当前日期是星期几_C#如何格式化显示周几【方法】

C#怎么将List集合进行随机排序_C#如何洗牌打乱数据【技巧】

C#怎么使用读写锁ReaderWriterLock_C#如何优化多线程读性能【实战】

相关专题

c#是什么意思

C#是一种通用的面向对象编程语言，它在.NET框架上运行，可用于开发各种类型的应用程序。本专题为大家提供c#相关的各种文章、以及下载和课程。

279

2023.08.08

什么是c#

C#（读作C Sharp）是一种现代的、通用的、面向对象的编程语言。它由微软公司开发，于2000年首次发布，主要用于开发Windows桌面应用程序、Web应用程序、移动应用程序以及游戏开发等领域。C#是一种类型安全和托管的编程语言，它结合了C++的强大性能和C语言的简单易学特点，并引入了许多新的特性和概念，如委托、属性、泛型和异步编程等，以提高开发效率和代码可维护性。

185

2023.08.31

C#中base关键字的用法

在C#中，base关键字用于访问当前类的基类成员，这包括基类的字段、属性、方法、构造函数、索引器以及事件。想了解更多C#的相关内容，可以阅读本专题下面的文章。

327

2024.03.13

C#Task用法

Task在C#中是用于表示异步操作的对象，它位于System.Threading.Tasks命名空间中。想了解更多C#中各种用法的相关内容，可以阅读本专题下面的文章。

380

2024.03.14

C# 并发与异步编程

本专题系统讲解 C# 异步编程与并发控制，重点介绍 async 和 await 关键字、Task 类、线程池管理、并发数据结构、死锁与线程安全问题。通过多个实战项目，帮助学习者掌握如何在 C# 中编写高效的异步代码，提升应用的并发性能与响应速度。

2026.02.03

C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧，包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目，帮助开发者掌握如何在 C# 中构建高并发、低延迟的异步系统，提升应用性能和响应速度。

107

2026.02.06

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

415

2026.03.11