如何在 PyTorch 中让梯度通过 torch.min 函数正确反向传播

心靈之曲

发布时间：2026-03-06 22:39:01

160人浏览过

来源于php中文网

原创

如何在 PyTorch 中让梯度通过 torch.min 函数正确反向传播

本文详解如何在 PyTorch 中实现对非张量标量（如 Python int/float）参与的 min 运算保留梯度流，核心是避免使用 torch.tensor([...]) 破坏计算图，而应采用链式 tensor.min(other) 方法，并理解其梯度行为。

本文详解如何在 pytorch 中实现对非张量标量（如 python int/float）参与的 `min` 运算保留梯度流，核心是避免使用 `torch.tensor([...])` 破坏计算图，而应采用链式 `tensor.min(other)` 方法，并理解其梯度行为。

在 PyTorch 中，torch.min() 本身支持梯度传播，但前提是输入必须处于同一计算图中。常见错误是将可导张量与 Python 原生数值（如 int、float）直接拼接为新张量，例如 torch.tensor([a, b, c]) —— 此操作会创建一个无梯度历史的新张量，彻底切断 a 的计算图，导致 d.requires_grad == False。

✅ 正确做法是：将标量转换为同设备、同 dtype 的 torch.Tensor，再通过链式调用 a.min(b).min(c) 实现逐元素比较。PyTorch 的 Tensor.min(other) 方法支持广播与自动梯度，且仅对当前最小值所在位置赋予梯度 1.0，其余位置梯度为 0。

以下为完整可运行示例：

Rose.ai

一个云数据平台，帮助用户发现、可视化数据

下载

import torch

# 初始化：a 是需求导的张量；b、c 为标量，需转为 tensor 以接入计算图
a = torch.tensor([4.0], requires_grad=True)
b = torch.tensor([5.0])  # 注意：不是 Python int，而是 torch.Tensor
c = torch.tensor([6.0])

# ✅ 正确：梯度可穿透 min 操作
d = a.min(b).min(c)  # 等价于 torch.min(torch.min(a, b), c)
print(f"d = {d.item()}, d.requires_grad = {d.requires_grad}")  # d = 4.0, True

d.backward()
print(f"a.grad = {a.grad}")  # tensor([1.])

⚠️ 关键注意事项：

标量必须显式转为 torch.Tensor：b = 5 或 b = torch.tensor(5)（标量张量）均可，但 torch.tensor([a, b, c]) 中若 b/c 是 Python 原生类型，会触发隐式转换并丢失梯度依赖。
梯度行为是“选择性传递”：min 的梯度函数定义为： [ \frac{\partial \min(x, y)}{\partial x} = \begin{cases} 1 & \text{if } x y \ \text{undefined (通常取 0.5 或按框架实现)} & \text{if } x = y \end{cases} ] 因此，当 a 不是实际最小值时（如 a=6.0, b=5.0），a.grad 将为 0 —— 这是数学上正确的子梯度（subgradient），但意味着该路径无优化信号。

多变量 min 推荐写法：对于 min(a, b, c, d)，推荐 a.min(b).min(c).min(d) 或封装为函数：

def safe_min(*tensors):
    res = tensors[0]
    for t in tensors[1:]:
        res = res.min(t)
    return res
d = safe_min(a, b, c)

总结：要使梯度通过 min，本质是保持所有参与运算的变量在同一计算图内。避免 torch.tensor([...]) 构造中间张量，改用原位 Tensor.min() 链式调用，并确保所有输入均为 torch.Tensor 类型。理解 min 的梯度稀疏性（仅激活最小值来源）有助于调试训练不稳定或梯度消失问题。

PyTorch全连接网络中隐藏层维度不匹配的典型错误与修复方案

PyTorch 中高效复用中间梯度：避免重复计算慢速函数的导数

PyTorch 向量化实现按音高分组的频谱均值计算

如何准确区分 PyTorch 普通张量与嵌套张量（Nested Tensor）

PyTorch 自定义网络中全局邻接矩阵权重不更新的根源与解决方案

相关标签:

pytorch Float if 封装 int undefined pytorch

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Pandas 中按列分组并统计非空值数量的完整指南下一篇：LeetCode滑动窗口求负数第x小值的常见陷阱与正确实现

作者最新文章

如何正确使用 if-else 判断数据类型并安全执行数值运算

2026-03-06 15:30

如何将 jQuery 的拖放事件正确迁移至原生 JavaScript

2026-03-06 15:40

前端压缩 + 后端优化：高效解决大图上传卡顿与503错误

2026-03-06 15:44

如何通过 HTML 属性安全隐藏或重置 HTTP Referer？

2026-03-06 15:45

鄂汇办app如何补办残疾证

2026-03-06 16:02

《梅格与怪物》确定登陆手机平台好评如潮爱哭少女RPG

2026-03-06 16:07

Go语言中嵌入结构体的JSON序列化问题解析

2026-03-06 16:13

高效算法：用最少区间增量操作使数组严格递增

2026-03-06 16:30

如何高效提取 NumPy 二维数组每行出现频次最高的所有值

2026-03-06 17:36

vscode怎么查成绩

2026-03-06 17:40

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

594

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

105

2025.10.23

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

844

2023.08.22

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

950

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

604

2024.08.29

c++怎么把double转成int

本专题整合了 c++ double相关教程，阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int的含义

本专题整合了C++中int相关内容，阅读专题下面的文章了解更多详细内容。

212

2025.08.29

undefined是什么

undefined是代表一个值或变量不存在或未定义的状态。它可以作为默认值来判断一个变量是否已经被赋值，也可以用于设置默认参数值。尽管在不同的编程语言中，undefined可能具有不同的含义和用法，但理解undefined的概念可以帮助我们更好地理解和编写程序。本专题为大家提供undefined相关的各种文章、以及下载和课程。

6180

2023.07.31

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板