PyTorch 高级索引：使用嵌套索引列表高效批量赋值

聖光之護

发布时间：2026-02-16 10:50:06

417人浏览过

来源于php中文网

原创

PyTorch 高级索引：使用嵌套索引列表高效批量赋值

本文详解如何在 PyTorch 中避免显式 for 循环，利用 flatten() + 线性索引或 scatter_ 实现对二维张量按行动态索引并批量赋值，显著提升性能且保持代码简洁。

本文详解如何在 pytorch 中避免显式 for 循环，利用 `flatten()` + 线性索引或 `scatter_` 实现对二维张量按行动态索引并批量赋值，显著提升性能且保持代码简洁。

在 PyTorch 中，当需要根据每行不同的列索引列表（即“嵌套索引列表”）对二维张量进行批量赋值时，直接使用高级索引（如 x[rows, cols]）会因子列表长度不一致而报错（如 IndexError: shape mismatch）。这是因为 PyTorch 要求用于高级索引的张量必须可广播（broadcastable），而变长列表无法直接转为统一形状的张量。

解决该问题的核心思路是：将二维索引映射为一维线性索引，再对展平后的张量执行单次向量化赋值。这既避免了 Python 循环开销，又完全利用了 GPU 张量运算的并行能力。

✅ 推荐方案：flatten() + 手动计算线性索引

假设输入张量 x 形状为 (n, m)，list_of_indices[i] 表示第 i 行需修改的列下标列表。我们只需将每个 (i, j) 映射为全局索引 i * m + j：

import torch

n, m = 9, 4
x = torch.arange(0, n * m).reshape(n, m)
list_of_indices = [
    [], [2, 3], [1], [], [], [], [0, 1, 2, 3], [], [0, 3]
]

# 步骤 1：生成所有目标位置的线性索引（无需循环，纯列表推导）
indices = torch.tensor([
    i * m + j 
    for i, row_indices in enumerate(list_of_indices) 
    for j in row_indices
], dtype=torch.long)

# 步骤 2：对展平张量执行向量化赋值（in-place，零拷贝）
x.flatten()[indices] = -1

print(x)

? 关键说明：x.flatten() 返回的是原张量的视图（view）（底层内存未复制），因此 x.flatten()[indices] = -1 是真正的 in-place 操作，等价于直接修改 x。

搜狐资讯
AI资讯助手，追踪所有你关心的信息

下载

⚙️ 替代方案：torch.scatter_

若需更显式的控制（例如支持重复索引、不同聚合方式），可使用 scatter_：

x_flat = x.flatten()
x_flat.scatter_(0, indices, -1)  # 原地写入
x = x_flat.view_as(x)  # 恢复原始形状（view_as 确保 shape & stride 严格匹配）

注意：scatter_ 默认对重复索引执行最后写入生效（last-write-wins），与 flatten()[indices] = val 行为一致；如需其他语义（如累加），可改用 scatter_add_。

⚠️ 注意事项与最佳实践

索引合法性校验：上述方法不自动检查越界。建议在生产环境中添加断言：
```
assert indices.min() >= 0 and indices.max() < x.numel(), "Linear indices out of bounds"
```
空列表安全：列表推导式天然跳过空子列表（for j in [] 不执行），无需额外处理。
设备一致性：确保 indices 与 x 位于同一设备（如均在 CUDA 上）：
```
indices = indices.to(x.device)
```
性能对比：对于大张量（如 x.shape = (10000, 100)），该方法比 Python for 循环比快 10–100 倍（取决于 GPU 利用率）。

✅ 总结

方法	是否 in-place	是否需手动展平	适用场景
x.flatten()[indices] = val	✅ 是	✅ 是	简洁、高效、推荐首选
x.flatten().scatter_(0, indices, val).view_as(x)	✅ 是	✅ 是	需要 scatter 特性（如重复索引控制）

掌握线性索引映射技巧，是写出高性能 PyTorch 代码的关键一步——它让“动态每行索引”这一常见需求，从 O(n) 循环降为 O(1) 向量化操作。

PyTorch 内存占用远超模型参数量？细解训练时的真实显存需求与优化策略

如何在 PyTorch 中确保图像与掩码（mask）同步应用相同的数据增强变换

PyTorch中如何确保图像与掩码在数据增强时应用完全相同的随机变换

如何在 PyTorch 中确保图像与掩码同步应用数据增强变换

如何确保图像与掩码在 PyTorch 数据增强中应用完全相同的随机变换

相关标签:

pytorch for 循环 pytorch

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何使用 tkinter 实现每秒自动翻倍的整数显示下一篇：Python 压缩算法在不同数据上的实测对比

作者最新文章

如何使用 Byte Buddy 在 Java Agent 中动态修改类的父类

2026-02-14 09:51

如何在 Go 语言中将带时分秒的日期字符串转换为 Unix 时间戳（秒级）

2026-02-14 09:51

OpenCV Python 中精准检测图像直线的完整教程

2026-02-14 10:11

如何让锚点内的子元素（如按钮）脱离链接交互

2026-02-14 10:22

实现可重复拖拽的 JavaScript 拖放模板（不移除源元素）

2026-02-14 10:29

如何安全访问 React 中异步获取的嵌套 API 数据

2026-02-14 10:30

如何在 React 中实现卡片高度的动态自适应对齐

2026-02-14 10:35

jQuery 与 Go 后端交互时如何正确设置 JSON 请求头

2026-02-14 10:35

使用 NumPy 基于一维索引数组从两个同形 3D 数组中条件选择元素

2026-02-14 10:46

NumPy 中基于一维索引数组从两个三维数组中条件选择元素的正确方法

2026-02-14 10:47

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

445

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22