高效合并同键字典列表（PyTorch 张量值场景）

花韻仙語

发布时间：2026-03-10 16:40:23

798人浏览过

来源于php中文网

原创

高效合并同键字典列表（PyTorch 张量值场景）

本文介绍如何高效合并多个结构相同（键一致）、值为 PyTorch 张量的字典，替代手动遍历+defaultdict+torch.stack的冗余流程，推荐直接复用 torch.utils.data.default_collate——它专为此类结构化批量聚合而设计，简洁、健壮且性能更优。

本文介绍如何高效合并多个结构相同（键一致）、值为 pytorch 张量的字典，替代手动遍历+`defaultdict`+`torch.stack`的冗余流程，推荐直接复用 `torch.utils.data.default_collate`——它专为此类结构化批量聚合而设计，简洁、健壮且性能更优。

在 PyTorch 数据处理中，常需将一批样本（每个样本为一个键值映射字典，如 {'input_ids': tensor(...), 'attention_mask': tensor(...)}）合并为统一的批数据字典。传统做法是手动收集各键对应的张量列表，再逐个调用 torch.stack，代码冗长且易出错：

from collections import defaultdict
import torch

mention_inputs = defaultdict(list)
for idx in mention_indices:
    mention_input, _ = get_mention_sample(idx)  # 假设返回 dict[str, Tensor]
    for key, value in mention_input.items():
        mention_inputs[key].append(value)

# 合并为 batched dict: {key → (B, ...) tensor}
mention_inputs = {k: torch.stack(v) for k, v in mention_inputs.items()}

该方法虽可行，但存在明显缺陷：

Atoms.dev

AI创业智能体平台，通过多智能体系统实现业务自主构建与运营。

下载

需显式初始化 defaultdict 并双重循环；
若某键值非张量（如标量或嵌套结构），torch.stack 会报错，缺乏容错性；
未利用 PyTorch 内置的成熟批处理逻辑，重复造轮子。

✅ 更优解：直接使用 torch.utils.data.default_collate
该函数是 PyTorch DataLoader 的默认批合并器，专为“同结构字典/列表/元组的张量聚合”优化，支持自动递归处理嵌套结构、类型推断与形状对齐：

from torch.utils.data.dataloader import default_collate

# mention_indices 是 list[dict]，每个 dict 键相同、值为 shape-(D) 的 tensor
batched_dict = default_collate(mention_indices)
# 输出示例: {'input_ids': tensor(B, D), 'attention_mask': tensor(B, D)}

default_collate 的核心优势在于：
? 自动结构识别：检测输入是否为字典列表，并按键分组；
? 智能堆叠：对同键下所有张量执行 torch.stack(..., dim=0)；
? 扩展兼容：天然支持嵌套字典、列表、元组及混合类型（如 {'x': tensor, 'y': int} → 'y' 被转为 tensor([int1, int2, ...])）；
? 生产就绪：经大量训练场景验证，异常处理完善（如维度不一致时抛出清晰错误）。

⚠️ 注意事项：

所有字典必须键集合完全一致，缺失键会导致 KeyError；
同一键下的所有张量除 batch 维外形状必须严格相同（如 (D,)、(H, W)），否则 stack 失败；
若需自定义行为（如 padding 变长序列），应继承 default_collate 或实现专用 collate_fn，而非绕过它。

总结：在构建自定义数据流（如 mention-level 特征聚合）时，优先选用 default_collate 替代手写合并逻辑——它更简洁、更鲁棒、更符合 PyTorch 生态惯例，且零额外依赖。

PyTorch 中实现可微分的数组选择操作：从硬索引到软选择的完整指南

PyTorch 中实现可微分的张量选择：从硬索引到软选择的完整指南

如何在 PyTorch 中让梯度通过 torch.min 函数反向传播

如何在 PyTorch 中让梯度通过 torch.min 函数正确反向传播

PyTorch Geometric 中多图表示的分目录存储与加载实践

相关标签:

pytorch batch 递归 int 循环继承堆 padding pytorch

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Flask分页怎么做_query.paginate()生成分页对象与模板渲染下一篇：NumPy怎么两矩阵相乘_np.dot()与@运算符计算矩阵点积运算

作者最新文章

怎么在vscode中画3d图

2026-03-09 16:53

如何实现滚动到指定区域时触发动画线条效果

2026-03-09 17:18

索尼PC游戏卖不动玩家吐槽其发售晚价格贵质量不行

2026-03-09 17:36

如何在单页中正确结合 AJAX 与 PHP 实现无刷新用户名验证

2026-03-09 17:38

抖音爆款视频怎么拍？抖音怎么拍视频好看

2026-03-09 17:42

Go 标准库中解析 HTML 表单嵌套数组的实践与替代方案

2026-03-09 17:52

HTML中动态插入变量值的正确写法与常见错误解析

2026-03-09 17:53

vscode怎么一键改变量名

2026-03-09 17:56

Go 语言中如何在 switch 分支中动态创建符合接口的接收者实例

2026-03-09 17:58

如何在 Go 语言测试中正确模拟表单 POST 请求

2026-03-09 17:59

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1010

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

607

2024.08.29

c++怎么把double转成int

本专题整合了 c++ double相关教程，阅读专题下面的文章了解更多详细内容。

314

2025.08.29

C++中int的含义

本专题整合了C++中int相关内容，阅读专题下面的文章了解更多详细内容。

235

2025.08.29

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

441

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

603

2023.08.10

css中的padding属性作用

在CSS中，padding属性用于设置元素的内边距。想了解更多padding的相关内容，可以阅读本专题下面的文章。

175

2023.12.07

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

466

2024.05.29

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

热门下载

网站特效

网站源码

网站素材

前端模板