0

0

如何高效生成指定稀疏度的 PyTorch 二值张量

心靈之曲

心靈之曲

发布时间:2026-03-05 16:09:25

|

775人浏览过

|

来源于php中文网

原创

如何高效生成指定稀疏度的 PyTorch 二值张量

本文介绍一种高性能、低内存开销的方法,使用 torch.rand() 配合布尔比较快速生成指定比例(如 n%)为 1 的二值张量,相比手动索引填充提速数十倍且内存占用极低。

本文介绍一种高性能、低内存开销的方法,使用 torch.rand() 配合布尔比较快速生成指定比例(如 n%)为 1 的二值张量,相比手动索引填充提速数十倍且内存占用极低。

在深度学习与大规模实验中,常需构造具有精确稀疏度(例如 0.1%、5% 或 50%)的二值掩码张量(仅含 0 和 1),用于 dropout 模拟、结构化剪枝、随机采样或合成数据生成等场景。然而,原始实现中通过 torch.randperm 生成全排列再截取索引的方式存在严重性能瓶颈:对 (19000, 19000)(约 3.61 亿元素)张量,不仅耗时超 7 秒,更会峰值占用近 20 GB 显存——其根本原因在于 randperm(size) 需分配并排序一个长度为 size 的整数张量,时间复杂度为 O(n log n),空间复杂度为 O(n)。

更优解是概率化构造法:直接调用 torch.rand(shape) 生成均匀分布于 [0, 1) 的浮点张量,再与阈值 p = n / 100.0 做逐元素比较,结果自动转为 torch.bool,最后通过 .to(torch.float32) 或 .to(torch.int64) 转换为数值型二值张量。该方法具备三大优势:

  • O(n) 时间复杂度:仅一次随机数生成 + 一次广播比较,无排序、无索引寻址;
  • 显存友好:中间张量可被即时释放,实际峰值内存 ≈ 原始张量大小(而非 2× 或更高);
  • 天然支持任意设备与形状:torch.rand() 原生支持 device 参数,且 view()/reshape() 无需额外拷贝。

以下是推荐实现(含类型控制与设备适配):

OneStory
OneStory

OneStory 是一款创新的AI故事生成助手,用AI快速生成连续性、一致性的角色和故事。

下载
import torch

def create_sparse_binary_tensor(shape, sparsity_percent, device=None, dtype=torch.float32):
    """
    高效创建指定稀疏度的二值张量(1 的占比 ≈ sparsity_percent%)

    Args:
        shape (tuple): 输出张量形状,如 (19000, 19000)
        sparsity_percent (float): 1 所占百分比(0.0 ~ 100.0)
        device (torch.device, optional): 目标设备,默认为当前默认设备
        dtype (torch.dtype): 输出数据类型,如 torch.float32 或 torch.int64

    Returns:
        torch.Tensor: shape 形状的二值张量,dtype 指定类型
    """
    p = sparsity_percent / 100.0
    # 生成 [0,1) 均匀随机张量,并比较得到 bool 张量
    binary_bool = torch.rand(shape, device=device) < p
    return binary_bool.to(dtype)

# 示例:生成 19000×19000、50% 为 1 的 float32 张量(GPU 加速)
shape = (19000, 19000)
device = torch.device("cuda:2") if torch.cuda.is_available() else torch.device("cpu")
tensor = create_sparse_binary_tensor(shape, sparsity_percent=50.0, device=device, dtype=torch.float32)

print(f"Shape: {tensor.shape}, Device: {tensor.device}, Dtype: {tensor.dtype}")
print(f"Actual 1-ratio: {tensor.mean().item():.4f}")  # 理论期望值为 0.5,实测通常在 0.4999~0.5001

⚠️ 注意事项

  • 该方法生成的是期望比例(expectation),非严格精确比例。对于超大张量(如 >1e6 元素),统计波动极小(标准差 ≈ √(p(1−p)/N)),实际偏差通常小于 0.001%;若业务要求绝对精确计数(如必须恰好 int(N × p) 个 1),仍需 randperm 方案,但建议改用 torch.multinomial 或分块处理以降低内存压力;
  • 避免在 CPU 上对超大张量调用 torch.rand() 后立即 .to(device)——应始终在目标设备上直接生成,否则会触发主机内存→显存的冗余拷贝;
  • 如需复现实验结果,请在生成前设置全局随机种子:torch.manual_seed(42)(CPU)和 torch.cuda.manual_seed_all(42)(多卡 GPU)。

综上,torch.rand(shape) 0.8–1.2 秒内,显存峰值低于 3.8 GB,性能提升达 7× 以上,是工业级 PyTorch 工程的首选实践。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

930

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

603

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

212

2025.08.29

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

930

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

603

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

212

2025.08.29

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

2

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号