0

0

高效填充 NumPy 数组中的零值位置:向量化实现无循环批量赋值

心靈之曲

心靈之曲

发布时间:2026-02-27 21:06:11

|

182人浏览过

|

来源于php中文网

原创

高效填充 NumPy 数组中的零值位置:向量化实现无循环批量赋值

本文介绍一种纯 numpy 向量化方法,将源数组 y 中每行的非零元素,按顺序填入目标数组 x 每行最靠前的零值位置,全程避免 python 循环,适用于大规模矩阵(如 5000×20000)高频操作。

本文介绍一种纯 numpy 向量化方法,将源数组 y 中每行的非零元素,按顺序填入目标数组 x 每行最靠前的零值位置,全程避免 python 循环,适用于大规模矩阵(如 5000×20000)高频操作。

在科学计算与数据预处理中,常需将一个数组的“有效值”精准注入另一个数组的空白槽位(即零值位置),且要求严格保持行内顺序与位置优先级。典型场景包括稀疏特征对齐、掩码填充、增量更新等。当矩阵规模达万级行列且操作频次极高时,Python 显式循环会成为严重性能瓶颈。本文提供一种完全向量化、无 for 循环、内存友好的 NumPy 实现方案。

核心思路:布尔索引 + 累计计数定位

关键在于两点:

Tago AI
Tago AI

AI生成带货视频,专为电商卖货而生

下载
  • 识别“空位”:X == 0 得到布尔掩码 i1,标记所有可写入位置;
  • 定位“前 kᵢ 个空位”:利用 i1.cumsum(1) 对每行从左到右累计零值个数,再与每行非零元数量 i2.sum(1, keepdims=True) 比较,构造精确写入掩码。

具体逻辑如下:

  1. i1 = X == 0:获取 X 中所有零值位置;
  2. i2 = Y != 0:获取 Y 中所有非零值位置(即待复制的元素);
  3. i2.sum(1, keepdims=True):计算每行 Y 的非零元素个数 k_i,保持列维度;
  4. i1.cumsum(1)
  5. 最终掩码 (i1.cumsum(1)
  6. Y[i2] 按行优先顺序拉平所有非零元素,恰好与目标位置一一对应(NumPy 高级索引的扁平化规则保障此一致性)。

完整实现与示例

import numpy as np

def fill_empty_np(X: np.ndarray, Y: np.ndarray) -> None:
    """
    将 Y 中每行的非零元素,依次填入 X 中对应行最左侧的零值位置。

    要求:X.shape == Y.shape,且对每行 i,X[i] 中零的个数 >= Y[i] 中非零个数。
    原地修改 X,不返回新数组。
    """
    i1 = X == 0
    i2 = Y != 0
    # 构造写入掩码:仅在 X 的零位中,且是前 k_i 个零位的位置赋值
    mask = (i1.cumsum(axis=1) <= i2.sum(axis=1, keepdims=True)) & i1
    X[mask] = Y[i2]  # Y[i2] 自动展平,与 mask 中 True 位置按行优先顺序对齐

# 示例验证
X = np.array([[1, 0, 1, 1, 0],
              [1, 0, 0, 1, 1],
              [1, 0, 0, 0, 0]])

Y = np.array([[0, 0, 2, 0, 0],
              [0, 0, 0, 2, 2],
              [2, 0, 2, 2, 0]])

fill_empty_np(X, Y)
print(X)
# 输出:
# [[1 2 1 1 0]
#  [1 2 2 1 1]
#  [1 2 2 2 0]]

注意事项与性能提示

  • 严格形状匹配:X 与 Y 必须同形,否则 cumsum 和 sum(..., keepdims=True) 广播失败;
  • 容量保证:算法不校验 X 每行零位是否足够 —— 若 m_i
  • ⚠️ 内存开销:生成多个临时布尔/整型数组(i1, i2, cumsum, mask),对超大矩阵(如 5000×20000)可能占用数 GB 内存;若内存受限,建议分块处理或改用 Numba(如答案中提及);
  • 性能对比:该方案比纯 Python 循环快 10–100 倍,但比 Numba JIT 编译版本慢约 2–5 倍(因未短路、全量计算);如追求极致性能且可引入额外依赖,推荐搭配 @njit(parallel=True) 重写;
  • ? 不可逆操作:函数原地修改 X;如需保留原始 X,调用前使用 X_copy = X.copy()。

掌握此模式,你不仅能高效解决当前问题,更能迁移应用于各类“按条件定位+批量赋值”的 NumPy 工程场景。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

479

2023.08.14

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

2

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

1

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

0

2026.02.27

漫蛙app官网链接入口
漫蛙app官网链接入口

漫蛙App官网提供多条稳定入口,包括 https://manwa.me、https

55

2026.02.27

deepseek在线提问
deepseek在线提问

本合集汇总了DeepSeek在线提问技巧与免登录使用入口,助你快速上手AI对话、写作、分析等功能。阅读专题下面的文章了解更多详细内容。

4

2026.02.27

AO3官网直接进入
AO3官网直接进入

AO3官网最新入口合集,汇总2026年可用官方及镜像链接,助你快速稳定访问Archive of Our Own平台。阅读专题下面的文章了解更多详细内容。

48

2026.02.27

php框架基础教程
php框架基础教程

本合集涵盖2026年最新PHP框架入门知识与基础教程,适合初学者快速掌握主流框架核心概念与使用方法。阅读专题下面的文章了解更多详细内容。

1

2026.02.27

php框架怎么用
php框架怎么用

本合集专为零基础学习者打造,系统介绍主流PHP框架的安装、配置与基础用法,助你快速入门Web开发。阅读专题下面的文章了解更多详细内容。

4

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号