NumPy花式索引需遵循广播规则,取不规则行列交叉点应使用np.ix_();布尔索引会自动展平结果,要保留结构需配合np.where();take()比高级索引更安全可控。

用 arr[rows, cols] 一次性取多行多列,不是嵌套索引
很多人写 arr[[0,2], [1,3]] 想取第0行第1列、第2行第3列,结果报错或取错——这是把“行列组合”当成了“行列分别切片”。NumPy 花式索引的广播规则在这里起作用:rows 和 cols 必须形状兼容。想取不规则行列交叉点,得用 np.ix_() 包一层。
-
arr[[0,2], [1,3]]实际取的是 (0,1) 和 (2,3) 两个标量(前提是两数组等长) - 想取第0、2行 × 第1、3列共4个元素?写成
arr[np.ix_([0,2], [1,3])] - 直接写
arr[[0,2]][:,[1,3]]看似可行,但会先拷贝整行再切列,内存和性能双浪费
布尔数组索引时,arr[bool_mask] 只展平一维,别指望保留原结构
当你用 arr > 5 得到一个二维布尔数组,再用它索引 arr[arr > 5],返回的是所有满足条件的值拼成的一维 ndarray,不是子矩阵。要保留行列关系,必须配合 np.where() 或显式构造坐标。
- 错误直觉:以为
arr[arr > 5]会返回带空位的原形状数组 —— 实际不会,NumPy 不支持稀疏索引语义 - 想提取满足条件的行列坐标?用
np.where(arr > 5)得到(row_indices, col_indices)元组 - 要按原位置填回新数组?得用
result = np.full_like(arr, np.nan); result[row_idx, col_idx] = values
take() 和高级索引的区别:前者不支持跨轴混合索引,但更安全
np.take(arr, indices, axis=1) 是专为单轴设计的,它不会触发花式索引的广播/维度扩展逻辑,因此行为更可预测。而 arr[:, [0,2]] 这种写法虽然简洁,但在某些 reshape 或 view 场景下可能意外创建副本。
-
arr.take([0,2], axis=1)严格只作用于 axis=1,且保证返回视图(只要原数组是 C 连续) -
arr[:, [0,2]]在底层仍走花式索引路径,若arr是 F 连续或有非标准 strides,可能被迫拷贝 - 需要链式操作如 “取列→取行→再取列”?优先拆成多次
take(),比堆叠arr[[...], [...]]更易 debug
传入空列表或全 False 布尔数组时,arr[[]] 返回空数组,但 shape 可能出人意料
空索引不是语法错误,但返回的 shape 容易踩坑:比如 arr = np.ones((3,4)); arr[[]] 返回 shape=(0,4),而 arr[:, []] 返回 shape=(3,0)。更隐蔽的是 arr[np.array([]), np.array([])] 直接报 IndexError: arrays used as indices must be of integer (or boolean) type。
- 空整数列表
[]是合法索引,对应 0 个元素;空布尔数组np.array([])不是布尔索引,而是整数索引失败 - 判断是否为空再索引?不如提前用
if len(indices): result = arr[indices],避免运行时异常 - 在函数中接受用户传入的索引参数时,务必检查
len(indices) == 0的边界分支,别依赖默认行为









