axis参数决定NumPy操作沿哪个维度进行并压缩该维度,axis=0表示沿行方向操作、压缩行维度,结果中行数消失;axis=1表示沿列方向操作、压缩列维度,结果中列数消失;高维同理,axis指明被“折叠”的维度,配合keepdims可保留维度,不同函数中axis含义依操作意图而定。

NumPy中的
axis参数,简单来说,就是你告诉NumPy函数,它应该沿着哪个维度去执行操作。它决定了在多维数组上,你的计算(比如求和、求平均、最大值等)是“横着来”还是“竖着来”,或者更抽象地说,是沿着哪个方向“压缩”数据。
解决方案
要真正理解
axis,我觉得最好的办法是把它想象成一个“被消除”或者“被折叠”的维度。当你指定
axis=0时,NumPy会沿着第一个维度(也就是行,如果你把它看作表格的话)进行操作,然后把这个维度“抹掉”,留下一个维度更少的数组。如果你的数组是二维的,
axis=0就是沿着列的方向进行计算,最终结果的行数会减少,甚至只剩一行(或者说,这个维度消失了)。同理,
axis=1就是沿着第二个维度(列)进行操作,最终结果的列数会减少。
我个人在刚接触的时候,总是会把
axis=0和“行”混淆,觉得它应该作用于行。但实际上,它指的是沿着第一个维度(行)进行操作,然后这个维度会“消失”。比如,一个
m x n的矩阵,对
axis=0求和,会得到一个长度为
n的向量,因为它把
m行的数据沿着每一列加起来了。反过来,对
axis=1求和,会得到一个长度为
m的向量,因为它把
n列的数据沿着每一行加起来了。
这对于更高维的数组来说就更有意思了。想象一个三维数组,它有深度、行、列三个维度。
axis=0就意味着你会把“深度”这个维度压缩掉,留下一个二维的平面;
axis=1就是压缩“行”,留下一个由深度和列组成的平面;
axis=2自然就是压缩“列”了。关键在于,你是在告诉NumPy,“请你把数据沿着这个方向整合起来”。
立即学习“Python免费学习笔记(深入)”;
NumPy中axis参数如何影响数组操作?
axis参数对NumPy数组操作的影响是根本性的,它直接决定了输出数组的形状和内容。最直观的例子就是聚合函数,比如
np.sum()、
np.mean()、
np.max()等等。
当我们有一个二维数组
arr = np.array([[1, 2, 3], [4, 5, 6]]):
np.sum(arr)
:不指定axis
,NumPy会把整个数组的所有元素加起来,得到一个标量值(1+2+3+4+5+6 = 21)。这种情况下,你可以认为所有维度都被“压平”了。np.sum(arr, axis=0)
:这会沿着第一个维度(行)进行求和。它会把[1, 2, 3]
和[4, 5, 6]
中对应位置的元素相加,结果是[1+4, 2+5, 3+6]
,也就是[5, 7, 9]
。你看,原始数组是(2, 3)
,结果是(3,)
,第一个维度消失了。np.sum(arr, axis=1)
:这会沿着第二个维度(列)进行求和。它会把[1, 2, 3]
加起来得到6
,把[4, 5, 6]
加起来得到15
,结果是[6, 15]
。原始数组是(2, 3)
,结果是(2,)
,第二个维度消失了。
再举个三维的例子,
arr_3d = np.arange(1, 28).reshape(3, 3, 3):
arr_3d.sum(axis=0)
:结果会是一个(3, 3)
的数组。它把沿着第一个维度(深度)的3个(3, 3)
切片对应位置的元素加起来了。arr_3d.sum(axis=1)
:结果也会是一个(3, 3)
的数组。它把沿着第二个维度(行)的元素加起来。arr_3d.sum(axis=2)
:结果同样是一个(3, 3)
的数组。它把沿着第三个维度(列)的元素加起来。
这里的核心逻辑是,
axis参数指向的那个维度,在计算完成后,通常会从结果数组的形状中被移除。如果你希望保留这个被操作的维度,只是让它的大小变为1,可以使用
keepdims=True参数,这在进行广播操作时非常有用。
import numpy as np
arr_2d = np.array([[1, 2, 3],
[4, 5, 6]])
print("原始数组:\n", arr_2d)
print("axis=0 求和:", np.sum(arr_2d, axis=0)) # 输出: [5 7 9]
print("axis=1 求和:", np.sum(arr_2d, axis=1)) # 输出: [ 6 15]
print("axis=0 求和并保留维度:", np.sum(arr_2d, axis=0, keepdims=True)) # 输出: [[5 7 9]] (形状 (1, 3))理解NumPy中axis参数的常见误区与实用技巧
我在实际使用中发现,大家对
axis参数最常见的误区就是把它和“行/列”这个概念死死绑定。对于二维数组,
axis=0对应列操作,
axis=1对应行操作,这好像还挺直观。但一旦数组维度超过2,这种简单的映射就失效了,或者说变得不那么直观了。
常见误区:
-
axis=0
总是指行,axis=1
总是指列。 这种说法不完全准确。axis=0
是第一个维度,axis=1
是第二个维度。在Python中,数组的第一个维度通常是“行”的概念(在2D中),但更高维时,它就是最外层的那个“块”或者“层”。 -
axis
指的是保留的维度。 恰恰相反,axis
通常指的是被操作并被“压缩”或“消除”的那个维度。 -
对
axis
的理解过于依赖可视化。 我们可以通过二维图来想象,但对于三维甚至更高维,单纯的视觉想象会变得非常困难,甚至误导。
实用技巧:
-
“想象维度索引”法: 把数组的
shape
看作一个索引列表,比如(d0, d1, d2, ...)
。当你指定axis=i
时,就是告诉NumPy,对d_i
这个维度进行操作,并最终移除它。arr.shape = (3, 4, 5)
np.sum(arr, axis=0)
结果shape
将是(4, 5)
。np.sum(arr, axis=1)
结果shape
将是(3, 5)
。np.sum(arr, axis=2)
结果shape
将是(3, 4)
。 记住,axis
指向的那个索引位置会从结果的shape
中消失。
-
利用
keepdims=True
进行广播: 当你对一个维度进行操作后,该维度通常会消失。但在某些情况下,你希望它仍然存在,只是大小变为1,这样可以方便地与原始数组进行广播操作。arr = np.array([[1, 2], [3, 4]]) col_sum = np.sum(arr, axis=0, keepdims=True) # [[4, 6]],形状 (1, 2) # 现在 col_sum 可以直接和 arr 进行广播操作,例如 arr / col_sum print(arr / col_sum) # [[0.25 0.333] # [0.75 0.666]]
如果没有
keepdims=True
,np.sum(arr, axis=0)
会得到[4, 6]
,形状是(2,)
,直接除会报错或得到意想不到的结果,因为广播规则不同。 -
多维度操作:
axis
参数也可以接受一个元组,例如axis=(0, 2)
。这意味着NumPy会同时沿着第0个和第2个维度进行操作并将其消除。arr_3d = np.arange(1, 28).reshape(3, 3, 3) # 对 axis=0 和 axis=2 同时求和 result = np.sum(arr_3d, axis=(0, 2)) print("arr_3d shape:", arr_3d.shape) # (3, 3, 3) print("sum(axis=(0, 2)) result:", result) # [42 51 60] print("result shape:", result.shape) # (3,) # 原始的 (3, 3, 3) 经过 axis=(0, 2) 聚合,只剩下中间的维度 (3,)这在处理复杂数据时,能让你一次性完成多个维度的聚合,非常高效。
不同NumPy函数对axis参数的处理有何异同?
虽然
axis参数的核心概念——指定操作维度并通常消除该维度——在NumPy中是通用的,但不同的函数在处理
axis时,其行为的“目的”和“结果”上还是有些微妙的差异。
1. 聚合/归约函数 (Reduction Functions):sum()
, mean()
, max()
, min()
, std()
, argmax()
, argmin()
等
这类函数是
axis参数最常见的应用场景。它们的目标是将一个或多个维度的数据聚合、归约成一个更小的结果(通常是标量或维度更少的数组)。
-
共同点:
axis
参数指定了要被聚合的维度。这些维度在结果数组的形状中通常会消失。 -
差异点:
argmax()
和argmin()
返回的是索引,而不是聚合后的值。它们返回的是沿着指定轴上的最大/最小值所在的索引。np.percentile()
或np.quantile()
允许你指定百分位数,其axis
行为与sum()
类似。np.apply_along_axis()
允许你将任意函数应用到指定轴上,这提供了极大的灵活性,但其内部处理axis
的方式也是沿着该轴切片并应用函数。
2. 维度操作函数:concatenate()
, stack()
, split()
, swapaxes()
, transpose()
等
这类函数不一定是为了“聚合”数据,而是为了“重塑”、“组合”或“拆分”数组的维度。
axis在这里扮演的角色是指定“在哪里”或“如何”进行这些维度操作。
-
np.concatenate(arrays, axis=0)
: 沿着一个现有的轴来连接数组。所有数组除了连接轴之外的其他轴的长度必须相同。axis
指定的是连接后不改变的那个轴,或者说,连接操作是沿着这个轴进行的。a = np.array([[1, 2], [3, 4]]) # shape (2, 2) b = np.array([[5, 6], [7, 8]]) # shape (2, 2) np.concatenate((a, b), axis=0) # [[1, 2], # [3, 4], # [5, 6], # [7, 8]] # shape (4, 2) - 沿着 axis=0 连接,axis=1 保持不变
-
np.stack(arrays, axis=0)
: 与concatenate
不同,stack
会沿着一个新创建的轴来堆叠数组。axis
参数指定新轴插入的位置。a = np.array([1, 2]) # shape (2,) b = np.array([3, 4]) # shape (2,) np.stack((a, b), axis=0) # [[1, 2], # [3, 4]] # shape (2, 2) - 在最前面插入一个新轴 np.stack((a, b), axis=1) # [[1, 3], # [2, 4]] # shape (2, 2) - 在第二个位置插入一个新轴
-
np.split(ary, indices_or_sections, axis=0)
: 沿着指定的轴将数组分割成多个子数组。axis
指定了分割发生在哪一个维度上。 -
np.swapaxes(arr, axis1, axis2)
: 这个函数比较特殊,它不是消除维度,而是交换两个指定维度的位置。axis1
和axis2
就是那两个要被交换的维度索引。 -
np.transpose(arr, axes=None)
: 这是一个更通用的维度重排函数。当axes=None
时,它会反转所有维度的顺序。你也可以提供一个元组来精确指定新维度顺序。
所以,虽然都叫
axis,但在不同函数语境下,它可能代表着“要被压缩的维度”、“要进行连接的维度”、“要插入新维度的位置”,或者是“要被交换的维度”。理解其背后操作的“意图”,比死记硬背哪个数字对应哪个方向要重要得多。











