np.diag() 一维输入生成对角矩阵,二维输入提取主对角线;误传二维数组易得错误结果;需偏移用k参数;dtype不自动继承;np.diagflat()先展平再构造,更鲁棒;大矩阵应避免显式构造以节省内存。

用 np.diag() 从一维数组生成对角矩阵
直接传入一维数组,np.diag() 就会把它铺到主对角线上,其余位置自动填 0。这是最常用、也最不容易出错的生成方式。
常见错误是误传二维数组——比如想用 [1,2,3] 生成 3×3 对角阵,却写了 np.diag([[1,2,3]]),结果得到的是 1×1 矩阵(因为 np.diag() 对二维输入默认提取主对角线)。
- 正确写法:
np.diag([1, 2, 3])→ 返回 shape=(3, 3) 的对角矩阵 - 如果需要指定偏移量(比如上/下一条对角线),加
k参数:np.diag([1,2], k=1)把数组放在第一超对角线 -
dtype不会自动继承原数组类型:np.diag([1,2], dtype=np.float32)才能得到 float32 类型结果,否则默认是 int64 或 float64
用 np.diag() 提取二维数组的对角线
传入二维数组时,np.diag() 行为完全相反:它不生成矩阵,而是抽出主对角线元素,返回一维 ndarray。
容易踩的坑是以为它能“提取任意对角线”或“保持二维形状”。实际上它只抽元素,不保留维度;而且对非方阵也有效(比如 4×3 矩阵会抽前 3 个对角元)。
- 输入
np.array([[1,2,3],[4,5,6]])→ 输出[1, 5](长度为 min(2,3)=2) - 想抽第 k 条对角线?同样用
k参数:np.diag(arr, k=-1)抽次对角线 - 注意:提取操作不检查输入是否为
ndarray,但若传入 Python list 嵌套,会先尝试转成数组,可能隐式触发类型转换
np.diagflat() 和 np.diag() 的关键区别
当输入不是严格一维(比如嵌套 list、多维数组、标量),np.diagflat() 会先把它展平成一维,再铺成对角矩阵;而 np.diag() 遇到非一维输入就直接提取对角线。
这个差异在处理用户输入或中间计算结果时特别关键——你不确定数据维度时,np.diagflat() 更鲁棒。
-
np.diag([[1,2]])→[1](提取对角线) -
np.diagflat([[1,2]])→[[1,0],[0,2]](先展平成[1,2],再生成对角阵) -
np.diagflat(5)→[[5]](标量也被接受) - 性能上,
np.diagflat()多一次展平开销,但对小数组可忽略
生成大对角矩阵时的内存与类型陷阱
用 np.diag() 生成大型对角阵(比如 size=10000)看似方便,但实际会分配完整 (n,n) 内存,不是稀疏结构。如果你后续只做向量乘法或求逆,这很浪费。
真正该用对角矩阵的场景,往往该换思路:用一维数组 + 专用函数代替显式构造二维阵。
- 矩阵乘法:
diag_vec * X.T(逐行缩放)比np.diag(diag_vec) @ X快一个数量级且省内存 - 求逆:直接
1 / diag_vec,别算np.linalg.inv(np.diag(...)) - 如果必须传给要求
ndarray的库(如某些 SciPy 函数),再考虑np.diag(),否则优先保持一维形式
类型方面,整数数组生成的对角阵默认是 int64,但参与浮点运算时会悄悄提升类型;如果确定全程用 float,初始化就用 np.diag(np.float32([1,2,3])),避免隐式复制和类型推导开销。










