0

0

使用 NumPy 解决带线性约束的线性方程组

碧海醫心

碧海醫心

发布时间:2025-09-30 15:35:03

|

361人浏览过

|

来源于php中文网

原创

使用 numpy 解决带线性约束的线性方程组

本文介绍如何利用 NumPy 库高效解决具有线性等式约束的线性方程组 AX=b。通过将原始方程组与线性约束方程合并,形成一个增广系统,然后使用 np.linalg.lstsq 函数求解,可以同时满足原始方程和所有线性约束,获得精确或最佳的最小二乘解。

1. 引言:带约束的线性系统求解挑战

线性方程组 AX=b 在科学计算、工程、统计学等领域无处不在。然而,在许多实际应用中,解向量 X 往往需要满足额外的条件,即线性等式约束。例如,某些变量的和必须为零,或者某些变量之间存在固定的比例关系。

当 X 向量受到这些线性等式约束时,直接求解 AX=b 变得复杂。常见的误区是尝试将约束作为优化问题的惩罚项或使用通用非线性优化器(如 scipy.optimize.minimize),但这可能导致解在满足约束的同时,无法精确满足原始方程 AX=b。本文将介绍一种更直接、更高效的方法,通过构建增广系统并利用 NumPy 的 np.linalg.lstsq 函数来解决这类问题。

2. 线性等式约束的数学表达

假设我们有一个原始的线性方程组 A X = b,其中 A 是一个 m x n 的系数矩阵,X 是一个 n x 1 的未知向量,b 是一个 m x 1 的常数向量。

同时,我们有 k 个线性等式约束,它们可以被表示为 C X = d,其中 C 是一个 k x n 的约束矩阵,d 是一个 k x 1 的常数向量。

示例: 假设 X = [x1, y1, x2, y2, x3, y3, x4, y4] 是一个 8x1 的向量。 给定以下三个约束:

  1. 0.5 * (y1 + y2) = 0
  2. 0.5 * (x3 + x4) = 0
  3. 0.5 * (y3 + y4) = 0

我们可以将这些约束转化为矩阵 C 和向量 d 的形式。

  • 对于约束 1:0.5 * x[1] + 0.5 * x[3] = 0 (注意,这里 x[1] 和 x[3] 指的是 X 向量中的第二个和第四个元素,即 y1 和 y2)。 对应的 C 行将是 [0, 0.5, 0, 0.5, 0, 0, 0, 0],d 的对应元素是 0。
  • 对于约束 2:0.5 * x[4] + 0.5 * x[6] = 0 (对应 x3 和 x4)。 对应的 C 行将是 [0, 0, 0, 0, 0.5, 0, 0.5, 0],d 的对应元素是 0。
  • 对于约束 3:0.5 * x[5] + 0.5 * x[7] = 0 (对应 y3 和 y4)。 对应的 C 行将是 [0, 0, 0, 0, 0, 0.5, 0, 0.5],d 的对应元素是 0。

因此,我们可以构建约束矩阵 AC (对应 C) 和约束向量 bC (对应 d):

import numpy as np

# 假设 A 和 b 已定义
A = np.array([
    [-261.60,  11.26,      0.0,    0.0,     0.0,    0.0,     0.0,    0.0],
    [   4.07, -12.75,      0.0,    0.0,     0.0,    0.0,     0.0,    0.0],
    [    0.0,    0.0,  -158.63,  -5.65,     0.0,    0.0,     0.0,    0.0],
    [    0.0,    0.0,    -2.81, -12.14,     0.0,    0.0,     0.0,    0.0],
    [    0.0,    0.0,      0.0,    0.0, -265.99,  19.29,     0.0,    0.0],
    [    0.0,    0.0,      0.0,    0.0,   12.59, -12.34,     0.0,    0.0],
    [    0.0,    0.0,      0.0,    0.0,     0.0,    0.0, -166.25, -12.63],
    [    0.0,    0.0,      0.0,    0.0,     0.0,    0.0,   -8.40, -11.14]
])

b = np.array([
     -6.95,
     16.35,
     -0.96,
     16.35,
     19.19,
    -15.85,
    -12.36,
    -15.63]).reshape(-1, 1)

# 构建约束矩阵 AC 和约束向量 bC
AC = np.zeros([3, A.shape[1]]) # 3个约束,X有8个变量
bC = np.zeros((3, 1))

# 0.5 * (y1 + y2) = 0  => x[1] 和 x[3]
AC[0, [1, 3]] = 0.5 
# 0.5 * (x3 + x4) = 0  => x[4] 和 x[6]
AC[1, [4, 6]] = 0.5 
# 0.5 * (y3 + y4) = 0  => x[5] 和 x[7]
AC[2, [5, 7]] = 0.5 

print("约束矩阵 AC:\n", AC)
print("约束向量 bC:\n", bC)

3. 构建增广系统

为了同时解决原始方程组和所有线性等式约束,我们可以将它们合并成一个更大的、增广的线性系统。这个增广系统可以表示为:

$$ \begin{bmatrix} A \ C \end{bmatrix} X = \begin{bmatrix} b \ d \end{bmatrix} $$

或者简化为 A_aug X = b_aug,其中:

  • A_aug 是通过垂直堆叠 A 和 C 得到的矩阵。
  • b_aug 是通过垂直堆叠 b 和 d 得到的向量。

任何满足 A_aug X = b_aug 的向量 X 都将同时满足原始方程 A X = b 和所有线性等式约束 C X = d。

在 NumPy 中,可以使用 np.vstack 函数来实现矩阵和向量的垂直堆叠:

# 堆叠原始矩阵 A 和约束矩阵 AC
A_augmented = np.vstack([A, AC])

# 堆叠原始向量 b 和约束向量 bC
b_augmented = np.vstack([b, bC])

print("\n增广矩阵 A_augmented 的形状:", A_augmented.shape)
print("增广向量 b_augmented 的形状:", b_augmented.shape)

此时,A_augmented 的形状将是 (m+k) x n,b_augmented 的形状将是 (m+k) x 1。

Giiso写作机器人
Giiso写作机器人

Giiso写作机器人,让写作更简单

下载

4. 使用 NumPy 的 lstsq 求解

np.linalg.lstsq 函数是 NumPy 库中用于求解线性最小二乘问题的核心工具。它寻找一个向量 X,使得 ||A_aug X - b_aug||^2 最小。

  • 如果增广系统 A_aug X = b_aug 是精确可解的(即存在唯一解或无穷多解),lstsq 将找到一个精确解。
  • 如果系统是超定的(方程数多于未知数)但一致的,它也能找到精确解。
  • 如果系统是不一致的(无精确解),lstsq 将找到一个“最佳”近似解,即残差平方和最小的解。

对于我们构建的增广系统,lstsq 将直接找到一个 X,它在满足所有线性等式约束的同时,也尽可能地满足原始方程 A X = b。如果原始系统与约束本身是兼容的,它将找到一个精确解。

代码示例:

# 使用 np.linalg.lstsq 求解增广系统
x_solution, residuals, rank, singular_values = np.linalg.lstsq(A_augmented, b_augmented, rcond=None)

print("\n求解得到的 X 向量:\n", x_solution)

rcond=None 参数是推荐的用法,它使用机器精度来确定奇异值的阈值,而不是默认的固定值,这有助于提高数值稳定性。

5. 结果验证与分析

求解得到 x_solution 后,我们应该验证它是否同时满足原始方程和所有约束。

验证原始方程 A X = b:

# 检查是否满足原始方程 A X = b
b_predicted = np.matmul(A, x_solution)
print("\n原始方程左侧 (A * X_solution):\n", b_predicted)
print("原始方程右侧 (b):\n", b)

# 计算残差
original_equation_residuals = b_predicted - b
print("\n原始方程残差:\n", original_equation_residuals)
print("原始方程残差的L2范数:", np.linalg.norm(original_equation_residuals))

验证线性等式约束 C X = d:

# 检查是否满足约束 C X = d
constraints_satisfied = np.matmul(AC, x_solution)
print("\n约束左侧 (AC * X_solution):\n", constraints_satisfied)
print("约束右侧 (bC):\n", bC)

# 计算约束残差
constraint_residuals = constraints_satisfied - bC
print("\n约束残差:\n", constraint_residuals)
print("约束残差的L2范数:", np.linalg.norm(constraint_residuals))

通过观察残差是否接近于零,我们可以判断解的质量。对于线性等式约束,通常期望约束残差非常接近零(在浮点精度范围内)。

6. 注意事项与最佳实践

  • 约束类型: 此方法专门适用于线性等式约束。对于线性不等式约束(例如 CX >= d)或非线性约束,np.linalg.lstsq 不适用。在这种情况下,需要使用更通用的优化库,如 SciPy 的 scipy.optimize.linprog(用于线性规划)或 scipy.optimize.minimize(配合适当的方法,如 SLSQP 或 COBYLA)。
  • 系统一致性: np.linalg.lstsq 总是会返回一个解。如果原始方程组与约束之间存在内在矛盾,导致系统不一致,lstsq 将找到一个使所有方程(包括原始方程和约束方程)的残差平方和最小的“妥协”解。用户需要理解这一点,并根据实际问题判断解的合理性。
  • 数值稳定性: np.linalg.lstsq 内部通常采用奇异值分解 (SVD) 等数值稳定的方法。rcond 参数对于处理病态或秩亏的系统非常有用,可以帮助避免数值问题。
  • 大型稀疏系统: 对于非常大且稀疏的矩阵 A 和 C,np.linalg.lstsq 可能不是最高效的选择,因为它会生成一个稠密的增广矩阵。在这种情况下,可以考虑使用 SciPy 的稀疏线性代数模块 (scipy.sparse.linalg) 中的迭代求解器,例如 lsmr 或 least_squares,它们可以利用矩阵的稀疏性。

7. 总结

通过将原始线性方程组 AX=b 与线性等式约束 CX=d 合并成一个增广系统 A_aug X = b_aug,并利用 NumPy 的 np.linalg.lstsq 函数,我们可以高效且准确地求解带线性等式约束的线性系统。这种方法简洁、直接,能够同时满足原始方程和所有约束,是处理这类问题的强大工具。理解其背后的最小二乘原理和适用范围,将有助于在实际应用中做出正确的选择。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

448

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

88

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

272

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6.1万人学习

ASP 教程
ASP 教程

共34课时 | 5.9万人学习

Vue3.x 工具篇--十天技能课堂
Vue3.x 工具篇--十天技能课堂

共26课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号