首页/文章/ 详情

一篇文章入门大规模线性方程组求解

2年前浏览2604

前面介绍过主要的线性方程组求解库,参考附录。求解大规模线性方程组是仿真软件求解器的底层技术,求解器时间基本都消耗在方程组求解上。线性方程组的解法比较成熟,方法也有很多,而且不同的方法对应不同类型方程组,所以在方法选择上实际很讲究。


商业软件通常将方法封装起来,用户包括开发人员都接触不到线性方程组求解方法。商业软件内部一般会根据求解规模,求解类型等选择合适的线性方程组求解方法。


有些商业软件开放了部分接口供用户选择;开源软件比如OpenFOAM,以及使用开源软件的平台Simscale等提供了许多选项供用户选择。


本文简单介绍下线性方程组的常用解法。通常将线性方程组表示为:

A*x=b


A为已知N*N的矩阵,通常称为刚度矩阵(刚度是力学中的概念,电磁,热等也习惯性这么称呼),b为已知向量,x为待求向量。解线性方程组的操作基本围绕矩阵A展开。

首先介绍一些相关术语:

1.矩阵条件数

条件数是一个表征矩阵稳定特性的标志,条件数越大,说明矩阵越不稳定,即当矩阵中数据出现微小变化时,x结果变化非常大。Matlab中可直接使用命令cond(A)查看矩阵条件数。


2.满秩矩阵

用初等行变换将矩阵A化为阶梯形矩阵, 矩阵中非零行的个数就定义为这个矩阵的秩,记做r(A)


即如果矩阵A为N*N,r(A)=N,则矩阵A为满秩矩阵


在边界元,矩量法等计算方法中,最终形成的A为满秩矩阵。


3.稀疏矩阵

矩阵中绝大部分元素都是0


4.对称矩阵

矩阵的上三角和下三角关于对角线对称


5.求解线性方程组直接法

先求出矩阵A的逆矩阵,再乘以向量b


6.求解线性方程组迭代法

简单讲,就是给出一个初始解x',带入原方程中,每次评价差距逐步修正,直到最终A*x'-b 接近0为止。


7. OOC(out of core)

对于大型方程组,内存通常无法装下,在求解过程中需要将部分数据写到硬盘上,再次使用的时候再读回来。


常用直接法:

直接法的本质是要计算出A的逆矩阵,通常在求解小规模和特征值问题是可以考虑使用直接法。

1. 高斯消去法/Doolittle /三角分解法/追赶法

这是最基本的方法,时间复杂度和空间复杂度都是N的三次方,软件一般都不会使用。


2. 矩阵分解相关

2. 1.LU分解法

LU分解就是将矩阵分解成单位下三角矩阵L和上三角矩阵U,本质上仍然属于高斯消去法

2.2. Cholesky分解 

Cholesky 分解是把一个对称正定的矩阵表示成一个下三角矩阵L和其转置的乘积的分解。如果矩阵是正定的,使用 Cholesky分解会比LU分解更加高效。

2.3. LDLT分解法

Cholesky 分解法的改进

2.4.QR分解

QR分解是把矩阵分解成一个正交矩阵与一个上三角矩阵的积。

2.5. Schur分解

2.6. SVD/GSVD

奇异值分解/一般奇异值分解


在求解大规模线性方程组中,一般不会使用直接法求解,但在使用迭代法过程中需要使用直接法中的方法加工数据。

间接法的本质是迭代,不同方法的区别在于如何选取初始值以及迭代方法。


1. 牛顿迭代,Jacobi(雅克比)迭代,Gauss-Seidel迭代

线性迭代方法,一般情况下收敛太慢,大规模方程组不推荐使用。

2. JOR -- Jacobi Over Relaxation

Jacobi 方法加入松弛因子

3. Lanczos方法

适用于稀疏矩阵特征值问题


4. 共轭梯度方法以及改进方法

共轭梯度法 

Conjugate gradient method--CG


双共轭梯度法

Bi-conjugate gradient method--BCG


稳定双共轭梯度法

Bi-conjugate gradient stabilized method--GCGS


预条件共轭梯度法

Preconditioned gradient stabilized method--PCG


相比牛顿和Jacobi,通过优化使其共轭的求解向量和方向,加速了求解性能。

共轭梯度法的思想就是找到N个两两共轭的方向,每次沿着一个方向优化得到该方向上的极小值,后面再沿其它方向求极小值的时候,不会影响前面已经得到的沿哪些方向上的极小值,所以理论上对n个方向都求出极小值就得到了N维问题的极小值。


5. GMRAS广义最小残量

(Generalized Minimal Residual Algorithm)

非对称系统的线性方程组的数值解迭代法,该方法与最小残量的 Krylov 子空间中向量来逼近解,是求解大规模线性方程组的常用算法之一,具有收敛速度快、稳定性好等优点。


改进的GMRAS:

SGMRAS Simpler GMRAS

PGMRAS Preconditioned  GMRAS


6. 快速多级(Fast Multi pole Method)

当矩阵为满秩矩阵时,传统计算方法资源需求和求解规模呈指数级上升,大规模的系统求解需要使用快速多级方法。


改进方法:多层快速多级

7. Successive Over Relaxation(SOR)连续松弛

连续过度松弛(SOR)方法是高斯-赛德尔(Gauss-Seidel)方法的一种变体,用于求解线性方程组,从而可以更快地收敛。任何缓慢收敛的迭代过程都可以使用类似的方法。


改进的SOR:

Accelerated Over relaxation (AOR)过松弛

Preconditioned AOR -- PAOR 预条件过松弛

Quasi AOR -- QAOR准过松弛


8. Krylov子空间迭代法

将矩阵A分解成多个子矩阵,并用一系列线性表达式组合表示。将整个系统降维,利于并行计算,是大规模线性方程组有效的一种解法。其中涉及到了Lanczos方法和Arnoldi方法。


按照矩阵A的特点,我们可以做如下分类:

1. 是否是满秩矩阵;

2. 是否是稀疏矩阵;

3. 是否是对称矩阵;

4. 是否是病态矩阵;

5. 是否是正定矩阵

6. 矩阵规模(矩阵中N的大小)


在选择求解方法的时候,需要考虑到方程组矩阵以上特点。根据作者的经验,方程组的求解性能高度依赖矩阵特征,矩阵规模和硬件。


问题:

求解线性方程组 Ax=b.

Matlab 中提供了方程的求解方法:

x=A\b  (\  反除法符号)


最简单的问题,一群兔子和鸭子,一共有40条腿,20张嘴,问兔子鸭子各多少只,两个变量,两个方程组成一个简单的线性方程组:

4*x 2*y =40

x y =20

在Matlab中输入:

>>A =

     4     2

     1     1

>> b=[40, 15]'

b =

    40

    15

>> x=A\b

x =

     5

    10


当方程求解规模达到1000*1000的时候,Matlab还能应付,速度也不错。当规模达到10w*10w的时候,Matlab会运行相当长时间,然后弹出一个错误。这是因为对于10w*10w的矩阵,用原始的数据结构,性能会下降很快。由有限元计算的矩阵特征可知,矩阵是数据大部分为0的稀疏矩阵,Matlab提供了稀疏矩阵功能,在使用x=A\b 之前 使用如下命令:

x=sparse(x);

10万*10万的方程组1秒之内求出结果。

对于大型线性方程组的求解,使用Matlab做验证是个不错的选择


回到主题:

1. BLAS(Basic Linear Algebra Subprograms)

blas 是许多数值计算软件库的核心,用Fortran语言写成,库一共有三个level,第一level包含了vector计算的一些function;第二个level则是矩阵与vector计算;第三个level是矩阵与矩阵的计算。BLAS接口稍微复杂,一般很少直接使用。

开源


2. Intel MKL

商用是不错的选择。

Intel数学核心函数库(MKL)是一套高度优化、线程安全的数学例程、函数,面向高性能的工程、科学与财务应用。英特尔 MKL 的集群版本包括 ScaLAPACK 与分布式内存快速傅立叶转换,并提供了线性代数 (BLAS、LAPACK 和Sparse Solver)、快速傅立叶转换、矢量数学 (Vector Math) 与随机号码生成器支持。

主要包括:

LAPACK (线形代数工具linear algebra package)

DFTs (离散傅立叶变换 Discrete Fourier transforms)

VML (矢量数学库Vector Math Library)

VSL (矢量统计库Vector Statistical Library)

 MKL的主要功能

2.1)BLAS 和 LAPACK

在英特尔处理器中部署经过高度优化的基本线性代数例程BLAS(Basic Linear Algebra Subroutines)和 线性代数包LAPACK(Linear Algebra Package) 例程,它们提供的性能改善十分显著。

2.2)ScaLAPACK

ScaLAPACK是一个并行计算软件包,适用于分布存储的MIMD并行机。ScaLAPACK提供若干线性代数求解功能,具有高效、可移植、可伸缩、高可靠性的特点,利用它的求解库可以开发出基于线性代数运算的并行应用程序。ScaLAPACK 的英特尔MKL 实施可提供显著的性能改进,远远超出标准 NETLIB 实施所能达到的程度。

2.3)PARDISO稀疏矩阵解算器

利用 PARDISO 直接稀疏矩阵解算器解算大型的稀疏线性方程组,该解算器获得了巴塞尔大学的授权,是一款易于使用、具备线程安全性、高性能的内存高效型软件库。英特尔? MKL 还包含共轭梯度解算器和 FGMRES 迭代稀疏矩阵解算器。

2.4)快速傅立叶变换 (FFT)

充分利用带有易于使用的新型 C/Fortran 接口的多维 FFT 子程序(从 1 维至 7 维)。英特尔? MKL 支持采用相同 API 的分布式内存集群,支持将工作负载轻松地分布到大量处理器上,从而实现大幅的性能提升。此外,英特尔 MKL 还提供了一系列 C 语言例程(“wrapper”),这些例程可模拟 FFTW 2.x 和 3.0 接口,从而支持当前的 FFTW 用户将英特尔 MKL 集成到现有应用中。

2.5)矢量数学库(VML)

矢量数学库(Vector Math Library)借助计算密集型核心数学函数(幂函数、三角函数、指数函数、双曲函数、对数函数等)的矢量实施显著提升应用速度。

2.6)矢量统计库—随机数生成器(VSL)

利用矢量统计库(Vector Statistical Library)随机数生成器加速模拟,从而实现远远高于标量随机数生成器的系统性能提升

商用


3. Eigen

主页:

http://eigen.tuxfamily.org/index.php?title=Main_Page

Eigen 是一个轻量级的库,使用只需头文件,接口比较齐全,文档也很全面,一般的矩阵操作运算都能满足。提供了DenseMatrix 和 SparseMatrix,对于稀疏矩阵的效率也不错。

开源


4. Spoolse

早期很多人使用,性能不错,使用简单。维护的不是很好,文档使用ps格式。

http://www.netlib.org/linalg/spooles/spooles.2.2.html

开源


5.  Lapack

使用最广泛的线性代数包,底层调用 BLAS,能求解 AX=b, 矩阵分解、求逆,求矩阵特征值、奇异值等。文档齐全,使用灵活,稳定性好,用作研究和商业开发都是不错的选择。提供SVN源码下载 

http://www.netlib.org/lapack/

开源


6. Pardiso

PARDISO是为解决大 稀疏对称和非对称线性系统的方程的软件包,如下特点:

线程安全,,高性能的, 和内存使用率低,支持共享内存和内存多处理器。

http://www.pardiso-project.org/

商用,学术用免费


7. Mumps

使用多波前法的稀疏矩阵求解库,支持并行计算。

http://mumps.enseeiht.fr/

开源


8.  PETSc

PETSc是一个高大上的科学计算库,求解线性方程是其中一个功能,支持内存共享并行计算机,支持多线程,GPU加速等,支持求解稀疏矩阵

http://www.mcs.anl.gov/petsc/documentation/linearsolvertable.html

开源


9. SuperLU

SuperLU是一个求解大规模,稀疏,非对称系统对线性方程组的通用库,c语言编写,可供Fortran和C调用。最新版本为4.3 (2014/10/1)支持并行计算和分布式计算。

http://www.cs.berkeley.edu/~demmel/SuperLU.html

开源


10. Umfpack

UMFPACK是 用来求解不对称稀疏线性系统软件包, Ax = b,使用非对称多波方法,SuitSparse有此算法

使用比较简单,Windows下需要自己编译。

http://www.cise.ufl.edu/research/sparse/umfpack/

开源


11. TAUCS

求解稀疏矩阵线性方程软件包,最新版本支持多线程

http://www.tau.ac.il/~stoledo/taucs/

开源


12. SuitSparse

SuiteSparse是一组C、Fortran和MATLAB函数集,用来生成空间稀疏矩阵数据。在SuiteSparse中几何多种稀疏矩阵的处理方法,包括矩阵的LU分解,QR分解,Cholesky分解,提供了解非线性方程组、实现最小二乘法等多种函数代码

http://faculty.cse.tamu.edu/davis/suitesparse.html

开源


13. Sparselib  

用C 写的 稀疏矩阵库,可以和 IML 一起使用做线性方程组的迭代求解。

http://math.nist.gov/sparselib /

开源


14. Trilinos

Trilinos也是个高大上的东西,求解线性方程只是其中一部分功能

http://trilinos.org/capability-areas/#ScalableLinearAlgebra

开源

15.IML

使用C 模板库 和迭代方法 求解对称,非对称矩阵库

http://math.nist.gov/iml /

开源


使用推荐:

1. 简单快速上手 Eigen

2. 商业使用 Intel MKL

3. 研究使用 Lapack,PETSc,SuitSparse



理论科普
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2022-01-26
最近编辑:2年前
多物理场仿真技术
www.cae-sim.com
获赞 126粉丝 321文章 220课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈