泛函与变分
1.1
泛函的概念
为了引出泛函与变分的概念,我们首先考虑一个简单的问题。设在平面上存在A、B两点,其坐标分别为(0, 0)和(1, 1),试确定连接A、B两点的最短路径。
直觉告诉我们,连接A、B两点的最短路径必然是直线。但是在这里,我们期望给出严格的数学证明。考虑连接A、B两点的任意一条曲线y(x),如下图所示。
要使得曲线y(x)成为连接A、B两点的最短路径,则必然要求y(x)在所有连接A、B两点的曲线中弧长L必须是最短的。在曲线y(x)上取一微段,则微段弧长可表示为:
因此曲线y(x)的总弧长为:
显然,不同的y(x)曲线,将对应不同的弧长L。我们的目标是找到曲线y(x),使得上述表达式取得最小值。
我们将L[y(x)]称为函数y(x)的泛函(Functional),函数y(x)称为泛函的自变函数或核函数。可以看到,泛函与普通函数存在很大的不同。函数实际上定义了从数到数的映射关系,例如,如果我们输入一个数,通过函数关系可以输出另一个数。而泛函实际上定义的是从函数到数的映射关系。例如,我们输入一个函数y(x),最终得到一个具体的值L。为了便于理解,我们可以简单地认为泛函就是函数的函数。以上泛函也被称为积分型泛函,因此上述映射关系是通过积分来表示的。对于力学中接触到的泛函,大多数都为积分型泛函,这可能是因为力学问题中的大部分方程都是基于能量建立的,但并非所有的泛函均为积分型泛函。
此外,对于一般依赖于多个多元自变函数的泛函,我们可以记为:
1.2
变分的概念
1.2.1 泛函的自变函数的变分
在介绍变分的概念时,我们有必要区分泛函的自变函数的变分与泛函的变分。
如果自变函数y(x)和与它非常接近的一个函数y1(x)之差,为一个微小的变化量,则称其为自变函数y(x)的变分,即为:
这里需要注意,δy(x)是一个与x有关的函数,而并非一个值,并且需要将其与函数增量Δy予以区分,如下图所示。
从图中可以看出,δy(x)反映的是整个函数的变化,而Δy反映的是函数y(x)由于自变量x存在增量Δx而在局部产生的增量。
1.2.2 泛函的变分
泛函的变分可以看作是函数变分的推广。我们考虑如下所示的一个积分型泛函:
如果给自变函数y(x)以变分δy(x),则原泛函变为:
相应于自变函数变分δy(x)的泛函增量为:
与函数微分类似,泛函增量ΔJ中的线性部分,称为泛函的一阶变分,即为δJ,同样可定义泛函的二阶变分δ2J和三阶变分δ3J等。我们所说的变分问题,一般指的是求解泛函的一阶变分。
为了简化上式,我们首先回忆一下二元函数的Taylor展开式,对于函数f(x,y),其在点(xk, yk)处的Taylor展开式为:
假设泛函J[y,y',x]的核函数F(y,y',x)是充分光滑的,基于多元函数的Taylor展开,我们将F(y+δy,y'+δy',x)展开在点(y,y',x)处展开,可得:
由上式可以得到核函数的增量为:
式中:核函数的一阶变分和二阶变分分别为:
由此我们可以得到泛函的增量为:
式中:δJ和δ2J分别为泛函J的一阶变分和二阶变分,即有:
需要注意的是,在上述泛函的定义中,函数y(x)和y'(x)都是独立的变量,不能将y'(x)理解为函数y(x)的微分。
当然,泛函的变分与函数的微分确实存在许多的相似之处,如针对微分的运算法则,同样适用于变分(指的是针对积分型泛函中核函数的变分):
核函数的微分、求导与变分运算的次序可以交换:
变分号可由积分号外移到积分号内:
1.3
变分法
变分法指的是对泛函求极值的方法,它与求函数极值的方法非常类似。
考虑泛函J[f(x)],如果泛函在f0(x)处取得极值,则在f=f0(x)上必然满足δJ=0,并且当δ2J>0时取得极小值;当δ2J<0时取得极小值。f=f0(x)称为泛函J[f(x)]的极值函数(或极值曲线)。
为了更好地理解变分法,我们可以将泛函的变分与多元函数的微分进行类比。考虑一个多元函数S(y1,y2,…,yn),这里的自变量yi(i=1,2,…,n)不再为函数,而是普通的实数。对于多元函数而言,显然函数取得极值的必要条件为:
对于多元函数,其微分的定义为:
这里,我们再次用到多元函数的Taylor展开,对于多元函数f(x1,x2,…,xn),其在点(xk1,xk2,…,xkn)处的Taylor展开式为:
利用多元函数的Taylor展开,我们将函数S(y1+dy1,y2+dy2,…,yn+dyn)在点(y1,y2,…,yn)处展开,并且只保留线性项(因为对于泛函求极值我们只用到了一阶变分):
因此我们有:
根据多元函数取得极值的必要条件,我们可以得到:
上式的含义为当在自变量的无穷小改变之下函数值保持不变时,函数才取得极值。
接下来,我们假设自变量yi的数量有无穷多个,这意味着n→∞的情况,这些自变量将铺满整个连续的x轴。此时,显然自变量yi变成了与x有关的连续函数,我们将其记为yx。为了强调连续指标的不同,我们将微分号改写为δ,即有:
注意到由于是无穷多个自变量求和,因此原来的求和符号将变为积分符号。
从上面的推导我们可以看出,对于泛函求极值的过程可以按照对多元函数求极值的过程来理解,只不过此时应理解为泛函是具有无穷多个连续排布的自变量的多元函数。也就是说,泛函取极值时,泛函的值在无穷多个自变量构成的连续函数的无穷小改变量下保持不变。
1.4
Euler方程
让我们回到最初的问题。我们需要求解连接A、B两点的最短路径,其等价描述为寻找泛函L[y(x)]的极值。
式中:
为了获得该泛函的极值,我们需要求解该泛函的一阶变分。事实上,前面我们已经通过二元函数的Taylor展开式获得了该泛函的一阶变分为:
根据分部积分法,我们有
注意上式用到了曲线的边界条件,由于A、B两点是固定的,因此必然满足:
将积分代入到泛函的一阶变分可以得到:
由于δy是任意的,因此上式恒成立的条件为:
可见,要使得A、B两点的路径取得最小值的曲线y (x)必然满足上述微分方程,该方程被称为泛函的Euler方程。
我们代入F的表达式,可得:
将其代入Euler方程可得:
求解上述微分方程,并代入边界条件,可以得到泛函的极值曲线为:
这证明,连接A、B两点的最短路径为一条直线。
这里,我们给出一个比较重要的推论,对于含有多个自变函数的泛函,如
其满足边界条件
则使得泛函取得极值的极值曲线fi=fi(x)必须满足Euler方程组:
-02-
Lagrange方程
Lagrange方程是分析力学中最基本的方程之一,用来描述保守系统(系统中力的做功与粒子的运动路径无关,如重力、静电力等)中质点系运动的动力学方程,其表达式为:
式中:q为广义坐标,q(dot)为广义速度。L为Lagrange函数,其表达式为:
式中:T为系统动能,V为系统势能。
在工科的理论力学教材中,Lagrange方程一般是基于达朗贝尔原理结合虚位移位移原理推导得到的,推导过程较为繁琐。下面,本文将尝试通过变分法来推导Lagrange方程。考虑如下所示的一个泛函:
下面我们通过变分法求解该泛函的极值。当然,这里有一个额外的限制条件,即所有可能函数q(t)在t0和t1时刻的取值是固定的。这使得我们在进行变分时,满足条件:
这一类变分问题也被称为固定边界的变分问题。
由前面的内容可知,泛函取得极值的条件为泛函的变分等于零,即有:
而
因此我们可以得到:
根据分部积分法,我们可以将上式中的第二个积分重写为:
注意,上式用到了前面给出的额外的限制条件。将上式代入泛函的变分可得:
由于δq的取值是任意的,因此上式成立的条件为:
可以看到,这与前面推导最短路径时得到的Euler方程在形式上是完全一致的。
同理,对于含有多组广义坐标的泛函:
注意,q和q(dot)是多个广义坐标和广义速度构成的矢量:
根据前面给出的推论,可以得到该泛函取得极值条件为满足如下所示的方程组:
可以看到,通过对上述泛函求极值,我们很自然地导出了Lagrange方程,这使得我们有必要思考泛函Φ的物理意义是什么。
事实上,泛函Φ在物理学上被称为坐标空间作用量泛函,对该泛函取变分求极值的原理也被称为坐标空间最小作用量原理(也被称为哈密顿原理)。简单来说,如果我们将广义坐标和广义速度看作描述质点运动的一组独立坐标(即不再将广义速度看作是q(t)对时间的导数),则在满足约束条件的情况下质点在坐标空间中的运动存在无数种可能。但根据坐标空间最小作用量原理,质点的真实运动轨迹应使得质点的作用量取得极值。并且,此时质点的真实运动轨迹还将是其在坐标空间中的极值路径。也就是说,Lagrange方程给出了质点在坐标空间中运动的最短路径曲线(也被称为短程线或测地线)。
参考文献
[1] 变分理论与数值分析方法, 蔡中义.
[2] 经典力学新讲, 陈童.
[3] 变分法基础, 老大中, 北京: 国防工业出版社.
END