顾险峰 纽约州立大学石溪分校
计算机与应用数学系 终身教授
2017年6月初,我回到清华园再度讲授《计算共形几何》课程。每周二和四上午,在丘成桐数学科学中心(近春园三楼报告厅,9:50AM-11:50AM)授课。
这门课程对于学员的数学要求较低,只要理解线性代数和多元微积分即可;在计算机方面,如果学员能够编程,那将会对于学习具有极大的帮助。课程完全免费公开,任何有兴趣的朋友都可以前来学习探讨。
依随虚拟现实(Virtual Reality)和增强现实(Augmented Reality)技术的迅猛发展,工业界、医疗界对于三维几何处理(Geometric Processing)的需求猛增。相对于声势浩荡的机器学习技术,三维几何处理的技术需要更深的数理基础和更为精密的工程技巧,因此相对繁难。为了将深刻而抽象的几何拓扑理论和VR、AR应用相结合,为了培养三维几何方面的计算机人才,我们设置了这门课程。
因为我们的目的在于培养计算方面的人才,我们课程的讲授方法不同于传统的数学课程,也不同于计算机课程:
传统的数学课程讲授风格是从定义,引理到定理,再到推论。学员们建立了清晰的概念和理论框架,掌握了逻辑细节,但是往往无法和现实联系起来,停留在纸上谈兵的阶段。这门课更加重视理论后面的直觉(insights),和构造性证明(constructive proof),以及概念和定理在计算机上的实现,在现实生活中的实际应用。
传统计算机课程着重于各种对象的数据结构和算法,而相对忽略算法设计和算法收敛背后的理论基础。学员们往往知其然而不知其所以然,因而缺乏独立创造新算法的能力。我们强调算法设计的理论思想。
特别是我们将在课程中明确指出一些开放问题和科研方向,在这些问题上数学领域已经发展了完备的理论,但是计算机科学领域还没有发展出相应的计算方法。这些问题揭示着自然界的内在结构,依然未被人类社会加以应用。同时我们相信,这些方向是计算机科学发展的前沿,因为其理论完备,方法清晰,年轻学子只要努力专一,必然会获得成功。
这门课程主要介绍计算共形几何的理论、算法和应用,涵盖的数学理论包括代数拓扑,曲面微分几何,凸几何,黎曼面理论和拟共形映射理论;算法包括同伦群、同调群的计算,曲面调和映照,基于Hodge理论的全纯微分形式,曲面Ricci流,基于凸几何的最优传输理论;应用主要包括计算机图形学中的全局参数化,计算机视觉中的动态三维曲面配准,医学图像中的形状分析,几何建模领域中的神圣网格,大数据分析中的几何归类问题,对抗生成网络的最优传输解释等等。
几何的目的是研究空间和形状,将形状进行恰切的描述和归类。最为基本而粗糙的归类是所谓的拓扑分类。我们说两个形状拓扑等价,如果一个形状可以连续变形成另外一个形状,不发生撕破或者粘连。我们研究的形状最为简单和规则的是所谓的流形,稍微宽泛一点的是复形。
因为人类的感官只能看到三维形状,对于高维形状无法感知。我们考察一个球面,它是二维流形,但是无法嵌入在二维平面上面。同理,一个抽象的三维球面,无法嵌入在三维欧几里得空间之中,因此我们只能通过想象来感知三维球面:我们想象有一个实心的甜甜圈,在其表面可以画出经线和纬线。将两个甜甜圈沿着表面粘贴起来,使得第一个曲面的经线和第二个曲面的纬线重合,这样我们得到的实体就是一个三维球面。显然,这种操作在现实物理上是不可实现的。
那么,我们如何来感知并把握高维流形呢?数学上的一个通用手法就是为所研究的对象赋予不同的群,通过对群结构的分析来理解刻画抽象的对象。群的概念虽然抽象,但是群的数据结构和算法却是精确明晰的,虽然依然曲折,但是在计算机的帮助下,人类是能够把握的。因此,代数拓扑的基本思想就是将拓扑问题代数化,在拓扑空间上赋予各种代数结构,通过研究这些代数结构来探究空间的拓扑结构。
例如,我们在流形上定义同伦群和同调群,希望用这些群的结构来反映流形的拓扑结构。这里有几个层面的问题:
信息完全问题:在将拓扑代数化的过程中,会有信息丢失,比如对于三维流形,同调群反映的信息不完全,同伦群反映的信息更多。更为严密的说法是:给定两个封闭的三维流形,如果它们拓扑同构当且仅当它们的同伦群同构。但是,相应的结论对于同调群不成立。
代数结构的可计算问题:同伦群通常是非交换的,其计算归结为符号计算。计算一个流形的基本群(一维同伦群)是线性时间复杂度的,但是判定两个群是否同构,通常是NP-难问题。同调群是可交换的,其计算归结为线性代数,因而具有多项式时间复杂度。
计算方法可替代问题:为了解决拓扑问题,代数拓扑并非唯一的选择,微分拓扑和几何拓扑会提供强有力的计算方法。例如,如果一个纽结不经过剪段和重新链接、可以渐变成另外一个扭结,则我们说这两个纽结彼此同痕。我们可以用代数拓扑方法来判定纽结同痕:两个纽结同痕,当且仅当它们在三维欧氏空间中的补集的同伦群同构。我们也可以用几何拓扑方法:将它们的补空间配上常曲率的黎曼度量,然后判定补空间是否等距。对于这个问题,几何拓扑的方法更加简洁直接。
当然,将问题代数化的思想在数学中非常普遍。例如,代数几何、代数曲线理论就是用代数方法来研究几何问题。比如,给定两个实际生活中的曲面,曲面自然具有欧氏空间诱导的黎曼度量,因此成为黎曼面。曲面上所有的亚纯函数构成一个域(Meromorphic Function Field)。黎曼面之间存在保角双射,当且仅当它们的亚纯函数域彼此同构。
在美国,直肠癌是男子的第四号杀手,排在前三位的是心脑血管疾病。人到中年之后,通常每年都会长出直肠息肉。如果息肉的位置不当,经常摩擦溃疡,就会发生癌变。息肉的生长速度非常缓慢,历经数年才可能形成恶性病变,因此对于直肠息肉的监控是防止直肠癌的最好手段。传统光学肠镜检查方法非常具有侵犯性,光学镜头和导管容易造成病人的肠道创伤,病人需要被全身麻醉,创伤恢复需要数周。同时,由于肠壁具有大量的皱褶,皱褶中的息肉无法被光学方法检测到,从而造成一定的漏检率。
图1. 虚拟肠镜方法。
虚拟肠镜的方法应用CT成像得到肠壁曲面的数字模型,应用共形几何的方法将肠壁打开展平,使得所有的皱褶被摊开,所有的息肉完全暴露出来。这种方法医生和病人没有肢体接触,病人不需要被麻醉,不会产生创伤,所有的息肉都会被检测到。同时检查过程便捷经济。
从CT图像到肠壁曲面的计算过程中,我们首先需要将图像进行分割(segmentation),划分出肌肉、空气、体液的区域,肠壁肌肉和内腔的分界曲面即为肠壁曲面。由于图像噪声和分割算法的误差,这种方法恢复的肠壁曲面会产生大量的几何噪声和拓扑噪声。所谓的拓扑噪声就是在肠壁曲面产生很多虚假的环柄。检测并消除这些环柄需要计算曲面同伦群的生成元。
在物联网中,许多传感器构成网络,我们需要设计路由算法以确保网络传输的安全。如图2所示,传感器网络覆盖了平面区域,阴影部分是网络无法覆盖的地方,例如池塘。我们希望从点s传输消息到达点t,这里有多条路径可以选择 。
图2. 网络路由设计。
为了增加信息传递的安全性,我们将消息切割成多个包裹(package),每个包裹沿着不同的路径进行传递,同时我们要求任意一条路径不能在网络中渐变成另外一条。这意味着不同的路径应该彼此不同伦。如图中 两两彼此不同伦,却是同伦的。因此如何判断两条路径是否同伦,如何设计彼此不同伦的路径,这些都是网络路由设计的重要问题,其计算依赖于同伦群的理论。
图3. 曲面上的曲线族。
拓扑中的一个常见手法是通过研究曲面上的曲线来刻画曲面相关的拓扑性质。假设曲面给定,曲面上的一条路径是一个连续映射,如果路径首尾重合则成为一个圈,。我们在曲面上固定一个基准点,考察所有过基准点的圈,它们构成了一个无穷维的圈空间(Loop Space)
,
圈空间的拓扑和几何反映了底空间的拓扑和几何。例如米尔诺(John Milnor)利用莫尔斯函数理论(Morse Function Theory)来研究圈空间的拓扑。我们考察每个圈长度的平方,这个函数的极值点和极值点处的指标(Index)给出了圈空间的拓扑。显然,圈长度平方函数的极值点是闭测地线(Geodesics),测地线的指标比较复杂。给定一条测地线,给出一个沿着测地线定义的切矢量场,矢量场处处和测地线垂直。如果测地线上的所有点沿着这个切矢量场移动,移动速度向量场等于切矢量场,在移动过程中的任意时刻,我们得到变形后的曲线都是测地线,则我们称这一切矢量场为一雅可比场(Jacobian Field)。给定一个测地线,其雅可比场构成一个线性空间,这个空间的维数就是这个测地线的指标。雅可比场的存在性严重依赖于曲面本身的曲率。负曲率空间不存在非平庸的雅可比场。由此,我们可以计算圈空间的拓扑。圈空间的同伦群与底空间的同伦群存在关系
。
在计算机图形学和计算机视觉领域,有大量的计算测地线的算法。目前这些算法已经发展到相对成熟的地步,高度并行、硬件加速。但是,关于Jacobian Field的计算方法一片空白。测地线的计算需要一阶逼近,而Jacobian场的计算需要二阶逼近。离散Jacobin场和离散曲率的理论尚未建立起来。
图4. 曲线的同伦类。
直观上,给定曲面上的两条路径,如果其中的一条可以在曲面上渐变成第二条,则我们说这两条路径彼此同伦。严格来讲,存在一个连续映射
,
被称为是同伦映射,使得。同伦映射可以理解为一族曲线, 连接着给定的两条路径。如图4所示,我们在曲面上给出许多圈,这些圈在同伦意义下被分成6类,每一个类选取一个代表元。
瑟斯顿(Thurston)考察了所有简单闭曲线的同伦类构成的集 合,所谓简单闭曲线是指没有自相交的闭曲线,
曲面的一个自同胚,将简单闭曲线映射成简单闭曲线,但有可能改变曲线的同伦类。这一自同胚诱导映射:,对于这一映射的深入研究,他得出了曲面映射的分类定理。
图5. 曲面上的一条简单闭曲线。
首先,我们考察简单闭曲线同伦类构成空间的维数。如图5所示,我们给定曲面上一条简单封闭曲线。我们希望给出它的某种坐标来刻画它的同伦类。我们通过所谓的“裤子分解”来达到这一点。假设曲面有个环柄,我们称之为亏格为。我们选取“可容许曲线系统”(admissible curve system),
,
满足每条圈都是简单的,任意两条圈都没有交点,任意两条圈不同伦。那么将曲面分解为条“裤子”。每条裤子都是亏格为0的球面带有3条边界,如图6左帧所示。圈和每条有个交点,同时围绕扭转了圈,这里既可以是正数也可以是负数,取决于缠绕方向。由此,我们得到曲线的同伦类的坐标:
。
图6. 裤子分解和闭曲线的坐标。
同样,给定一族简单闭曲线,彼此没有交点,我们可以用同样的坐标进行表示。这样的简单闭曲线族,构成了lamination。如图4所示,如果我们将每一条简单闭曲线进行同伦变换,生成一族闭曲线,那么我们得到一个曲面的叶状结构(foliation)。由此可知曲面上所有叶状结构构成的空间是维。由叶状结构理论我们知道,每一个叶状结构对应一个全纯二次微分(holomorphic quadratic differential),因此全纯二次微分构成的空间是维。这一结论,我们也可以通过黎曼面理论的黎曼-罗赫定理(Riemann-Roch theorem)得到。相对于黎曼-罗赫定理的解析方法,这里的组合解释更加简洁明快、直接了当。
瑟斯顿用简单闭曲线来研究曲面自映射的分类问题。曲面自同胚,诱导映射:。我们可以写下映射对应的坐标变换,由这种变换我们可以设计出算法来计算自同胚的分类。简而言之,自同胚同伦类可以被分成三种:
周期性(Periodic):存在正整数,使得和曲面恒同自映射同伦等价。同时存在一个双曲度量,在作用下不变;
Pseduo-Anosov:存在两个叶状结构,在作用下不变;
可分解(Decomposible):存在分割曲线,将曲面分割成不同的连通分支。在每个连通分支上的限制上都是Pseduo-Anosov,同时将重排列。
曲面自映射的同伦分类问题,自映射的不变度量和不变叶状结构问题,在数学领域已经透彻理解,但在计算机科学方面一片空白。我们期待,在不久的将来,这些计算拓扑问题会得到实质性的进展。