首页/文章/ 详情

流体力学观点下的最优传输

4年前浏览4712

纽约的气候四季分明,冬去春来,万物复苏。作为国际大都市,纽约的常驻人口汇集了全世界几乎所有的民族,流动人口异常庞大,宾夕法尼亚车站每天任何时刻都是熙熙攘攘,人声鼎沸。曼哈顿岛上高耸入云的摩天大厦,鳞次栉比,地面上车水马龙,川流不息。食肆酒吧,剧院商铺,琳琅满目,极尽繁华。在人口密度如此之高的小岛上,各色病毒也在肆虐生长,繁殖变异。每一年的暖冬,就意味着来年春季的流感大爆发。


每年开春,纽约地区都有流感袭击,一如四季轮回,今年依然来势凶猛。因为病毒产生了新的变异,市面上除了流感疫苗,并没有什么特效药,只能依靠自身的免疫系统来抵抗。每年流感都有不同症状,身体的所有器官系统渐次被侵袭,逐步自愈,最后锁定在最为脆弱的系统中进行持久斗争。作为教师,终日与黑板粉尘为伍,最为脆弱的器官自然是上呼吸道。在耐心等待自愈期间,只能多喝开水、多冲热水澡,同时潜下心来思考一些数学问题。


最优传输和深度学习

自然数据具有内在的模式,深度学习方法可以有效地揭示这些模式,因而取得了巨大的成功。数据中一种普适的模式可以被概括为流形分布定律:一类自然数据分布在高维背景空间中的低维流形附近。因此,数据可以用流形上的概率分布来描述。深度学习具有两个基本任务:流形学习,以及概率分布之间的变换。概率分布变换可以用经典的最优传输理论来完成。


例如GAN中的生成器本质上是将高斯分布变换成实际数据分布,判别器本质上计算两个分布之间的距离。最优传输理论的核心问题就是计算概率分布之间的变换,其代价用于衡量概率分布之间距离。


依随深度学习方法的日益深入人心,大众对最优传输理论的学习热情也日益高涨。最优传输理论具有丰富的内涵,同时也是众多领域交汇的地带,例如概率统计、微分几何、流体力学、线性规划、蒙日-安培方程等等。不同的方法各有千秋,有些易于理解,有些易于计算,有些偏几何洞察,有些偏物理直觉。比如,对于深度学习而言,基于Minkowski-Alexandrov理论的凸几何解释非常适于GPU实现;对于对抗生成网络的模式崩溃问题,基于蒙日-安培方程的正则性理论给出了颇有说服力的解释;对应医学图像的注册问题,流体力学方法应用最多。这里,我们比较几何方法和流体力学方法,从而得到更为深刻的理解。


最优传输的几何方法

蒙日-安培方程和经典的Minkowski问题紧密相连,Minkowski问题是从高斯曲率和法方向重建曲面。因此蒙日-安培方程可以用几何方法来解,并且在深度学习上已经应用。

图1. 几何方法计算的最优传输映射。


如果目标区域非凸,则Brenier势能函数依然连续,但是最优传输映射非连续,这造成了模式崩溃问题。

图2. 从实心球到兔子的最优传输映射的非连续点集合(苏科华作)。



最优传输的流体力学方法

空间每一点密度的变化满足连续方程:

在这一时刻,所有粒子的动能为:

基于流体力学的方法,我们优化流场的总动能,由此同样可以得到最优传输映射。

图3. 基于最优传输映射的乳腺癌早期检查(齐鑫作)。


几何观点和流体力学观点的关系

如上讨论,我们看到关于最优传输映射的两套理论,得到两种流场,由Brenier势,得到的微分同胚群:

和极小化流场动能,得到的微分同胚群:

这里,我们只给出流体力学观点最为简单的解释,这一方向的研究也非常丰富而深刻,在医学图像领域被广泛应用。同时,基于流体力学的最优传输方法在物理仿真,计算力学,网络交通等领域也有深入的应用。但是,目前在深度学习领域,基于流体力学的最优传输尚未被涉及,主要原因在于维数诅咒。在高维空间中,流场的计算量过大,目前的算力无法承担。相比之下,基于几何观点的方法更加直接了当,非常适合深度学习的高维情形。基于最优传输理论方法对于大数据、深度学习具有根本的重要性,我们乐观相信在不远的将来,会有基于最优传输理论的专用芯片涌现,从而将深度学习进一步推进。

流体基础几何处理Dassault 其他
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2020-01-13
最近编辑:4年前
仿真圈
技术圈粉 知识付费 学习强国
获赞 10111粉丝 21614文章 3547课程 219
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈