摘要
遥感机理模型构建、地表参数反演、遥感产品生产以及真实性检验等均离不开完备的地面先验知识支持,然而目前实验观测、模型模拟等均难以满足观测的完备性需求。目前,基于遥感实验场的数字孪生体生成遥感先验知识以支持遥感基础研究的思路逐渐成熟:突破物理遥感实验场的协同观测技术瓶颈,实现场景三维结构的数字重建;耦合辐射传输、能量平衡和植物生长模型,实现遥感实验场模拟的动态演进;基于物理遥感实验场数字孪生体驱动和约束地表观测数据,通过同化观测与模拟数据反馈优化机理模型,生成精度高、时间连续的完备观测数据集作为先验知识,以支撑遥感机理模型、遥感反演方法和真实性检验等研究。遥感实验场数字孪生体构建方法有望成为小尺度地球系统数字孪生体构建理论的雏形,进而推动地球科学各个学科全面、协同发展。
关键词:遥感实验场,辐射传输,计算机模拟,数据同化,数字孪生,完备数据集
遥感反演方法发展现状
1 模型驱动的遥感反演方法
遥感辐射传输建模是在研究电磁波与地物相互作用过程机理的基础上,建立描述遥感观测信号与地物属性、地物结构和观测几何等参量之间的定量模型(Cao等,2019)。以植被光学遥感机理模型为例,可分为辐射传输、几何光学、辐射传输—几何光学混合和计算机模拟模型等四大类型(Li 等,1995)。在实际反演中,为降低反演的难度,一般会对正向机理模型进行简化(柳钦火等,2009)例如将植被冠层假设为水平均一垂直分层的浑浊介质或者离散分布的规则几何体,从而可以利用PROSAIL(Rivera等,2013)构建查找表进行反演。这类方法主要面临无法处理多地类混合的场景(Zeng等,2016)、受地表分类产品精度制约可能误用模型、对场景的真实结构表达的过于简单(Gastellu-Etchegorry等,2017)等问题。
目前,越来越多的研究工作尝试利用复杂度高的计算机模拟模型进行反演。Combal等(2003)基于PARCINOPY 模型进行了森林 LAI、叶绿素含量和有效辐射的反演。三维模型可以刻画不同复杂度的自然地表以及内部的辐射传输过程,然而三维模型越接近于真实世界越复杂,需要输入的先验知识越多,其对先验知识的完备性要求越高。
先验知识的完备性是指在遥感科学研究中所需的关键参数全、准确度高、时空代表性好。其中参数的全面性是指满足建模、反演和验证所需的种类、观测角度和数据量;参数的准确度高是指器测误差和代表性误差能定量,且足够小;参数的时空代表性高是指观测应满足地物典型的空间范围和观测周期(李小文等,1998)。
2 数据驱动的遥感信息反演方法
机器学习近年来在地球科学领域内得到了广泛的关注和应用,成为了大气、海洋以及陆表信息 智 能 提 取 的 重 要 手 段 之 一 (Reichstein等,2019)。深度学习方法能够分层次提取对象特征,并从多时相遥感影像中提取空间-光谱等多维特征,并建立其相关性(张良培和武辰,2017)。在遥感反演方面,以随机森林、神经网络为代表的机器学习算法在诸如土壤湿度反演(Yuan等,2020)、空气温度反演(Shen等,2020)、遥感产品尺度转换 (Wu等,2019)、叶面积指数反演以及冠层生化参数等方面取得了成功。虽然以深度学习为代表的机器学习方法在众多领域中取得了进展,但是这种单纯以数据驱动的方法往往需要大量的实测数据作为训练样本。在大数据时代的背景下,昂贵的数据采集和标记成本已然成为机器学习任务的主要困扰之一 (Lučić等,2019)。尽管,机器学习领域可以采用数据增强(Data Augmentation)(例如图像旋转、裁剪)等方式对样本库进行扩增,但是,对地球科学中常见的物理过程的拟合仍存在一定的困难。其原因主要有两方面:一是地球科学研究中的样本由于观测条件的限制,因而其样本量往往十分有限,不可能遍及所有的空间部分、下垫面类型、季相、天气与气候;二是数据增强的方式对数据的修改可能破坏数据之间的物理联系,从而导致学习到错误的物理规律。
近年来物理模型和机器学习方法相互取长补短,有逐渐结合的趋势,其中利用辐射传输模型的输出为深度学习提供训练样本是结合的重要形式。毛克彪等以MODIS中红外和热红外波段作为参照模拟研究对象,利用辐射传输模型(MODTRAN)模拟结果作为样本,进行地表温度反演深度动态学习神经网络训练 (毛克彪等,2018)。杨贵军等利用 PROSAIL模型生成样本,用于训练 BP 神经网络,成功反演了多种农作物的LAI(杨贵军等,2011)。然而,MODTRAN是一个单纯的辐射传输模型,基本没有考虑下垫面的复杂性;PROSAIL模型基于冠层的水平均匀假设,对于复杂场景适用性不高。以上几种模型以及其他广泛应用于为机器学习方法提供训练样本的遥感模型对于高时空分辨的研究场景适用性较低,使用三维模型生成训练样本的相关研究有待进一步深入。
全文如下: