首页/文章/ 详情

一文详解“空间数字孪生”的技术与应用

5月前浏览6055
  

摘要



正文

致力于数字孪生体技术的研究与发展

通过解决方案和工程化应用造福人类

来源:GIS启示录


这次是要分享一篇关于数字孪生的论文,标题为《Enabling Spatial Digital Twins: Technologies, Challenges, and Future Research Directions》,相较于大家常说的数字孪生城市,这篇文章用了“空间数字孪生”的概念,将孪生对象限定为空间对象。推荐这篇文章的原因如下:

  • 作者不是国人,大家可以看看国外对空间数字孪生的认知和理解;

  • 这篇文章虽然很长(26页),但是作者说的是人话,写的非常通俗易懂;

  • 这篇文章覆盖的内容非常全面,值得一读。


引 言


数字孪生是物理现实世界实体或系统的虚拟(或镜像)表示,是一个集成的软件系统,反映了其对应物理对象的生命周期。随着过去十年数字技术的快速发展,数字孪生在许多应用领域,包括制造业、农业、医疗保健以及智能和可持续城市中受到了显著关注。这些数字孪生解决方案的主要目标是通过实时监控和预测性维护物理实体,以及生成有用的洞察并为现实世界实体提供反馈,来提高系统的性能和效率。


数字孪生的概念最初由NASA科学家在2012年提出,用于镜像太空飞行器的生命周期,后来成功应用于制造业,以提高制造流程的性能。之后,数字孪生技术在多个方向上发展——其中之一是智能和可持续城市/区域。开发智慧和可持续城市至关重要,因为世界一半以上的人口居住在城市,城市造成了70%的温室气体排放。因此,建模城市环境和发展,优化运营效率,增强决策是发展可持续城市的关键。为了实现上述目标,数字孪生围绕地理空间上下文发展,产生了一种新型的数字孪生——本文中称为空间数字孪生。


1.空间数字孪生


空间数字孪生(SDT)本质上是现实世界地理空间对象(例如,建筑物、道路)和系统(例如,环境或交通监控)的镜像表示。地理空间协会正式定义SDT为具有精确位置和维度属性的虚拟表示,其中虚拟模型以同步频率更新。


在高层次上,SDT和传统的数字孪生(DTs)有许多相似之处,两者都维护现实世界对象的虚拟表示,以协助监控、规划和具有预测能力的决策制定。SDT与DTs的关键区别在于SDT纳入了空间上下文,以捕获和提供地理空间对象和过程的位置和相对维度表示。


2.应用


虽然SDTs常被错误地与用于城市规划和发展的3D建模和可视化技术混淆,但SDTs的能力远远超出了这些应用,涵盖了具有许多潜在用途的广泛功能。我们列出了一些重要的应用领域,如下所示。


  • 城市规划和管理: 城市的SDT可用于监控和管理城市规划和发展过程。例如,波士顿城市数字孪生被用来评估拟议中的高层建筑将对给定公园区域投下多少阴影。

  • 自然灾害: 近年来,洪水和丛林火灾等自然灾害的规模和频率在全球范围内显著增加,这主要归因于气候变化的影响。例如,2020年3月,澳大利亚的丛林火灾导致30亿动物死亡,烧毁了超过1800万公顷的土地,并摧毁了3000多栋房屋。利用森林、动物、建筑物和其他基础设施的空间数字孪生,可以制定更好的救援和防火计划,这可以显著减少生命和财产损失的范围。

  • 虚拟现实和增强现实服务:SDT在虚拟现实领域具有巨大潜力,使用户能够模拟和与包含现实世界实体的虚拟模型进行交互。此外,它们在增强现实领域提供了激动人心的可能性,允许用户无缝地与现实世界中的物理元素进行交互和操纵。例如,电工可以在修理故障之前,从SDT中查看建筑物的布线布局。

  • 温室气体排放和气候变化: 温室气体排放(GHG)是导致气候变化的主要因素之一,对我们的环境有着深远的影响。为了减少来自化石燃料消耗和电力发电等间接来源的GHG,监测、管理和规划宏观和微观层面的能源消耗至关重要。SDT有助于监测和管理当前的能源消耗,预测未来的消耗,并优化建筑物、郊区或整个城市中可再生能源的使用。通过利用SDT,我们可以努力减少GHG排放,促进可持续性,并促进过渡到更加环保的能源格局。

  • 智能交通:SDT可用于按需车辆在优化路线上的运营,通过实时监控和预测分析改善道路安全,并减少拥堵。

  • 流行病学和公共卫生: 我们在COVID-19中目睹了前所未有的生命损失。我们还看到,通过在从各种来源收集的数据上应用先进的数据分析和AI技术,可以更好地管理这种疾病。SDT可以成为辅助工具,用于时空预测传染病,识别疾病源头,跟踪感染患者的移动,并制定更好的计划以遏制疾病。

  • 智能或精准农业: 依赖传感技术获取实时农业领域数据和AI&ML技术进行决策的智能或精准农业,可以通过围绕农作物种植、分销和市场需求开发的空间数字孪生获得巨大好处。


3.空间数字孪生的不同组件


由于SDTs需要整合大量空间和地理定位数据,以准确全面地代表一个大型物理环境,SDT的规模和复杂性远高于传统DT。例如,SDTs包含各种形式的数据,包括位置数据、3D模型、空间网络、卫星图像等,为了获取这些数据,我们需要定位设备、物联网传感器、无人机、卫星等的支持。数据源和类别的选择将由SDTs的具体用例和应用决定。因此,为了构建SDT,我们需要各种空间技术。在本文中,我们确定了SDT的四个主要构建块,并讨论了每个构建块的相关空间技术:


  • 数据获取和处理: 开发SDT的第一阶段是获取和处理有关物理环境的数据。这可以包括卫星图像、LiDAR扫描、航空摄影、物联网传感器数据和GIS数据等其他形式的空间和地理定位数据。必须处理数据以创建物理环境的数字表示。

  • 数据建模、管理和处理: 这是第二层,用于对空间数据进行建模、存储,并提供数据管理和处理平台。这包括建模不同类型的数据,如位置、3D、图像等,并提供如PostgreSQL、geoSpark等的数据管理和处理平台。

  • GIS软件、地图和API: 这中间层包含GIS平台和基础地图,以及执行空间数据上不同操作的可用API。该层从先前层获取数据,并将其与地图、GIS或3D平台软件融合。

  • 关键功能组件: 这最后一层涉及关键功能,包括模拟、预测建模、可视化、查询处理等。为了提供这些功能,SDT需要前几层的空间技术的支持,以及其他支持性技术,如AI&ML、区块链等。


空间数字孪生的组件


1.数据获取与处理


开发SDT的第一阶段是获取和处理有关物理环境的数据。这包括遥感技术(例如LiDAR、无人机、卫星图像等)、定位技术(例如GPS)、物联网(IoT)传感器(例如空气质量传感器、交通传感器、GPS、摄像头等)、软件系统(例如CAD)。从各种数据获取技术捕获的数据必须被处理,以创建物理环境的数字表示。


构建SDT涉及捕获不同时空维度的多种现实世界地理空间对象。示例包括建筑物的2D或3D布局、移动对象的时空轨迹、景观的卫星图像、空间网络(例如道路网络)、建筑物能耗的时间序列数据等。这些数据的获取过程也有很大的不同,从用于捕获诸如变化位置或能耗等演变数据的IoT启用的传感器设备,到用于生成建筑物详细3D布局的软件系统如CAD。由于获取技术的广泛差异,以及空间数字孪生所需的表示水平,使得对捕获的数据制定统一的标准和质量是一个挑战。


2.数据建模、存储和管理


从数据获取层捕获的空间数据需要被建模,然后存储在数据管理系统中。在地理空间领域,我们可以将空间数据建模大致分为两组:栅格数据模型和矢量数据模型。在栅格数据模型中,整个空间被划分为网格单元,每个单元表示为像素,表示单元信息。通常使用矩阵数据结构(或网格单元数组)来存储栅格数据。这是GIS社区最常见的数据模型。连续的地理空间数据,如卫星图像、主题地图等,通常使用栅格数据模型。相比之下,在矢量数据模型中,空间实体使用空间原始几何数据类型表示,如点、线和多边形。例如,学校的地点被表示为一个点,一个郊区可以被表示为一个多边形,道路网络可以被表示为一个图。每个对象可以与其它非空间属性相关联,例如,学校有许多非空间属性,如名称、排名、学生人数、类别等。这种矢量建模是在空间数据库社区中最常用的范式。


一个SDT的关键组件是数据管理系统,因为它需要处理具有不同空间和时间粒度的广泛数据范围。多年来,已经引入了许多空间数据管理技术和算法来处理各种空间数据类型,如点、线、多边形和时间序列。


为了处理大型空间数据类型和操作,传统的关系数据库管理系统(RDBMS)已经扩展了它们的范围,以支持空间数据。例如,Oracle Spatial、Microsoft SQL Server和PostgreSQL/PostGIS已经提供了对许多重要空间数据类型和一些关键空间操作的支持。PostgreSQL还包含了对空间栅格数据(例如图像)的支持。据最近的研究报道,PostgreSQL在空间数据类型、查询和可扩展性方面具有最佳的的空间支持。它支持包括2D和3D几何类型在内的不同几何类型,如点和多边形,以及各种查询,如连接和k最近邻(kNNs)。其他流行的空间RDBMS(例如Oracle Spatial和SQL Server)也在持续适应新特性,以使这些系统适合于大空间数据时代。最近的研究还讨论了如何使用这些空间RDBMS管理和存储3D城市模型。


非结构化数据,如文本、文档和图形,在许多应用中增加了空间数据。NoSQL(Not-Only-SQL)数据库系统由于其无模式和可扩展性,已经成为处理各种类型的大量非结构化数据的流行选择。许多这样的NoSQL数据库系统最近已经扩展到处理空间数据类型和操作。例如,MongoDB,一个用于管理文档的数据库,提供了对基本GeoJSON对象的支持(例如,点、线串和多边形)。同样,Oracle NoSQL,一个键值存储数据库,也支持常见的几何对象和一组空间操作符(例如,相交、内部、附近等)来处理空间数据。Neo4j,一个流行的图形数据库管理系统,有一个名为Neo4j Spatial的空间扩展,可以存储、索引和处理空间数据。


总结来说,尽管RDBMS和NoSQL数据库系统都在持续采用空间特性,但对于不同空间操作在复杂空间对象(如3D建筑)上的性能,还没有全面的评估。对于SDTs,在构建底层数据库之后,将会有显著多的读取操作而不是写入操作,我们可能不需要严格遵循事务数据库系统的ACID属性,RDBMS和NoSQL的结合可能是处理不同用例场景的最佳选择。除了RDBMS和NoSQL,还有一些流行的文件格式,如GeoJSON、Shapefiles、GPX和Keyhole Markup Language(KML),用于以不同格式存储和共享地理空间数据。其中GeoJSON是存储和共享空间对象(如点、线、多边形等)的最常见的格式。同样,shapefile格式是由Esri公司创建的,用于存储和共享空间对象。GPX格式是一个开放标准的XML标记语言,用于存储移动对象的一系列时间戳和经纬度坐标。KML格式通常用于存储二维和三维地理数据。


3.大数据分析系统


移动定位应用、GPS汽车、自动驾驶车辆、无人机、IoT设备、卫星图像等的快速和广泛使用,导致了时空数据的空前增长。例如,每天大约有10亿条推文被创建,其中30-40%包含地理位置信息。一辆处于自动驾驶低端的车辆每小时产生约1.4TB数据。为了在SDT中托管这些大量时空数据,并支持各种分析和查询操作,最近的研究方向集中在大数据分析系统的时空扩展,如Hadoop、Spark和NoSQL。这些大数据分析系统可以通过分布式处理使SDT系统具有可扩展性。


Hadoop使用MapReduce框架对大数据进行分布式处理。由于Hadoop中没有支持时空数据,因此开发了一些扩展,如Hadoop-GIS和SpatialHadoop,以处理空间数据类型,如点、轨迹等。由于Hadoop是基于磁盘的系统,当有大量的I/O操作时,性能可能会下降。为了解决这个问题,开发了一些基于主存的大数据分析系统,如SpatialSpark、GeoSpark等。另一组大空间数据处理系统已经使用NoSQL范式出现,例如MD-HBase、TrajMesa等。


由于时空数据的增长速度前所未有,SDTs需要托管不同类型的数据以发现洞察并帮助做出预测性决策,因此我们需要这些大空间数据处理系统来构建SDT。然而,与数据库管理系统不同,后者有数十年的研究和广泛的测试,这些大空间数据处理系统仍处于成长期,还没有使用各种空间数据类型和数据流对这些系统的性能进行基准研究。


4.地图和GIS中间件


在本节中,我们讨论了用于在地图上可视化空间(或地理)数据和轻松执行各种空间操作的软件和工具。我们将这些工具和软件分为三组:GIS软件;基础地图;以及API和库。这些系统对于智能、快速和高效开发SDT至关重要。接下来,我们将详细介绍。


4.1 GIS软件

一个集成的地理信息系统(GIS)提供了一个环境,将地图集成以可视化和与空间数据交互,并提供工具对这些数据执行各种操作。它们还提供平台,以在地图上发现有趣的模式和洞察。一些广泛使用的GIS软件是ArcGIS(来自ESRI)和QGIS(开源)。这些GIS软件支持所有基本的空间数据操作和分析设施,并在地图上可视化。这些软件也可以与数据库管理系统和其他底层空间数据分析平台集成。此外,这些软件还支持不同编程语言的编程,如Python、R等。波士顿数字孪生使用ArcGIS技术构建他们的SDTs。


作为一个SDT的主要特点是可视化和与城市环境交互,开发了一个开源的3D地球平台Cesium。Cesium使开发人员能够围绕3D地图构建地理空间应用程序,Cesium特别优化了大型数据集的可视化,例如地形、建筑物和实时传感器数据,并为创建沉浸式地理空间体验而设计。CesiumJS是一个开源的JavaScript库,用于创建世界级的3D地球仪和地图,具有最佳的性能、精度、视觉质量和易用性。新南威尔士数字孪生使用Cesium构建他们的空间数字孪生。


4.2 地图服务

从广义上讲,我们可以将现有的地图服务(如OpenStreetMap、Bing Maps或Google Maps)视为空间数字孪生。这些平台创建并使用物理道路网络、河流、兴趣点等的数字表示来解决各种查询,例如定位兴趣点或找到到达目的地的路线。这些地图服务中还有许多不同的地图层,包括卫星地图、交通地图、地形地图、3D地图等。除了这些基本层外,SDT还需要许多其他地图层,如公用事业地图层、室内地图层,或任何其他基于公用事业的层,如温室气体排放或能源使用。因此,地图层在开发SDT中起着至关重要的作用。因此,可以使用这些广泛使用的地图服务作为构建自己的SDT的基础。


4.3 工具、API和库

到目前为止,我们已经看到了一系列空间技术,如RDBMSs、GeoJSON文件、GIS软件和空间大数据分析平台,用于管理和处理空间数据。SDT依赖于这些平台的集成能力。因此,为了构建SDT,我们需要不同编程语言的库和API的强大支持,以将SDT平台与标准的GIS和空间技术相关平台集成,并执行各种处理、分析、挖掘和可视化操作。几乎所有流行的语言,如C++/Java、Python等,都有具有空间能力的API和库。


低级库如JTS、GEOS、Spatial4j已经使用C++或Java开发,用于建模和处理空间数据(例如,创建矢量几何)。这些空间数据建模的基础库被用来构建GIS软件、大空间数据处理和分析系统等。另一方面,随着像Python和R这样的高级语言在大数据处理和分析中的普及,有许多API和库可用。这些库主要设计用于各种与空间数据相关的任务,包括I/O优化的数据获取、使用不同空间算法处理空间数据、使用统计和高级机器学习进行分析、可视化不同类型的空间数据。我们简要讨论一些Python库和API,因为Python似乎是AI & ML时代大数据处理的最受欢迎的高级语言。


GeoPandas是Pandas的空间扩展,Pandas是一个流行的Python数据科学库。Scipy的空间库为空间算法和数据结构提供了库,如最近邻搜索算法。Python空间分析库(PySAL)旨在进行空间数据分析任务,如聚类、热点分析、相关性、可视化等。它包括支持处理矢量和栅格空间数据。为了管理和处理轨迹数据,Python有traja库。除了上述库之外,还有许多其他空间库对开发SDT有用。


除了上述软件和技术工具,一些商业软件解决方案最近通过结合许多上述空间工具&技术,也作为开发SDT的起点开发出来。Microsoft Azure Digital Twins平台允许创建以知识图形式表示的数字孪生,这允许开发人员创建数字孪生数据模型来表示真实资产及其相互关系。它们还允许与IoT设备无缝集成,以持续数据馈送。3DEXPERIENCE 平台(由达索系统提供)提供创建3D模型的工具,以及许多用于模拟真实生活对象及其过程的模拟工具。HxDR平台(由Hexagonis提供)是一个主要关注创建城市环境3D复制品的SaaS平台。OpenCities Planner(由Bentley Systems提供)是一个城市规模的SDT规划和可视化应用程序软件。


5.关键功能性组件


我们将SDT的功能广泛地分为五个不同的类别:探索和可视化;查询;挖掘;模拟;和预测分析。接下来,我们详细讨论这些内容。


5.1 探索和可视化

SDTs发展最多的一个领域是可视化。许多研究论文和系统[63]专注于可视化,并且也称可视化系统为空间数字孪生的主要目标(这并不完全是一个有效的主张,因为本节讨论的其他关键功能同样重要)。在SDTs的可视化中,通常使用一个基础地图层,并添加不同的数据层,如3D建筑、移动轨迹和空间网络。除了地图和GIS软件如OpenStreetMap和ArcGIS,还有许多3D可视化平台,如Cesium、3DEXPERIENCE、HxDR平台等。虽然某些空间洞察和关系可以被把握,但当前的可视化技术未能捕捉到不同类型和时间线的多样化数据中的深刻空间相关性的全部范围。例如,将3D建筑与其建筑的时间序列能耗在地图上可视化是一项具有挑战性的任务。


5.2 查询

尽管对空间数据库和空间查询进行了广泛的研究,但目前只有少数商业数据库系统,如Oracle Spatial和PostgreSQL,提供对底层空间数据库的空间查询支持。然而,这些系统并不支持新兴的数据类型,如3D数据和轨迹,也未解决如从查询点识别可见的3D对象或查找相似轨迹等专业查询。最重要的是,用户发现编写空间SQL查询并从这些数据库系统中检索所需信息并不方便。用户通常发现使用文本形式制定空间查询更方便,例如在Google Maps和Bing Maps等地图平台上搜索兴趣点(POI)。这种将文本查询与底层空间技术集成的方法,特别是在SDT中,可以被证明是一种高效的用户访问他们所需空间数据的方法。最近的NLP研究集中在将用户文本描述转换为SQL(即,文本到SQL)并从关系数据库中检索所需信息。这些技术的扩展可以空间化,帮助用户查询空间数据。


5.3 挖掘

数据挖掘技术对于分析SDT生成的数据和识别模式、关系和趋势至关重要,这些模式、关系和趋势可以提供有关物理世界运作方式的有价值洞察。例如,挖掘技术可以用来识别城市中温室气体排放量高的区域,或检测某些区域空气质量的异常。设计能够自动从数据中识别出有趣洞察的技术至关重要,这些技术需要很少或不需要人为干预。这些技术对于SDT的有效使用至关重要,因为它们允许我们将原始数据转化为可以用于优化物理系统性能和改进决策的可操作洞察。


5.4 模拟

模拟在空间数字孪生中至关重要,因为它们提供了一种非破坏性的测试和分析系统性能和行为的方法。技术的进步,如云计算、机器学习和物联网(IoT),已经彻底改变了SDT中的模拟功能。空间数字孪生模拟操作可以应用于许多场景。例如,可以在交通中模拟交通流量,并优化交通路线以减少拥堵并提高安全性。可以模拟建筑物或社区的能耗,并识别节能机会。可以模拟生产过程以提高效率并最小化浪费。可以模拟紧急情况,如自然灾害或恐怖袭击,以规划和培训响应工作。在医疗保健领域,可以模拟患者流动和医院运营,以优化资源分配并改善患者护理。


有各种软件工具可用于模拟SDTs,包括AnyLogic、OpenStudio、Simio和Arena Simulation Software。这些工具可用于模拟不同应用中的系统,如交通、制造业、医疗保健和物流。实时信息是SDTs模拟操作的关键组成部分,因为它提供了有关被建模系统的当前和准确数据。实时信息可以从传感器、摄像头和其他IoT设备获取,提高模拟的准确性和相关性。


5.5 预测

AI/ML可以利用实时数据预测并为SDTs提供反馈。这是通过在历史和实时数据上训练模型来预测未来结果、识别异常并提供改进建议来实现的。实时数据在几个场景中至关重要,如交通流量优化、预测性维护和紧急响应规划。例如,在交通流量优化中,来自传感器和摄像头的实时数据可以用来预测交通拥堵并优化交通路线,以减少旅行时间并提高安全性。在预测性维护中,来自传感器和设备的实时数据可以检测设备异常并预测维护需求,避免昂贵的停机时间。


几个组织已经在SDTs中实施了AI/ML和实时数据。例如,圣地亚哥使用实时数据预测并预防野火,通过分析天气条件和其他环境因素。迪拜电力和水务局使用AI/ML预测能源消耗并优化建筑中的能源使用,利用实时数据响应能源需求的波动。鹿特丹港使用实时数据预测船舶运动并优化港口资源,实现更有效和有效的港口运营。


其他相关技术


最近的人工智能和机器学习技术进步,以及在区块链和云计算方面的突破,显著提高了我们在各个领域有效解决广泛问题的能力。接下来,我们将讨论这些技术如何影响SDT的开发和运营。


1.AI和机器学习


AI/ML技术在DT和SDT的开发和运营中扮演着重要角色。SDT是复杂的系统,需要先进的技术来优化它们的性能和效率。AI/ML技术是这方面的关键组成部分,因为它们使数字孪生能够从数据中学习,预测未来的结果,并提供改进的建议。这方面的贡献有三个主要方面:


  • AI/ML技术可以优化空间数字孪生中的各种过程。例如,在智能建筑中,AI/ML可以预测能源消耗并优化能源使用,以降低成本和排放。在智能城市中,AI/ML可以优化交通路线,减少拥堵并提高道路安全。在制造业中,AI/ML可以优化生产流程,减少浪费并提高效率。

  • AI/ML技术还可以用于空间数字孪生的预测性维护。通过分析来自传感器和其他设备的实时数据,AI/ML可以预测设备何时需要维护,从而避免昂贵的停机时间并提高资产的使用寿命。

  • 除了优化流程和维护外,AI/ML还可以通过增强的推荐来增强空间数字孪生的用户体验。AI/ML可以个性化用户体验,预测用户偏好并提高整体用户满意度。


2.区块链


作为数据驱动的软件应用,SDT预计将越来越多地利用分布式账本技术(DLTs),通常称为区块链,以增强其中数据的可信度。区块链是一个分布式系统,被认为是一个分布式账本或一个复制状态机。DLTs提供了基本能力,可以大大有益于SDTs,例如可信的数据获取、处理和存储。区块链支持的系统允许计算机网络存储、验证和更新一个只添加事务日志(即,账本)。以太坊、超Fabric和比特币是一些可以被考虑用于为SDTs提供可信度的DLTs实现。然而,在将DLTs纳入SDTs之前,需要评估几个其他关注点。


虽然区块链的功能和属性可以提供一个可靠的支持系统,以确保可信度,但重要的是评估哪种区块链适合SDTs。一些探索领域可以是区块链的类型适用性,例如私有/公共,共识协议的性质,例如工作量证明(PoW)或权威证明(PoA),以及实证理解存储和操作区块链的区块链网络的特征。例如,性能、资源消耗和可用性是关键属性,需要研究,因为这些不是区块链网络的固定特性,而是基于区块链网络的设计而变化,网络设计知识变得非常重要。有越来越多的科学和商业文献以及现成的产品,可以帮助进行任何类型的可行性研究和/或实验,系统地评估使用DLTs支持SDTs的机制和潜在好处。


3.云计算


SDT预计将由大规模的技术基础设施支持,用于计算、存储和网络。支持基础设施还预计将满足诸如可扩展性、延迟、安全性和可用性等质量属性要求。随着虚拟化基础设施技术的成熟和广泛采用,如云/雾计算、容器和网络功能虚拟化(NFV),SDT可以有效地利用基于云计算的技术。考虑到公共云服务提供商(如Amazon Web Services和MS Azure)提供的大量云服务,以及私有云基础设施,全面理解各种技术和商业模式对于获取和利用虚拟化基础设施服务以支持SDTs变得至关重要。


例如,技术模型包括基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。云技术主要提供三种数据存储、处理和网络的主要部署模型:私有、公共和混合。所有这些技术和商业模式都有其优点和缺点。例如,公共云可能比私有云更昂贵,后者被认为更安全。然而,选择私有云的组织需要拥有设计、实施和运营私有云的知识和专业技能,以满足SDTs的功能和非功能要求;使用商业云基础设施则不需要这些知识和专业技能的要求。


挑战和未来的工作


考虑到空间技术和SDTs当前的知识状态,我们确定了一组关键的挑战和机会,需要研究人员和从业者立即关注,以构建一个可持续的SDT。在本节中,我们讨论了这些挑战,并列出了一些重要的未来研究方向。


1.多模态和多分辨率数据获取


大多数现有研究在这一领域强调数据获取和集成是SDT的主要挑战之一。SDT涉及获取广泛的种类繁多的空间和非空间数据。由于SDT需要使用多种设备来捕获不同空间和时间分辨率、尺度和精度的数据,这些数据的质量差异很大。据我们所知,还没有进行纵向研究,对用于捕获各种空间数据的数据捕获设备进行基准测试,以便可以无缝集成来自不同来源/设备的数据处理。例如,BIM和3D GIS数据的集成仍然是一个挑战,这是由于生成过程(或数据源)和这两种格式所使用的标准的差异。


2.空间查询的自然语言处理(NLP)


当前SDTs上的查询处理技术仅限于在关系型或NoSQL数据库系统上运行SQL查询,或在地图服务上运行文本查询(例如,在Google Maps上查找兴趣点)。最近的NLP突破使研究人员能够设计出文本到SQL的技术,这些技术有助于自动将自然语言文本转换为SQL,并运行查询以从数据库表中检索答案。尽管这种方法的准确性还不足以商业使用,但最近的非常大的对话生成语言模型,如GPT-3/4和LaMDA,在基于自然语言的数据库查询处理方面显示出巨大的希望。我们预见到,在SDTs中利用这些非常大的语言模型进行基于自然语言的查询处理,将有很大的研究范围。由于空间数据及其关系和其他描述空间实体的关联数据使整个数据交互用例变得复杂,有趣的是,我们如何可以结合使用不同的空间(例如,相邻/附近)和结构(例如,道路网络)属性以及表格数据来回答SDTs上的用户查询。


3.为SDTs基准数据库和大数据平台


一些最近的研究工作在有限的设置下实验评估了不同的空间数据库和大数据平台。在[43]中,作者使用纽约市人口普查区块和街道的小空间数据集比较了Oracle Spatial和PostgreSQL的性能,他们使用选择和范围查询来衡量性能。在[101]中,作者比较了MongoDB和PostgreSQL,以衡量空间时间范围和接近查询的性能,他们使用了多边形和船舶运动(一系列经纬度对)数据集。另一项最近的工作[102]将基于Geospark的系统与三种数据库技术进行了比较,即MongoDB、PostgreSQL和Amazon EC2服务,他们同样使用了多边形和船舶运动数据集来衡量范围和接近查询的性能。从我们对当前研究的观察来看,这个领域的数据库技术仍然不成熟,只支持基本的空间数据和空间查询。由于SDT通常托管各种形式的数据,从3D建筑数据到能源消耗的连续流,这些数据在现有平台上的有效性尚未进行基准测试。


4.多模态分析


图像和文本在多模态语言模型中的集成,如CLIP,使它们能够共同学习数据空间,并有效解决与多模态数据相关的挑战。此外,多模态大型生成模型,如GPT-4,已经展示了在多模态学习领域的显著潜力。我们预见到,通过结合不同的数据形式,如由传感器收集的实时数据(例如,交通、能源消耗)、由卫星或无人机拍摄的图像、空间邻域特征,并训练一个大型多模态模型,可能能够生成有用的洞察。


5.构建模拟环境


由于社会互动、经济因素和人为因素等许多因素可能无法在SDTs中被捕获,因此构建一个模拟环境以模拟这些因素并与捕获的SDTs数据的关联进行评估是重要的。未来的研究应该关注如何为SDTs构建一个现实的模拟环境。不同的模拟软件,如AnyLogic、OpenStudio和Simio,已经为交通、物流和制造业等应用开发。由于SDT的范围和规模与DTs显著不同,研究如何开发一个模拟平台以涉及SDT的不同因素是一个潜在的研究领域。


6.可视化复杂和多样化的交互


SDT涉及各种形式的数据,如基础设施数据(例如,3D建筑、道路等)、传感器数据(例如,能源/燃气/水消耗、交通等)和社交媒体数据(例如,Twitter、Instagram等)。涉及这些复杂数据对象交互的数据可视化存在许多挑战。例如,由于超过三个维度的可视化对于典型用户来说不易理解,因此很难将不同形式的数据组合起来,例如在地图上将3D建筑与其建筑的时间序列能耗可视化。此外,由于数据可能是更高维度和不同类型的,因此需要更多的研究来可视化跨空间和时间维度的这些数据集之间的相关性。此外,如何在地图或GIS软件上添加和可视化附加到特定位置的不同数据层,以观察相关的数据交互和洞察,也需要进行研究。


总 结


在本文中,我们提出了一个全面且系统的关于构成空间数字孪生(SDTs)基础组件的空间技术集 合。SDTs的构建块被归类为四个层次,我们为每个层次提供了关键空间技术的全面概述,涵盖了数据获取、处理、存储和可视化等方面。我们还展示了AI和ML、区块链以及云计算等现代技术如何促进更有效和高效的SDTs的发展。


重要的是要注意,目前还没有现有的研究专注于识别这些对于SDTs开发至关重要的关键技术。因此,在这个多学科领域的研究人员和从业者,特别是那些对地理空间进步了解有限的人,可能会在采用这些技术进行SDTs开发时遇到困难。因此,这项跨学科工作在弥合地理空间、城市和交通工程以及城市规划等领域的研究人员和从业者之间的差距方面具有巨大的潜力。



来源:数字孪生体实验室
System航空船舶汽车建筑电力python云计算UMBIM数字孪生物流人工智能无人机AnyLogic
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-05-26
最近编辑:5月前
数字孪生体实验室
围绕数字孪生技术的创新研发,推...
获赞 446粉丝 367文章 597课程 2
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈