在神工坊ParaView上体验并行渲染可视化

11月前浏览2345

ParaView是一款开源的通用数据分析和可视化工具，用于处理各种类型的科学和工程数据集。它可读取多种数据格式，常见的如VTK、CSV、XDMF等。同时，ParaView也是一个跨平台的工具，不仅支持Windows、Linux和Mac OS等操作系统，还可以在多种计算机架构上运行，如x86、POWER、ARM等。支持这些并行架构意味着ParaView可以并行处理庞大的数据集，收集各进程上的结果，并将其可视化。在可视化方面，ParaView提供了许多通用的可视化技术用于显示和分析工程数据集，如切片、等值面、流线、轮廓、高级渲染等。本文主要介绍ParaView在神工坊平台上的使用，通过对算例热点函数的性能加速分析，发现增加GPU数量对数据I/O、数据生成和数据提取操作的并行加速效果非常可观。

1 什么是可视化

可视化过程是指将原始数据转为一种可以直接显示并且易于理解的形式。这个过程可以帮助用户更好地理解数据，从而揭示数据背后的隐藏关系。在ParaView中，可视化过程通常包括三个步骤，分别是读取数据，过滤数据和渲染数据。

读取数据即是从数据源文件中获取数据，存储在ParaView支持的数据类型中。

过滤数据即是根据不同需求对数据进行预处理，常见有以下操作：

1、切片（Slice）是通过在数据集上切割平面，选择切割平面的位置和方向，并调整可见的切片厚度来显示沿着该平面的数据分布。如下图所示，图中为某平面上速度的数据分布。

2、等值面（Isosurface）是将数据集中特定数值的表面提取出来，以显示数据的连续性或离散性。根据需求，设置不同的等值面数值。如下图所示。

3、流线（Streamlines）是根据数据集中的矢量场信息，绘制流线以显示流体或气体的流动路径和速度。可以根据需要调整流线的密度和长度。如下图所示。

高级渲染（Advanced Rendering）即是提供各种高级的渲染技术，如体绘制、体积渲染、阴影、反射等，以增强可视化效果和表达能力。

2 如何在神工坊平台上使用ParaView进行并行渲染？

首先，用户需要在神工坊平台上运行ParaView实例，具体操作如下图（点击登录神工坊平台）。神工坊目前已经为用户完成并行运行模式的配置，用户只需要选择适合的CPU和GPU数量即可开始体验。

在渲染上，ParaView实际是调用了IceT库实现其并行渲染算法。IceT是一个开源的并行图像合成库，主要用于在大规模并行计算环境中可视化和渲染应用程序。IceT库提供了高效的并行渲染方法，适用于需要处理大规模数据集的可视化应用程序。ParaView通过库中sort-last算法进行并行渲染，算法将图像分割成多个小块，每个处理器都独立地渲染它所负责的块，并生成局部图像。然后，利用通信库（MPI）将这些局部图像组合起来，形成最终的合成图像。