01
引言
作者:司光亚,王飞,刘洋
(国防大学联合作战学院)
01
引言
仿真是继理论研究和科学实验之后认识世界的第三种范式,而作战仿真被公认为是和平时期推演战争、研究战争的有效手段。它通过对战场环境、各方作战实体、行为及其交互的建模仿真,不仅为作战人员提供了一种亲身体验战争的途径,同时也为研究分析战争搭建了一个可能的平台。
大型仿真系统能够描述陆、海、空、天、电多维战场空间各种作战实体在不同作战行动支配下的各种复杂交互,仿真实体规模庞大,数量众多。利用这种大型仿真系统开展的战争推演与探索性仿真,会产生海量的仿真数据。
这些仿真数据不仅记录了对抗推演的过程及结果数据,而且包含了由参演人员在作战指挥中产生的指挥行为数据;不仅包括了指令信息、战损战果等结构化的数据,而且包括战场报告、 标绘态势图等非结构化的数据。这种仿真大数据蕴含着丰富的战争复杂性规律,是研究战争复杂性机理的宝藏。
02
相关工作
在体系复杂性机理研究方面,2004年Jeffery R.Cares 提出基于分布式网络化系统的信息时代作战模型及其数学结构、动态操作演化,将作战网络抽象为传感器、决策者、响应者和目标,以邻接矩阵表示网际关系,并通过矩阵的特征值来研究复杂性机理。
2009年,Sean Deller 等基于Cares 的理论模型在 NetLogo 平台上实现了基于Agent 的交战模型,完成了不同网络拓扑结构与军事效能关系的仿真研究。韩国 Youngwoo Lee 将网络节点分为友军 Agent、敌军Agent、任务、信息和位置,采用元矩阵的方法建立了物理网络模型。王鸿洁将整个 C2 组织结构看作耦合的信息网络和指挥网络,建立了耦合的信息/指挥网络 Agent 模型和决策实体之间的信息流结构模型。刘忠将作战体系看成结构层和属性层构成的超网,结构层中的实体为侦察、指控和火力单元,三类实体分别构建情报网络、指控网络和火力网络,用三元组表示作战体系超网络。Ann Wong提出用任务进程层、人员层、应用层、系统层和物理网络层构成的多层网络来描述,实现了网络中心行动与作战任务的关联。刘大伟、石福丽均采用四元组分别建立了作战体系的超网络多 Agent 模型和军事通信网超网络模型。刘洋博士从“人在回路”的战役兵棋演习大数据中抽取指控关系网和动态作战体系网络的数据,进行了指控关系网分析和作战体系网络分析,验证了指挥结构扁平化、基本结构小型化的趋势。王飞通过构建武器装备的异质超网模型,初步探索了基于超网络在体系评估方法。
总体来看,当前复杂网络方法作为体系复杂性机理研究的一种有效手段已经被广泛应用,但与相关的军事问题结合不够紧密,相关指标的可操作性有限。在军事仿真领域,数据挖掘技术已有广泛应用。肖滨等认为,作战仿真实验数据记录必须满足分析评估的需求,满足仿真实验海量数据和实时性的要求。而数据挖掘和可视化分析是有效的仿真记录方法。张最良认为建模仿真分析中,数据挖掘(Data-mining)和文本挖掘(Text-mining)技术是较好的半自动数据搜索工具,使用这类工具可在DIMP/PMESⅡ领域进行大量时敏数据的搜索。李德毅院士提出了网络化数据挖掘方法,认为网络化数据挖掘不同于传统数据挖掘方法,其基本思想是采用复杂网络的方法来建模,通过将大规模实际数据对象及对象间的关系映射为网络拓扑的形式,采用复杂网络的理论和方法,按照需要的粒度对网络拓扑结构进行分析和挖掘,最终发现蕴涵在其中的、反映事物间联系规律的信息和知识。
大数据与数据挖掘一脉相承,现在的应用多集中在社会、商业和 IT 领域。军事领域的数据存在着共享难、密级高、来源复杂、类型各异的问题,使得很多研究数据或者数量规模偏小,或者因为只能为自己的研究服务而缺乏说服力,或者干脆是“造”出来。因此,虽然大数据已经引起军事机构和专家学者的广泛关注,但是数据分析的方法和理念还停留于传统的统计分析和数据挖掘层面。
03
仿真大数据的特征
任何仿真系统都是依托数据开始,依托数据进行,依托数据表达。在使用体系仿真系统进行训练或分析应用过程中,用户不断依据推演态势做出判断、定下决心,这种推演态势正是在数据的基础上动态生成的;用户依据定下的决心以指令干预的方式实时下达给模型,或者事先将演习人员拟定的方案或计划转换成作战指令,驱动模型运行,从而使得各种作战实体发生交互,又不断产生出各种数据信息。同时,这些数据实时地改变着系统中各个实体的动态属性,又形成新一轮的实时推演态势。本文将这些数据统称为“仿真大数据”。与一般的仿真数据相比,我们认为仿真大数据具有以下几个特征。
3.1 “人”是仿真大数据的灵魂
在体系仿真中,仿真数据是“人”与系统相互作用的结果。“人”,包括系统的使用者(演习的实际参演人员)与系统的管理者(系统开发人员和导调人员)。根据仿真输出的情况,“人”可以调整与补充演习所需的数据,再次进行准备,形成新一轮仿真的基础。这类仿真大数据的生成过程见图 1。
人的参与使得仿真由机器对抗变为人的对抗, 极大的提高了仿真大数据中隐含的价值,为体系复杂性机理及效能评估的研究提供了基础数据条件。
首先,人的参与使仿真数据中隐含着体系作战的复杂性信息。比如,指挥员或军事分析人员通过“人在回路”或“人不在回路”的方式指挥虚拟的部队进行对抗,产生了作战体系形成过程中所必须的 “协同”、“竞争”和“对抗”等相互作用,使得数据能够较真实的反映体系作战的复杂性。
第二,人的参与使得在和平时期研究体系对抗的特点规律成为可能。“人在回路”的推演形成了“多人-多机”一体的对抗环境,可以充分体现指挥员的指挥理念和指挥行为,既反映了作战的进程和指挥,也反映了指挥员在作战体系形成中所起的“主导作用”和 “主观能动性”。
第三,人的参与使体系仿真系统变成了“活”的复杂系统。与一般基于Agent 的仿真方式不同,驱动仿真运行的不是单纯的规则,而是规则与智能的结合,使得仿真中的作战体系真正具有了动态演化的特征,能够反映各种因素对体系运行演化的复杂影响。
3.2 仿真大数据能够反映体系内部、体系与环境、体系与对抗体系的复杂关系
大型体系仿真系统一般支持多方对抗演习,涵盖陆、海、空、天、电多维战场空间,仿真实体规模庞大,数量众多,交互复杂,基本覆盖了物理域 和信息域中的交互内容,而人的参与使得这些交互最终反映在认知域,进而推动体系在物理域、信息域和认知域的动态演化。因此,仿真大数据中隐含着体系对抗的结构、性质及演化的特点规律,既可直接刻画局部的作战行动,也可体现局部涌现出的整体行动效果,而且还能追踪到指挥员根据战场情况定下决心,怎样实施作战指挥的具体过程。通过对这些数据进行分析与挖掘,许多隐藏的规律性信息或异常突变,如指挥员的作战思想、指挥理念、武器装备与战法运用、信息优势的获取等等,就有可能被洞察和发现。
3.3 仿真大数据具有内在的关联性
大型体系仿真产生TB 量级的数据。以“人在回路”的对抗推演为例,通常作战时间一天内会产生数十 GB 的数据量。一次作战时间在 30 天左右 的对抗推演的数据量在数百GB 以上。如果以一个想定为背景进行反复推演或进行探索性仿真分析,积累的数据将在 TB 量级以上。而这些数据具有一定的关联性,比如可能是同一问题下不同用户进行的推演,或者是在同一背景下对不同方案和因素的比较等,这使得数据内隐藏的信息可以在统一的框架内进行分析,是其成为仿真大数据的一个基础条件。此外,由于多仿真系统的联合仿真已经成为研究军事问题的常规方式,这些仿真数据可能是由多个仿真系统输出的,以反映问题不同方面。
基于上述仿真大数据的特征,本文给出仿真大数据的定义:定义 1 仿真大数据是指在人的参与下,在大型计算机兵棋演习、方案虚拟推演、装备体系仿真等体系仿真应用中生成的,能够反映体系中复杂关系的,多维、异构的多样本海量仿真数据。
04
基于仿真大数据的分析框架
以仿真大数据为基础,以具体分析应用为牵引,形成的分析框架如图2所示,总体上分为体系仿真环境与数据规划、大数据采集存储和体系分析 挖掘三个层次。体系仿真环境与数据规划为体系分析提供高质量的数据;大数据采集存储主要功能包括数据采集、高效存储、归类等;体系分析挖掘主要实现面向用户和应用需求的各种分析功能。大数据采集存储部分遵循一般的大数据平台实现方式,本文只介绍其它两部分内容。
4.1 多重循环的仿真数据规划
与多数的大数据应用不同,仿真实验可以在很大程度上控制数据的生成,因此,仿真数据规划是仿真大数据方法与一般方法的重要区别,同时也使数据采集在总体框架中的地位弱化。
首先给出仿真数据规划的定义:定义 2 仿真数据规划是指通过对仿真实验环境、想定、方法和流程的设计,有重点的输出数据的过程。仿真实验通常分为实验准备(Pre-ExperimentPhase)、实验实施(Experiment Phase)及实验分析与结果反馈(Post-Experiment Phase)3个阶段。如果不考虑模型因素,实验准备和实验实施阶段基本决定了数据的特征和质量,也直接影响实验分析的结果,仿真数据规划主要作用于这两个阶段。
结合体系仿真实验的特点,将实验准备阶段细化为想定准备和想定提炼 2 个环节,就形成了体系仿真实验的五环实验框架,如图 3 所示。它既表现了定量定性相结合形成分析结论的过程,又反映了仿真数据不断循环积累的过程。
4.1.1 想定准备
根据实验关注的内容构建合理的作战背景、作战概念,将需要试验的目标(如装备、方案、战术 等)接入作战背景,构设合适的实验边界(根据需求 和技术能力)。这一步骤将决定仿真数据输出的基本特征和数据分析的目标。
4.1.2 想定提炼
在想定准备的基础之上,对实验想定做进一步校验、调整和优化,使得体系的编成、部署更为合理,实验空间更聚焦。如果说想定准备是对想定的 宏观调整,那么想定提炼就是对想定的微观调整,决定了数据中是否会产生与现实近似的关联关系,以及体系的“涌现性”能否得到体现。
4.1.3 仿真实验环
在前阶段生成的基本想定基础上,采用变更装备性能、数量、变更网络结构以及作战行动等多种 “方案变量”的方法构造多个仿真运行方案,并选 择仿真方式或仿真系统进行仿真。其中人在回路的对抗推演更具价值,但同时存在成本高、速度慢、需要协调多方面因素的问题。推演与人不在回路的构造仿真相结合,前者负责推演全程,后者负责仿真片段可能是更高效的方式。仿真实验环所采用的多方式、多系统、多样本的仿真方式是产生仿真大数据的直接原因。
4.1.4 数据分析环
根据实验目标和实验结果,制定分析所需的度 量指标,采集数据,评价体系能力,研究体系能力 的影响要素等。
4.1.5 聚焦实验环
聚焦实验环由上述 4 个基本循环构成,它们组成了仿真实验的一个基本周期。聚焦实验环是从实验整体上迭代逼近最终目标的过程,用户根据每次的实验结果进行判断,决定是否迭代进入下一个周期的实验。这种螺旋上升的渐进方式,有利于实现对问题的深入研究。
4.2 体系分析挖掘
这部分为用户提供理解体系、评估效能、分析决策等支持体系分析应用的工具,该层方法的核心是基于超网络模型的数据分析方法,相关内容在下节介绍。
05
基于仿真以超网络模型为核心的大数据分析方法
现代武器装备体系呈现典型的网络化特点,超网络理论从“网络的网络”的角度分析问题,能更好地研究体系的级联、涌现等性质,探索武器装备 体系复杂性机理。在超网络理论指导下进行仿真大数据分析,更有利于解决体系中功能网络间依赖关系,体系拓扑结构特性、演化特性等性质与体系能力指标之间的关联关系等复杂性问题。
5.1 基于超网络模型的大数据分析框架
当前国内关于体系的复杂网络模型,多基于静态体系构建,或者将重点放在体系网络的建模算法和演化规则设计上。实际上,由于体系对抗也是人谋略的对抗,难以建立与实际体系演化过程相似的网络模型,因此,所建的模型作用非常有限,其性质也难以外推到体系层面。先进的仿真技术可以实现体系对抗的模拟,特别是人在回路的推演模拟方式,将人的智慧融入仿真,使得仿真中的体系演化具备真实体系演化的一些特征,因此,通过将仿真数据还原映射而建立的体系的动态超网络模型,能够更好的反应体系演化的效果。
基于超网络的大数据分析框架如图 4 所示。框架中的超网络模型可以看成是支撑大数据分析的核心引擎。它以多层网络的形式还原描述仿真实验中体系的演化过程,并借鉴复杂网络理论对体系进行动态的“测量”(当然测量的内容不仅仅是超网络的相关内容),结合基于模型的推理,分析体系的状态、能力和效能,支撑体系的挖掘分析多维对比。体系超网络建模的原料为单次仿真的全过程数据(想定、过程、结果数据等),主要方法步骤包括数据提取、映射(超网络建模)、统计、计算和挖掘分析等,其中的重点内容是对体系各级各类指标值的量算。框架中的主要部分包括以下几方面。
5.1.1 超网络概念模型
超网络概念模型根据实验目的和实验设计构建,能够反映不同要素之间关系。该模型由不同网络构成。比如研究信息交互对作战的影响,可以依托基础信息网络、节点间的信息关联关系和主要的信息交互构建超网模型;若研究后勤对作战的影响可依托物资分配网络、供应关系和保障交互建立超网络模型。
5.1.2 体系超网络建模
使用仿真数据将概念模型实例化,形成仿真数据模型。仿真数据包括仿真的输入和输出数据,概念模型是对仿真数据的一种组织形式,通过仿真数据向分析模型的映射,可以起到对仿真数据筛选、处理、提炼、组织的作用。生成的数据模型可分为静态模型和动态模型,静态模型没有时间维度,是对动态仿真过程的一种压缩,动态模型含有时间维度,可以基于某种采样过程或时间段内的平均,相对来说涵义更丰富些。
5.1.3 分析指标(MoM)
在问题理解和实验设计的基础上,借鉴超网络相关理论与方法,设计构造能够描述体系“宏观— 微观”性质的评价指标。数据模型的各种参数往往 就是评价体系能力的指标,因此对模型的量算相当于对各种指标的计算,具体方法包括数理统计、网络科学中的各种算法等数据处理方法。模型的量算可以看作是对原始数据的“加工”,将不适于分析或表现的数据“加工”为适于分析的数据。
5.1.4 体系的挖据分析与多维对比
是在分析模型和各种分析指标的支撑下,结合大数据方法,按照不同的仿真实验方案、不同的指标、不同的时间空间进行多角度比较分析。主要目 标是发现体系的关键指标,分析不同指标之间的关联关系,观察体系对抗演化过程中的非线性过程,比对展示不同装备对体系能力的影响,并通过关联分析及因果分析等方法对待研装备影响下的体系演化进行深入挖掘,探究武器装备体系能力形成和变化等深层次问题。
5.2 体系的超网络概念模型
选取体系对抗中较为关键的因素,可以将体系映射为物理网、关系网和交互网 3 种网络, 如图 5 所示是该概念模型的一个实例示意。
物理网(Physical Network PN)是体系在物理域的映射,节点表示各种装备的物理实体,边是他们之间的物理链路。关系网(Relationship Network RN) 是各种软件规定的组织关系和作战关系的**,包括指挥、支援、协同和保障等关系,是对作战单元间交互性质和趋向的一种规范。物理网和关系网是体系框架(静态)结构的主要内容。交互网(Interaction Network IAN)是体系运行 过程中作战单元之间的物质、能量、信息等交互的网络化表达。交互网是体系的运行结构的外在表 现,又代表了所有交互效果的**,因此体系的对抗效能主要通过对交互网的测量得到。参考Jeffery R. Cares 的 IACM 模型,可将交互网中的节点分为传感节点(S)、决策节点(D)、火力节点(F)和目标 节点(T),也可不作划分。
5.3 体系的超网络数据模型
根据概念模型,推演过程中单方作战体系可以建模为包含指挥控制网络与作战单元网络在内的二层演化网络模型。其中,指挥控制网络主要用于描述指挥员的指挥行为是如何影响本方作战单元网络的结构特性与时空演化行为,节点为指挥员和作战单元,边为演习过程中指挥员对作战单元的动态与静态指挥关系(既概念模型中关系网);作战单元网络中,节点为作战单元,边为作战单元之间动态交互(既交互网),如推演过程中的信息支援、指控命令、火力打击等等。多方对抗交战关系会直接导致交战过程中作战单元网络中节点与连接的退出。作战体系的网络模型是属于动态网络演化模型,此类模型的网络节点和边在演化过程中会动态变化,或增或减。某一时刻的网络快照如图 6 所示。
5.4 体系的复杂性机理研究
利用仿真大数据结合超网络方法研究体系的复杂性机理,具体内容包括但不限于以下几个方面。
5.4.1 基于仿真数据的指挥员行为模式挖掘研究
作战体系超网络模型可以很好地刻画指挥员之间、指挥员和作战人员之间关联关系与交互关系。大量的仿真数据可以帮助我们分析指挥员的行为模式。可以通过对指挥员的指挥行为进行跟踪监测,对其时空运行轨迹的规律进行分析与挖掘,可以发现指挥员指挥行为方式遵循的可重复模式。
5.4.2 基于仿真数据的体系作战协同过程研究
协同是系统演进的真正动力和源泉,协同作用的好坏程度决定了系统整体功能的强弱。体系协同,是指两个或多个作战体系之间为达成同一作战目的而发起的协同作战行为;战场协同的获取主要体现在作战要素的自同步上。各个作战单元都必须依照作战决心,围绕作战任务,来规范各自的行动,相互协调,就有可能产生 1 1>2 的涌现效应。可以通过考察作战体系动态演化中出现的协同现象,研究指挥员的指挥行为对演习进程(或战争)的影响。
5.4.3 体系能力的关键指标挖掘
体系在不同的环境、任务、对手等条件下表示出的能力是不同的,同样用于衡量能力的指标也是不同的,最合适的指标或指标集需要通过反复试 验、观察逐步涌现出来。因此,可以在对体系超网络模型测量得到的大量指标基础上,研究选取体系能力的关键指标的方法。例如,可以采用机器学习方法,通过有监督(需要标识数据)或无监督的学习,自动选择对体系能力产生关键影响的指标,并通过系统的实际应用验证挖掘指标的有效性。
06
结论
战争不会重复、未来难以预测,但通过仿真我们可以提前受益。仿真大数据的研究只是刚刚开始,目前面临很多困难和技术性的难题。我们在对各种对抗推演、仿真数据的分析过程中发现,数据中存在复杂的联系,其价值远超普通的统计分析所能达到的水平。结合多年的研究我们提出基于超网络模型的大数据分析方法,超网络模型是该方法的核心但并非全部,本文由于篇幅限制只简要介绍了方法的思路、框架和其中部分重要内容。面向应用的各种数据挖据、分析方法是下一步研究的重点。
感谢您阅读,我们下期见!