DTEmpower是由天洑软件自主研发的一款通用的智能数据建模软件,致力于帮助工程师及工科专业学生,利用工业领域中的仿真、试验、测量等各类数据进行挖掘分析,建立高质量的数据模型,实现快速设计评估、实时仿真预测、系统参数预警、设备状态监测等工程应用。软件内置有图形化、零编码的数据分析建模环境,围绕数据清理、特征生成、敏感性分析和模型训练等环节提供丰富的AI算法,提供从模型搭建到模型管理应用的一站式解决方案,学习门槛低、模型质量高,零基础用户也能快速挖掘得到优秀的数据模型。
在本节中,将介绍DTEmpower在实际工程案例中的具体应用。该案例来源于某电厂化学水处理系统反渗透过程,反渗透是采用膜法液体分离技术,利用膜两侧的压力差为动力,使溶液中的溶剂透过反渗透膜分离出来。本案例利用反渗透进水母管压力、一段入口流量、一段压差、一段产水流量、一段浓水流量等参数训练得出反渗透二段压差智能预警模型。其部分算例数据如图1所示。
双击打开DTEmpower软件,即可进入到如图2所示的界面。单击新建项目,即可创建一个临时项目文件,需要注意的是,临时创建的项目文件不会自动保存。如果想要保存项目文件,用户可以进入到项目中选择“文件-保存”,就可以保存工程文件到自己想要的指定位置。
新建项目之后,即会进入到DTEmpower的工程主页面,如图3所示。
进入工程主页之后,点击“导入数据”,即跳出数据集文件上传窗口。点击窗口中的“选择文件”按钮,即可选择本地磁盘中的数据文件加载至当前项目中,如图4所示。
数据集添加完成后即出现在左侧的资源菜单中,如图5所示。
上传数据集之后,单击选中数据集,在数据集的右上方,点击选择“数据建模”,会即弹出数据建模的两种模式选择,点击选择专业模式,如图6所示。这里可以根据用户自身需求更改流程名称和描述(非必须操作),然后点击确定按钮。
点击确定之后,原始数据的载入即以“数据读取”节点的形式加入至建模流程中。在建模画布与左侧资源树中均可以观察到新增的节点,如图7所示。
将工具箱切换至数据操作,从中将变量设定节点拖拽至画布中,并连接数据读取节点,如图8所示。
点击开始,当流程运行至变量设定节点时,在弹出配置窗口中将“反渗透二段压差”选为输出变量,其余(除时间)变量选为输入变量,如图9所示。
5)数据清理
将工具箱切换至数据清理,从中将AIOD节点拖拽至画布中,并连接变量设定节点,如图10所示。
点击开始,在跳出配置弹窗中,左侧散点图绘制窗口的Y轴变量选择“_risk_scores”,X轴变量选择“反渗透二段压差”,即可观察对应异常值的分布情况。在右侧表格中,设置风险阈值为0.25并点击筛选按钮,即可自动选中下方表格中_risk_scores_大于0.25的样本。点击预览可观察异常样本的分布。最后点击右下角提交后完成异常点清理,如图11所示。
6)敏感性分析
将工具箱切换至敏感性分析,从中将GRA节点拖拽至画布中,并连接AIOD节点,如图12所示。
点击开始,在跳出配置弹窗中,将反渗透二段压差的相关性阈值设为0.7,并点击确定,如图13所示。
7)数据分割
将工具箱切换至数据操作,从中将数据分割节点拖拽至画布中,并连接GRA节点,如图14所示。
点击开始,数据分割节点将原始数据集随机分割为训练集与测试集,具体分割比例可在节点配置中调整,如图15所示。
8)模型训练
将工具箱切换至回归训练,从中将BaggingDeFo节点拖拽至画布中,并连接数据分割节点,如图16所示。
在BaggingDeFo节点配置中,开启交叉验证。点击开始,模型训练结束后,可在左侧资源树中查看模型详细信息。点击顶部菜单栏模型处理中的线性拟合或误差对比等,可观察模型训练效果,如图17所示。
9)模型测试
将工具箱切换至模型操作,从中将模型对比节点拖拽至画布中,并同时连接数据分割与BaggingDeFo节点,如图18所示。
点击数据分割与模型对比之间的连线,在连线配置窗口中选择编辑,将输入值改为test_data并点击确定,如图19所示。
点击开始,运行结束后可查看模型测试结果,如图20所示。
10)模型测试
当确认得到满意的模型训练效果后,可以通过在资源树的模型上点击鼠标右键下载至本地磁盘中,如图21所示。