摘要
本文探讨了工业4.0技术在钢铁工业中提升可持续性与竞争力的应用,特别是智能维护和数字孪生技术。泰纳巴西钢厂通过AI进行连铸机异常检测,减少非操作停机时间。数字孪生技术提高了设备和工艺的可用性和可靠性,但实施中需管理期望、流程和团队集成等挑战。此技术展示了钢铁工业向智能化转型的潜力。
正文
致力于数字孪生体技术的研究与发展
通过解决方案和工程化应用造福人类
来源:唐杰民冶金40年
译者:唐杰民
数字技术正在改变工业的各个层面。作为特定数字技术的早期采用者,钢铁有机会引领所有重工业,以提高我们的可持续性和竞争力。本专栏是AIST成为钢铁数字化转型中心战略的一部分,通过提供各种平台来展示和传播钢铁制造特定的工业4.0知识,从大局的概念到具体工艺流程。
在过去的两个世纪里,工业维修的发展经历了几个阶段。最初阶段(19世纪和20世纪初)的特点是只关注设备和机器故障时的修理,很少强调预防性维护。[1]随着振动分析、油气分析和红外热成像等新技术的发展,20世纪中期出现了向预测性维护的转变,即对设备进行监控,以在故障发生之前发现潜在问题。
全面生产维护(TPM)出现于20世纪后期,旨在让所有员工参与维护过程,并侧重于预防性和预测性维护。基于状态的维护(CBM)出现于21世纪,它使用实时数据来做出维护决策。工业维护发展的最新阶段是预测性维护2.0,它结合了人工智能和机器学习等先进技术来做出维护决策,目标是减少停机时间、提高效率和降低维护成本。[2]本文讨论了连铸机数字孪生的运用。
泰纳巴西钢厂
泰纳巴西钢厂是一家长流程钢铁厂,从加工原材料到制造成品所有阶段,它通常由高炉生产铁水和转炉以及和制造钢板的连铸机组成。综合钢厂生产的钢材用于许多行业,包括建筑、运输和包装。这种类型的设施以其高效率而闻名,与单独布置的电炉短流程冶炼设施相比,它能够以相对较低的成本生产大量钢材。此外,它在原材料方面是自给自足的,通常拥有自己的铁矿石和煤矿。
连铸机
自2010年以来,泰纳巴西钢厂Ternium Brasil有双流板坯连铸机,每流板坯连铸机有14个扇形段。这套连铸机的年生产能力为500万吨板坯,板坯厚度为200mm、220mm和255mm,板坯宽度为800mm至2000mm,图1是连铸机的示意图。
智能维护理念
检测工业机械和过程中的异常行为是当前制造业领域的一个关键方面。人工智能(AI)彻底改变了这一领域,使其更加复杂和有效。人工智能异常检测利用先进的算法实时检测正常操作的变化,从而在潜在问题造成重大损害或中断生产之前及时识别潜在问题。为此目的使用人工智能的显著优势在于它能够分析来自各种来源的大量数据,例如传感器、机器日志和控制系统。这些人工智能系统所采用的算法能够识别出通过传统手段可能被忽视的模式和异常。如图2所示,AI早在运行警报之前就会生成一个与故障相关的事件,从而可以在预定的维护议程中更好地对活动进行编程。图3给出了两张图,解释了传统监控系统和多变量系统之间的区别。传统监控系统中,每个变量都有一个固定的报警值,单独处理它们,而不考虑分析中其他资产变量的状况。多变量系统根据分析模型所了解的运行状况创建不同的阈值。
(○设备和工艺处于正常的管理状态;第二列淡蓝色:人工智能检测到的统计上显著的偏差;○数据上早期故障信号。前瞻性的以风险为中心的维护文化。在最佳的经济时间解决问题。○操作信号开始报警。对警报作出反应。决定要做什么,并立即采取行动。○功能性失效。○设备离线)
(上端图:单个传感器设备保护:传统的阈值和规则。下图是二维的,横坐标绿色部分是正常操作,红色部分是早期损坏阶段。纵坐标四个是:轴向位置,气体压力,拉速,轴承温度。)
数字孪生实现步骤
在泰纳巴西钢厂TerniumBrasil的两流板坯连铸机上进行了实施数字孪生,涉及机器的四轴变量,总共约有4,000个变量值。使用的工具是GE Digital的APM Predix软件。图4显示了包括解决方案的实现、评估、解决方案设计、实现和监控在内的步骤,这些步骤在以下项目中进行了详细说明。
评价
在此阶段,从指导数字孪生开发的技术文档中收集信息;简而言之,收集和分析所有可以为解决方案生成输入的信息。以下是这一步的要点:
• 资产标签列表。
• 资产DCS截图。
• 管道和仪表图(P&ID)。
• 资产操作和维护手册。
• 停机报告。
• 警报范围。
• 历史数据。
在分析了故障历史和可用仪器之后,评估了所提出的解决方案可检测到的潜在故障,如图5所示。在两年的时间里,有107个小时的非运营停工;也就是那些由操作策略执行的任务。这些故障部分无法提前检测到,因为它们与在使用寿命结束时停止更换组件,人为故障以及驱动器和可编程逻辑控制器(PLCs)等电子组件的突然死机有关。这些事件加起来总共有49小时的非操作停止。然后,解决方案可以检测到发生的其他事件,但它们没有必要的传感器进行监视,还需要在仪器仪表上进行投资。这个总数相当于总共5小时的非操作停工。最后,解决方案的潜在影响,即如果解决方案在运行中,先前可以检测到的事件,对应于两年期间发生的107个小时中的53个小时;也就是说,通过部署解决方案可以避免大约50%的故障。
解决方案设计
在此步骤中,考虑到现有传感器的最小要求、根据历史记录已经发生的故障以及工具中已经可用的故障模式目录,定义了能够建模的系统和子系统。图6展示了解决方案所涵盖的系统和子系统。在此阶段,还设计了数据架构,以便从现场到云的数据传输具有100%的可用性。该体系结构考虑通过Iba服务器从PLC收集数据,Iba服务器负责临时存储数据,并使用OPC协议将数据提供给中央服务器。反过来,集中式服务器将数据存储更长时间,并使其可供云应用程序服务器使用,模型在云应用程序服务器上运行并生成异常警报。
(第一列:结晶器,冷却水供应,冷却结晶器铜板,结晶器液面控制;第二列:二冷,二冷室和压缩空气供应,二冷段冷却段回路;第三列:连铸设备冷却,冷却水供应,夹持辊冷却,轴承冷却;第四列,主液压站,WAM;第五列:智慧弧形扇形段夹持辊轴向控制,每个辊子位置控制,每个辊子压下和应力控制,每段电器控制,每个传动电机速度控制;第六列:多点矫直控制,位置控制,压下和应力控制,电器控制,每个传动电机速度控制;第七列:每个扇形段水平位置控制,位置控制,压下和应力控制,电器控制,每个传动电机速度控制)
实施
部署运用阶段包括以下列出的主题,所有这些主题对于解决方案的完整操作都是必不可少的:
• 数字孪生配置。
• 实时数据采集。
• 报警级别调整。
• 模型训练。
图7给出了适用于每个系统的诊断,换句话说,划分了解决方案可检测的故障。
图7 系统和诊断
(左边列:二冷区域,诊断规则样本:二冷水环路堵塞,压缩空气堵塞,调节阀PID控制问题。右上:结晶器,一冷水系统,对中尺寸控制,液面控制。诊断:结晶器冷却水冷却回路问题,结晶器定位问题,一冷水FCV PID环路调节问题,结晶器液面传感器冷却问题。右侧中间:扇形段夹持辊:扇形段电极传动,扇形段辊子和轴承冷却。诊断规则样本:扇形段机架辊1系统问题,扇形段机架辊1传动问题。右侧下:软压下:液压缸定位系统,定位压力。诊断规则样本:扇形段机架辊1液压缸位置问题,扇形段机架辊1系统问题,扇形段机架辊1传动问题。)
实施
监控阶段的工作流程如图8所示。第一步包括将来自控制系统(PLC)的数据与中央服务器连接;在这种情况下,设计的体系结构的目标是一个可扩展的解决方案,其中多个流程、区域和工厂可以包含在同一个数据历史记录中。接下来,由数字孪生(digital twin)表示的是云应用程序,分析模型在其中接收字段数据,将它们插入模型并在其输出中生成结果。重要的一点是,工业资产的行为会不断变化,这就需要定期更新模型。
同样,监视团队收到关于异常的警报,并且需要有技术知识来分析和推荐正确的操作,而执行团队需要执行建议。这是一个需要按计划工作的齿轮,因为一个步骤的失败会影响所有其他步骤的表现和结果。有必要维护所有的结构化工作;这意味着工艺过程必须正确运行。传感器的可用性非常重要,来自专家团队(监测中心)的正确建议也非常重要。分析模型维护也必须被视为这个过程中的一个关键点。
结果
图9显示了模型在运行的前四个月的演变过程,显著减少了产生的误报数量。在回报方面,该模型能够在此期间避免6个潜在故障事件,这相当于避免了17小时的非操作停机,对解决方案产生了积极影响。一般来说,最常见的异常集中在仪表故障,水和油泄漏问题,扇形段轴承和辊子冷却系统问题以及结晶器和二冷段二冷水喷嘴结垢堵塞。
图10和图11显示了该解决方案异常检测的两个真实示例。图10为结晶器液面传感器温度升高的检测结果。在图中,我们绘制了两条线:绿线代表模型的估计值,表示考虑到机器的整体运行状态,这是该时刻的最佳状态,而蓝线代表该变量的实际值。在某个时刻注意到异常曲线之间存在差异,在更换传感器电缆后进行了纠正。
图11显示了从结晶器传感器流出的冷却水流量急剧下降,在更换结晶器一冷水路膨胀节后,这一异常得到了纠正。
结论
在本工作中,基于可用变量和资产的故障历史,建立了连铸机的数字孪生或虚拟模型。所开发的模型生成的警报按照本文定义和介绍的流程集成到资产监控中心中。根据所提供的结果,可以声明所开发的分析模型能够提前检测到机器中出现的异常,允许维护团队提前采取行动,以减轻资产设备中的潜在故障,为被监控的设备和工艺流程提供更高的可用性和可靠性。
面临的主要挑战是期望的管理;也就是说,所涉及的所有级别都必须清楚地意识到解决方案的范围是什么,范围之外是什么,以避免解决方案中的挫折和可靠性损失。另一个基本因素与流程和团队集成有关,因为该解决方案涉及不同的团队和专业,例如I.T.、检查、维护、监控团队和外部服务。非常清楚地定义角色和职责以及操作需求是很重要的。还观察到团队对维护方式的认识,在已经有明显的设备退化证据的情况下采取行动的配置,以及在预期行动的情况下,它可能会产生对异常存在与否的不信任,而异常在活动执行后在逻辑上得到证明。