航运作为一种运量大、成本低的运输方式,在全球贸易货物运输中发挥着十分重要的作用。随着船舶数量的增加和船舶大型化发展,航运业面临着温室气体排放、人力成本增加、航行安全不足等诸多挑战。近年来,为应对上述挑战,目前航运业正逐步向低碳化、智能化方向发展。
自主航行是船舶按照预定目标,自主规划航速航线,自动航行至终点并完成作业的过程。目前,船舶自动化可分为四个等级,分别是有自动化过程和决策支持的船舶、有人远程遥控船舶、无人遥控船以及自主航行船舶。此外针对智能船舶的指导性法规预计将于今年年底发表,并预计将于2026年1月发布强制法规,2028年1月正式生效。
低碳航行是当下研究的一大热点,船舶自主航行是其中的关键技术,包括态势感知技术、认知计算技术、碰撞决策技术以及航行控制技术,航行控制技术主要是对船舶航迹进行控制,实现开阔水道自动导航、拥挤水道自主避碰以及进出港自动靠泊,而对船舶的航迹预测是实现这些功能的基础,因此南通中远海运川崎拟针对船舶运动轨迹进行智能分析及预测。
船舶的运动轨迹预测是一个十分综合的问题,主机负荷影响船舶的航速,风浪等外界环境影响船舶的航向,水流影响舵角以及船艏向,船舶姿态影响主机负荷。传统方案是通过理论方法简历船舶的运动方程从而对船舶的运动轨迹进行计算,该方案具有良好的稳定性,但难以表征模型与环境之间的耦合作用,在实海域场景下计算复杂。因此本项目拟用机器学习方法进行数据建模,从而更好地处理船舶运动的非线性和不确定性带来的影响。
本项目项目进度如下图表所示。
本研究选择某船2023年度实际的一段运营数据进行分析,船舶航行包含直行段和曲线段,共24500条。
数据包含三部分,共14维,包括风速、风向的外界环境信息,包括航行日期、经度、纬度的船舶位置信息,包括航速、航向、艏向角、舵角载况、主机信息等的船舶航行信息。
首先对样本进行数据预处理,对于载况,船舶装载时会将吃水计打开,而船舶航行时,船舶的载况基本维持不变,此时吃水计会被关掉,因此会产生大量的空值,因此采用插值的方法进行填补,对于其他个别未采集到的数据则选择删除样本。因为本项目研究的是船舶的运动轨迹,因此对船舶停止时的数据也进行删除处理。
之后,对数据集进行分析。对于环境信息,风速风向无明显异常值,对于风速,存在较小部分风速很大的情况,占比约0.5%,此时航速会偏小。对于位置信息,船舶经纬度无明显异常值,数据分布均匀。对于航行信息,数据无明显异常值,分布比较均匀,由于船舶静止数据的存在,航速,主机功率和主机转速存在两级分化的值,航向和船艏向角同样也存在极值分化的情况,这是因为角度范围为0~360°,较小的角度和较大的角度均位于船艏,只是分布在船艏两舷,属于合理情况。
之后对数据集进行相关性分析,根据相关性分析,输出变量和输入变量之间的线性相关性较弱,表明输入输出变量之间的关系较为复杂;输入变量内部相关性相对较弱,可以反映出输入变量内部不存在冗余变量。
项目建模流程如图所示。
本项目共采用了4种方法对船舶运动轨迹进行预测。
方法1:
将数据集分为训练集预测试集,对训练值进行建模,训练集用于基于回归模型的精度对比,测试集用于船舶运动轨迹预测。训练集的流程及模型对比结果如下图所示。
利用测试集预测的船舶运动轨迹,结果如下图所示,可以看出虽然不同模型的精度很高,但是预测的轨迹精度很低,存在过拟合现象,且轨迹预测与时间有关,回归类模型训练不适合。因此,后续将尝试利用时序模型进行建模训练。
方法2:
采用线型时序模型训练。变量仅时间和船舶经纬度,训练集的时序进行重采样,确保时间间隔相等,模型预测未来100个周期的数据。模型流程及预测结果如下图所示。
从预测结果可以看出,在预测的100个时间周期内,开始的预测结果较好,随着时间的推移,精度开始变差;预测结果仅与时间有关,未考虑外力的影响,很难模拟船舶的回转轨迹;仅能预测100个时间周期,不具备长期预预测能力。因此,该模型不适合长期预测船舶运动轨迹。
方法3:
采用滑动窗口+回归模型对船舶运动轨迹进行预测。考虑外界因素对预测结果的影响,采用滑动窗口的方式考虑变量的历史值。滑动窗口设置三个位移,包括风速、风向、航向、艏向、舵角、主机转速和主机功率。并引入MDI重要性分析,重要性阈值设为0.02。模型流程及预测结果如下图所示。
从预测结果可以看出,预测结果误差仍然较大,通过敏感性分析后,仍存在过拟合的情况。通过分析,输出变量的历史值影响下一时刻的位置,即外力条件一样,不同时刻输出的位置也是不一样的。因此,需要生成与时间和位置相关联的特征变量。
方法4:
采用滑动窗口+表达式生成新特征变量+回归模型的方法。输入变量为航行日期及经度纬度,通过表达式将其转化为时间间隔与航行距离。输出变量为航行距离与船舶航向,通过表达式将其转化为经度和纬度的位置信息。经纬度滑动窗口设置一个偏移量,以计算相邻时间点内的航行距离。模型流程与训练结果如下图所示。
将生成的距离转化为经纬度,与实际值进行对比训练得到的轨迹与实际轨迹高度重合,满足建模的要求,该模型适合本项目。
4. 模型应用
高精度的船舶轨迹预测模型可应用于航线优化,以促进船舶的节能减排。也可利用该模型实现船舶航行中的自主避碰,从而提升船舶运行的安全性。也有望应用于船舶的自主航行,实现船舶航行的智能化。
1. 项目总结
本项目借助于南京天洑软件有限公司DTEmpower工具,选择了较为平顺的一段营运航线,建立了船舶运动轨迹预测模型,通过不断地调整模型以及精度,最终构建的模型能够较为精确地预测船舶未来的运动轨迹;进一步地运用该方法,提出了今后与航线优化和智能控制结合起来的研究方向。
下一步可考虑其他的外界因素:比如波浪、潮流等气象条件,港口限制、多载况的影响等,因此,后期可以基于本项目的框架,建立更为复杂的数学模型,以增强其工程实用性。
2. DTEmpower软件特点
使用操作便捷:不需要掌握专业的数据建模知识,入门门槛低;
数据处理智能:避免了大量的数据处理工作;
算法工具丰富:提供了丰富的算法工具箱,训练精度和稳定性好;
应用场景广泛:能够解决工程中各种数据挖掘及建模问题。
软件内置30天免费试用,即下即用。您可登录天洑官网前往试用。
注:本项目参与人员南通中远海运川崎船舶工程有限公司周旭、王楠、宋洋涛;南京天洑软件有限公司金云峰。