“电车省油不省钱,电池损耗太快!”
“电车对温度敏感,冬天续航打骨折!”
“电车适合市区通勤,堵车不费电!”
提到新能源汽车,争论不断。
如今电车几乎成了新车市场的“大多数”,有必要客观分析这些争议,用数据说话。
我们从公开渠道找到约2000条比亚迪元Plus车主的真实用车数据,包括汽车续航、电池能量、已行驶里程、所在地等。
为何选择元Plus?
因为打钱了(不是。因为:
1. 元Plus只有纯电版本,可排除混动、增程干扰。
2. 销量高,2024年纯电SUV市场排名第二。
3. 最宝贵的是车主分享欲爆棚,可分析的数据量大。
我们本想分析销量更高的特斯拉ModelY,但车主的高冷让人望而却步——没有足够数据。
基于找到的数据,用数据建模软件DTEmpower做分析。
为分析气温、拥堵情况和地形对电车续航的影响,根据用户所在地,补充平均气温、拥堵指数、地形起伏指数三个参数。
操作很简单,网上也有公开数据。
车主反馈的信息大部分详实客观,小部分欠缺信息,极个别逐渐暴躁敷衍了事。甚至不排除友商恶作剧,说满电只能跑20公里。
这也符合工业数据的特点:总有一些传感器随机输出离谱结果。
采用DTEmpower的空值和异常值处理工具,自动清除空值点和高风险点,保证数据干净可靠。
预处理和清理之后,数据共有6个变量。除了我们关心的续航,还有电池容量、已行驶里程、所在地平均气温、拥堵指数和地形起伏度这5个可能会影响续航的因素。
但实际有没有影响,如何影响?
利用DTEmpower的相关热力图输出6个变量之间的相关系数。
相关系数为正,表示变量之间呈正相关;相关系数为负,则为负相关。同时,相关系数越大,表示两变量间相关性越强。
可以看出,影响电车续航的因素中,除了众所周知的电池容量,最明显的就是平均气温了。
在统计的温度区间,可认为气温越高电车续航越长。因为低温会减缓电化学反应速度,增大电池内阻。
实际销售市场也符合此规律。
2024年,东北黑吉辽的电车销售占比只有38%,是东北老铁不喜欢电车吗?
非也。同为东北四省之一的海南,电车占比就达到了58%。
除此之外,相关性分析还能得到结论:
1. 汽车已行驶里程和续航之间的相关系数接近0,可认为在分析的里程内,未见明显的电池老化。
2. 拥堵指数和续航之间的相关系数接近0,可认为电车续航对拥堵不敏感,适合市区通勤。
以上内容已回答了开篇的疑问。
若更进一步分析,还可基于DTEmpower做回归建模。
通过电池容量、气温、拥堵指数等参数预测电动车续航,为个人购车以及车企研发提供依据。
以续航为输出值,其余变量为输入值,通过回归建模寻找输入输出之间的关系。
回归算法采用Ridge、Linear、GBDT和RandomForest四个算法,训练之后做精度对比。
经对比,认为GBDT模型在多个指标上表现最好,可实现较高的预测精度。
注:
MAPE为“平均绝对百分比误差”,越小表示精度越高;
NRMSE为“标准化均方根误差”,越小表示精度越高;
R2取值范围为[0,1],越接近1表示精度越高。
精度指标显示,基于车主公开数据的回归建模切实可行,但精度尚有提升空间。
分析认为主要原因是数据量不足,虽然总量为2000条,但平均到每个城市,数据量还是偏少,影响建模精度,甚至出现异常结果。
例如相关热力图显示汽车续航和地形起伏度相关性约等于0,这就略显异常。
虽然电车有能量回收机制,但地形起伏度与续航之间还是应呈负相关关系。即道路起伏应会增加电车能耗,尽管增加比例低于油车。
1. 本文分析仅基于元Plus这一款电车,欠缺普适性。同时,若能和某一款油车对比,分析结果将更具价值。我们正尝试寻觅一款油车,若寻觅失败,您就当我没说。
2. 本案例为抛砖引玉。汽车研发企业往往有足够多的数据,无论是统计数据还是试验数据,都可大幅提高建模精度,让数据服务于研发。
例如:通过收集电动车电池电压、行驶速度、行驶坡度、加速踏板幅度、所在地天气等信息,实时分析,找到影响电耗的主要因素。为车辆优化及司机改进驾驶习惯提供依据,做到车企、司机和汽车三者间的良性互动。