中国储能网讯:大数据是应对汽车产业新四化挑战的重要抓手,其作为一种基础性与战略性资源得到了广泛重视。如今,汽车行业对大数据的挖掘和应用在各个层面展开,尤其是在新能源汽车领域。
8月21日,新能源汽车国家大数据联盟在2018年中会议暨新能源汽车评价指数研讨会上发布了《新能源汽车国家监管平台车辆数据质量分析报告》。报告显示,1~6月,平台全国接入车辆969107辆,其中627461辆车出现过错误,占比64.75%,共出现72类的错误数据,集中出现在车辆状态和单体电压/温度值等方面。总体来看,接入平台的车辆出现错误概率较大。
北京理工大学副教授、新能源汽车国家大数据联盟副秘书长刘鹏表示,错误的数据将影响数据分析结果,也会影响到新能源汽车的里程核算。
■成功接入平台的车辆运行数据质量堪忧
新能源汽车国家监管平台今年2月初正式投入使用,接入车辆已突破百万辆,用于新能源汽车安全监管、数据分析、车辆管理和补贴核算等工作。截至2018年8月13日,接入整车服务平台的车辆有104.76万辆,注册整车企业429家,通过“平台符合性检测”的整车企业384家,通过“车辆符合性检测”的车型5388个。
企业平台要对接国家平台,需完成车辆静态数据接入和车辆运行数据接入审核。目前此平台共存储有效数据231TB,每天新增约1TB数据。其中实时数据人工审核通过车辆为76.6万辆,占比73.18%;实时数据未审核与未通过的车辆数为28.1万辆,占比26.82%。审核未通过车辆多因为不符合GB/T 32960要求。
按照国标GB/T 32960-2016的要求,新能源汽车国家监管平台实时信息采集项为61项,包括驱动电机、车辆位置、整车、极值数据、报警数据、故障下的单体数据等。
尽管车辆通过了相关审核成功接入国家平台,但在实际运行中出错率仍较高。报告显示,有83.5%的企业数据出错率超过一半。具体来看,排在前8位的错误类型中,出错率最高的项目是“车辆状态为空或错误”,占16.76%;排在第四位的错误类别是“充电状态为空或者无效”,占4.82%。造成这种现象的原因可能是某些型号车辆的充电状态检测装置损坏。
除了以上两类错误,其他排名在前的6类错误均为电池单体问题,包括单体温度和电压数据的错误,初步判断为车载信息采集模块精度较低,传输数据质量较差。丢包率大于1、在30秒内里程跳变大于2公里等数据错误类别占比较高,这表明车载数据采集装置的精度和传输速率有待改进。
■车企数据质量参差不齐可能影响补贴核算
在报告中,不同企业的数据质量相差较大。有的企业接入平台车辆的出错率达到100%。出错率在50%以上的企业总数超过80%,仅有小部分车企的数据质量较好。新能源汽车国家大数据联盟同期发布了“新能源汽车大数据指数TOP-n车型”信息,这些车型的数据良好。
以某新能源车企为例,其接入平台车辆总数为29631辆,车辆数据出错率为94.4%,单车错误数量均值为2883条。具体出错数据项有电池单体电压最高值与实际包内单体电压值不相符、混动模式发动机无数据、车速大于0而车辆状态为熄火、里程为空或无效等。
刘鹏分析称:“这家企业出现的动力电池相关数据项错误比重已超过71.7%。动力电池作为新能源汽车的关键部件,它的优劣直接影响着整车性能,电池数据质量过差会直接影响新能源汽车的安全。”
刘鹏表示,这家企业“里程为空或无效”错误项占比接近5%,出现此项表明该企业车辆实际运行里程与上报里程存在一定偏差,会直接影响该车企的里程核查。
近几年,长安汽车、上汽乘用车等车企在多方位挖掘大数据的价值,用于产品改进、研发、销售和服务等领域。宁德时代等电池企业认为,大数据的价值在于通过故障监控、预警体系确保车辆安全可控、降低维修成本、提高运营效率。
大数据价值挖掘的基础在于数据,数据质量优劣直接影响大数据分析结果的可信度。如何保证数据符合标准,并保证完整、准确、稳定和一致,将成为车辆大数据分析的重要课题。