车联网数据分析与应用车联网概念引申自物联网,传统的车联网定义是指装载在车辆上的电子标签通过无线射频等识别技术,实现在信息网络平台上对所有车辆的属性信息和静、动态信息进行提取和有效利用,并根据不同的功能需求对所有车辆的运行状态进行有效的监管和提供综合服务的系统。附件中提供了一个新能源汽车厂商通过汽车传感器得到的车辆状态数据,数据中包括 260 个变量数据(参见数据文件) ,现在需要基于该数据完成以下任务:1.车联网数据预处理:包括对车联网数据中异常数据识别与清洗,缺失值识别与处理;选择合适指标,描述车辆基本行驶状态,如快速行驶、夜间行驶、长时间驾驶;:使用恰当的数据可视化技术,对预处理后的车辆数据绘制直观、有效的图形;2.车辆行驶状态分类和预警:利用汇总数据,使用统计聚类方法对车辆行驶状态进行分类;构建车辆行驶信息的分布函数,探寻不同变量间的关联信息,对有关联的数据进行建模;基于建模成果甄别传感器中的异常数据,在对异常数据进行必要交互识别后,对车辆异常状态进行预警;3.车联网数据价值发现:深入探讨相关数据在相关车险定价中的应用(寻找影响车辆行驶风险的因素,探讨这些因素间的相关性,定量评价这些因素对车险定价的影响) ;基于数据驱动的思想,对于数据中的更多价值进行挖掘。