基于OBD数据挖掘的不良驾驶行为关联分析

来源:优秀文章 发布时间:2022-11-18 点击:

梁陈磊,储江伟,李 红

(东北林业大学 交通学院,黑龙江 哈尔滨 150040)

随着汽车的普及,因其引发的交通问题也逐年增多,对交通事故的预防引起了各国的重视。当今,在车辆构造、道路设计等方面未取得突破性进展的背景下,各国学者开展了对驾驶行为的研究,并已成为各国在道路交通安全研究方面的核心内容之一。

大数据技术自发展应用以来,在驾驶行为研究领域有着突出的贡献。其不仅可以将采集到的车辆运行状态数据进行整合,探索数据之间的联系和规律,而且通过运用各种分析和方法,对大批量数据进行筛选,从中提取有用信息。文献[1]利用OBD(On-board Diagnostics)采集实际行车数据,运用聚类分析等算法对驾驶人的操作类型、行驶速度等驾驶行为习惯进行相关研究,探究与验证了OBD作为驾驶行为数据来源的稳定性,为驾驶行为习惯提出了量化指标。文献[2]基于急加速、急减速等异常驾驶行为数据与信息熵理论,建立城市道路交通安全风险评价指标体系及计算方法,提出交通安全风险预估及风险等级划分方法。文献[3]采集了两个交叉路口的车辆轨迹数据,提取其中跟驰与换道行为,利用轻量梯度提升机(LGMB)算法对危险驾驶行为进行识别。文献[4]通过探究公交驾驶人心理因素和组织环境因素对不良驾驶行为内在机制的影响,为心理干预方法提供思路。

文献[5]通过使用手机采集车辆的加速度和相关定位的数据,与基于规则的算法进行了对比,同时与基于动态事件规整的模式进行了算法的匹配,对驾驶事件的检查算法提出了改进。文献[6]对基于智能手机传感器数据流的驾驶行为分析研究进行了相关综述,提出了一些可行的方案和建议。文献[7]首先对自然驾驶数据进行提取,利用神经网络对驾驶事件进行分类,最后对分类后驾驶事件以及驾驶风格进行总体评分。文献[8]通过对不同个体驾驶行为进行建模,用图形的方法描述个体特征并区分驾驶员之间的差异。

以上研究多是对驾驶行为的共性分析、数据采集设备的创新和算法准确性验证。目前国内外研究重点主要针对驾驶行为安全问题,并不直接关注日常行驶轨迹中不良驾驶行为。本文结合大数据优势,从个体特征出发研究其在早、晚高峰期间不良驾驶行为的内在关联性,为个性化驾驶及驾驶风格研究提供理论拓展,达到帮助改善驾驶行为并降低事故风险的目的。

2020年,哈尔滨市私人汽车保有量为193.5万辆,占民用汽车总保有量的90.97%。因此本文选用家用轿车作为研究对象,选取经验丰富的驾驶员以哈尔滨主干路和支路为行驶范围,通过车载OBD接口对车辆的CAN总线数据进行读取;
将读取的日常行车数据导入表格中,供后期研究进行数据挖掘分析,以探究得到驾驶人的不良驾驶行为特征。

将采集到的数据以单个行车过程进行数据分类,共获得约5个月采样时常的30多万条行车数据;
选择其中的早、晚高峰10余万条数据作为研究的原始数据样本。部分样本数据片段如表1所示。

表1 OBD采集的原始数据

2.1 评价指标选择

不良驾驶行为包括错误驾驶行为及违法驾驶行为,主要表现为不安全、不节能。对驾驶人行为的分析已经被确立为预防道路交通事故和提高道路安全的关键部分。汽车驾驶行为包括驾驶人对汽车加速、减速、制动、转向等运动状态的控制,驾驶行为决定汽车运动状态,而汽车运动状态又是驾驶行为的反映。由多年研究可知,速度和加速度是研究驾驶行为的两个核心指标且对交通事故的影响较大。因此,本文通过CAN总线获取有关汽车运动状态的数据,特别是通过分析与车速相关变量的数据,来研究与车速相关的不良驾驶行为的关联特征。

结合前人研究内容及实验所采集数据特点,针对不良驾驶中超速、车速过高、急加速、急减速及频繁变速等行为,提出将行车过程中的超速、平均车速超速、车速波动差、加减速度变化值、变速频次(超加速或制动阈值次数)等五项参数作为探究不良驾驶行为的评价指标。

2.2 评价指标阈值确定

不良驾驶行为的判定阈值是一个难点,绝大部分特征参数值应集中于合理区间内。结合研究路段实际路况及数据特点确定日常场景下特征参数阈值,通过阈值确定每段行程是否存在某些不良驾驶行为。

超速是指驾驶员在驾车行驶中,汽车的行驶速度超过法律、法规规定的速度。根据《中华人民共和国道路交通安全法实施条例》第四十五条规定:同方向只有1条机动车道的道路,城市道路限定车速为50 km/h,公路限定车速为70 km/h。由于事故倾向和超速之间的关联性较强,结合研究对象实际行驶的城市道路情况,本文将汽车超速行驶阈值定为=50 km/h,为确保数据真实,将超速时间窗口设定为4 s。

对采集的平均车速数据进行分析如图1所示,车辆的平均速度主要集中于15~25 km/h之间,基本符合CATC标准中的城市道路工况的平均车速29 km/h。

图1 行程平均车速

根据文献[15]引入四分位差法作为平均车速阈值确定方法,则平均车速阈值为:

式中:为平均车速全部样本总分布的75%分位数;
为四分位差,即平均车速全部样本总分布的75%分位数和25%分位数差值。

通过计算=34 km/h,将其定义为平均车速超速阈值。

由早期Solomon的研究可知,发生交通事故的概率将会随着车速与平均车速差值的增加而提高。车辆在行驶过程中最高车速与平均车速的差值大小通常能够反映出驾驶人的驾驶行为趋向,尤其在道路情况较为复杂的情况下能表征出驾驶员的冒险性驾驶行为,差值越大,危险性越高。

式中:为车速波动值(单位:km/h);
为行程最高车速(单位:km/h);
ˉ为行程平均速度(单位:km/h)。

结合文献[16]及市区道路最高限速标准,将车速波动差阈值设定为35 km/h,超过此阈值认为驾驶人车速波动范围较大,存在冒险驾驶行为。

车辆在城市道路行驶时,驾驶人习惯于通过制动力对车速进行控制,多数情况下车速较低,其加速度及制动时减速度的变化值较小。加速度的波动值能很好地反映驾驶员在实际行车中的性格特点。由图2可以观察到驾驶员在若干次行车过程中的行为趋势,加速度变化值主要集中于2~5 m/s之间。

图2 加速度变化值

式中:为加速度变化值;
a为行程加速度最大值;
||a为行程减速度最大值。结合文献[18]及中国乘用车行驶工况(CLTC-P),将加速度阈值设置为2.91 m/s。

与应对突发状况或新手控制不稳定引起的车辆急变速行为不同,车辆行驶速度频繁变化是指驾驶员频繁变速的操作,其中包括驾驶员的连续加速以及连续制动等驾驶行为。结合文献[20-21]及数据整理可知,在正常跟车过程中变速导致的加速度变化绝对值在1 m/s内。

式中:为变速频次;
为变速次数;
为单位时间(单位:min)。

本文将1次/min设为变速频次阈值,将大于变频阈值的驾驶行为称为频繁变速行为。

3.1 评价指标占比

将哈尔滨早、晚高峰时间段作为数据提取依据,其他时间段内数据去除。保留提取段数据内主干道和辅路行程,删除支路及校园路段。其中与五项参数相关的数据,例如:驾驶时间、加速度、车速等数据保留,其他无关数据剔除。

结合评价指标所定阈值对数据进行二次处理,得到总行程次数中五项评价指标所占概率如图3所示,依次为:0.43,0.05,0.33,0.57,0.37。

图3 各评价指标所占概率

在评价指标中,平均速度超速占比较低,表明在城市道路环境中,由于车流量的限制,导致整个行程中平均车速较低。在早晚高峰期,驾驶人易通过急加速与急制动控制车辆的速度,导致加速度变化超阈值的概率较高,频繁变速也是高峰期行车状态的主要驾驶行为之一。

3.2 超速分析

超速是不良驾驶行为之一,根据《道路交通安全法》,车速超过限速值20%,将会面临扣分与行政处罚,将超速部分进行提取,如图4所示。

图4 超速次数百分比

市区超速绝大部分发生在50%以内,主要集中在20%~30%区间内,由于道路条件的限制,超速的强度与时间都较短,更多的发生在上下班高峰期以外的时间段。

4.1 关联分析

关联分析是无监督的机器学习方法之一,用于发现隐藏在大型数据集中各数据间有意义的联系,即探索事务同时发生的规律性。关联规则表示事件间的关联程度和影响,能准确地发现数据间的属性关系。使用关联规则,首先需要设置支持度阈值和置信度阈值。支持度可以用于在给定的项集中筛选出频繁项集,确定事务,在事务集合中同时出现的概率,置信度则确定在事务出现的情况下,事务出现的可能性。

关联规则的强度用支持度和置信度进行度量。支持度(Support)和置信度(Confidence)两种度量的形式定义为:

式中:number()表示同时包含事务和事务的事务数;
num(AllSamples)表示总事务数。

式中:()表示包含事务的事务数。

关联分析算法较多,Apriori算法是关联分析常用经典算法之一。Apriori包括两部分:产生频繁项集和依据频繁项集产生关联规则。频繁项集的寻找策略为自底向上,即从包含少量项目的项集开始依次向包含多个项目的项集搜索,控制候选项集呈指数增长,如图5所示。

图5 寻找频繁项集流程

4.2 建模与数据分析

为便于数据的建模和分析,设置最低条件支持度10%和最小规则置信度50%;
结合Apriori算法进行数据建模,运行模型并将结果输出。选择结果中实用性较高的两项与三项评价指标间的关联规则,按置信度百分比由高到低依次排列,结果如表2、表3所示。

表3 三项评价指标间的关联规则

由表2支持度可知,加速度变化值与变速频次和超速的支持度均为57.29%,表明急加速、急减速与频繁变速行为及超速行为间关联性最强。

表2 两项评价指标间的关联规则

由置信度可知,车速波动差引起超速的概率为89.55%,其次是变速频次与加速度变化值,表明驾驶人在高峰期行车时存在冒险驾驶的行为,此行为易引发超速行为,导致扣分罚款且增大事故风险率。

由表3支持度可知,超速、加速度变化值与变速频次及车速波动差支持度均在30%以上,表明超速行为、急加速、急减速与频繁变速及冒险驾驶行为之间均关联性较强。

由置信度可知,变速频次与车速波动差发生时,引起超速的概率为96.77%,其次,车速波动差与加速度变化值发生时,引起超速的概率为92.73%。

综合表2与表3可知,在不良驾驶行为中急加速、急减速与频繁变速及超速行为联系紧密。急加速、急减速与频繁变速易导致发动机工作条件变差、燃油消耗增加,引起驾驶人情绪烦躁及驾驶疲劳等;
急加速、急减速与超速行为会导致车辆制动系统磨损严重,发动机工作区间不稳定,尾气排放及零部件磨损加剧。

不良驾驶行为中,冒险性驾驶行为与超速行为时间关联性较强,其与急加速、急减速行为出现后引起超速行为的概率增大;
频繁变速行为出现后也容易引发超速行为,这与城市道路发生超速交通事故诱因基本吻合。

本文通过对实际道路环境中的行车数据的采集和处理,运用关联分析探究不良驾驶行为内在关联性:不良驾驶行为并非单独存在,同一路段行程中超速、急加速和频繁变速等行为常同时存在,共同影响驾驶人行车安全;
提取数据段为高峰期行车数据,导致驾驶风格偏向于激进型驾驶。由此可见,对驾驶人进行驾驶风格划分时,不仅依据数据和心理因素等人为主观判断,也应考虑外界行驶条件及数据选择等因素的影响。

该研究也存在着一些不足,未能进行不同驾驶人的对比分析,因实验条件的限制,数据采集中未涉及到换道和转弯等驾驶行为,这也是未来研究的方向。

猜你喜欢 车速阈值行车 高速公路反向曲线驾驶员车速感知规律时代汽车(2022年17期)2022-09-06非平稳声信号下的小波变换去噪方法研究现代电子技术(2022年11期)2022-06-14非均匀光照下文本图像分割算法研究科技研究(2021年15期)2021-09-10地铁折返站微机联锁故障时的行车组织路径思考科学家(2021年24期)2021-04-25城市轨道交通节假日期间大客流行车组织思考与实践科学家(2021年24期)2021-04-25地铁运营非正常行车组织及要点相关阐述科学家(2021年24期)2021-04-25一件难忘的事江苏广播电视报·少儿文学(2019年10期)2019-09-10轻度火力汽车杂志(2018年6期)2018-06-25利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰分析化学(2017年12期)2017-12-25跑跑卡丁车作文周刊·小学一年级版(2017年27期)2017-08-10推荐访问:关联 驾驶 数据挖掘
上一篇:基于红外图像识别技术的道路与桥梁故障诊断
下一篇:WHT联合次优分层迭代PTS算法抑制OFDM信号峰均比

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有