基于改进SSA-LSSVM模型的大学生体育成绩预测

来源:优秀文章 发布时间:2023-04-17 点击:

范英丽,郑志强,郑 巍

(1. 南昌航空大学体育学院,江西 南昌 3300636;
2. 集美大学体育学院,福建 厦门 361023;
3. 南昌航空大学软件学院,江西 南昌 330063)

随着当代大学生生活水平不断改善,大学生越来越享受物质生活,反而忽略了自己的身体锻炼,导致自身的身体素质越来越差[1,2]。因此大学生体育成绩预测在提高身体素质、指导老师课程设计、改善教学方式等方面均发挥着重要的作用。高效准确的大学生体育成绩预测不仅可以有效地改善大学生的身体素质,还可以为教育部门开设合理的体育课程提供辅助,也可以帮助老师设计大学生身体素质的课程提供依据。随着我国对大学生的教育越来越重视以及人工智能在教育中的应用,大学生体育成绩预测技术的研究变得越来越重要。因此如何找到一种有效精准的大学生体育成绩预测方法是各个专家一直不断研究的重要问题。

研究表明,通常将将预测问题分为两类:时间序列方法[3]和回归模型[4]方法。针对大学生体育成绩的预测,专家提出多种预测模型。刘雨琛[5]等人通过梯度下降法来进行体育成绩预测,来指导大学生有效地提高体能素养。张彦荣[6]提出了将灰色理论运用到BP神经网络上,从而构建预测模型。张文[7]等人提出使用智能优化算法来优化极限学习机,得到了理想的预测效果而且可以很好地用于大学生实际体育成绩预测中去。谢晖[8]通过构建GM(1,N)模型来预测运动成绩,预测效果显著,更接近真实值。高素霞[9]等人融合了机器学习的和混沌理论的精髓,来预测运动员的体育成绩,该模型可以实现很高的预测精度。

特别是在群体优化算法的提出后,便应用到模型参数寻优中去,极大地提高了预测模型的精准度。于是,王海林[10]等人利用布谷鸟搜索算法的寻优能力和人工神经网络算法来预测软件缺陷,该模型很好地降低了软件的误报率,并且提高了预测的精确度。因此,可以明确的提出的是:基于群体优化的算法可以很好地应用于大学生体育成绩预测中,以此来寻找模型的最优参数,可以很好地提高模型的预测精度、模型的通用性以及泛化能力。

虽然神经网络在解决大学生体育成绩预测方面也有不错的发挥,但是它需要大量的样本,样本过少会导致它训练不足,反而使预测精度变差。因此,在针对大学生体育成绩样本数量较少时,采用具有诸多优势的SVM模型。为了解决SVM模型训练时间过长等问题,提出了用求解线性方程组的最小二乘支持向量机(LeastSquare SVM,LSSVM)来替代求解二次规划问题。因此,LSSVM模型[11]可以很好地被应用于预测方向。LSSVM模型的预测效果在很大程度上依赖于它的两个核心参数(惩罚因子γ和核函数参数σ)。如果手动设置上述两个参数会使模型的预测能力受到限制,为了剔除这种不利的影响。专家们通过采用粒子群优化算法PSO[12]、遗传算法GA[13]和模拟退火算法SA[14]等多种启发式算法来确定这两个关键参数。但上述参数搜索算法容易陷入参数局部最优的问题,使预测准确率反而下降。因此,为了解决其它算法容易陷入局部最优的问题,实现大学生体育成绩的精确预测,本文拟研究在麻雀搜索算法的基础上引进萤火虫扰动,可以有效地解决模型的参数搜索时,容易陷入局部最优的问题,通过实验发现,该算法与其它优化算法对比,其参数全局搜索能力更强,搜索范围更广,模型的预测精度更高,其预测的各项指标均优于其它方法。

支持向量机(Supportvectormachine,SVM)[16]是Vapnik等人基于统计学习理论提出的一种新的机器学习方法。在解决分类问题时,SVM模型的任务是找到一个超平面,使所有样本与平面之间的间隔最大化。最小二乘支持向量机(LeastSquareSupportvectormachine,LSSVM)[17]在支持向量机的基础上提出来改进得到的,它的思想就是将不等式约束问题简化为等式约束问题。LSSVM任务是模型是将最远样点与超平面之间的间隔最小化,如图1所示。

通过非线性变换,可将样本x输入映射到高维空间,可以表示为

图1 LSSVM回归过程示意图

(1)

其中:w为超平面的权值,b为常数,φ(x)为空间转换函数。

最小二乘支持向量机的目标函数定义如下

(2)

其中:ei为误差,γ为惩罚因子。

通过引入拉格朗日乘数ai,将优化问题转化为二元问题,构造拉格朗日函数如下所示

(3)

式(3)中的表达式的导数如下

(4)

通过引入拉格朗日乘数和Karush-Kuhn-Tucker(KKT)条件,求解式(4),可得 LSSVM 数学模型如下

(5)

其中:K(·)为该模型的核函数,本研究选用径向基函数(RBF)核,利用LSSVM模型预测学生体育成绩

(6)

其中:σ表示核函数参数。

LSSVM模型可以转化为凸优化问题,如式(1)-(6)所示。对于凸优化问题,局部最小值就是全局最小值。因此 LSSVM 模型的性能主要取决于γ和σ。

智能优化算法是专家通过观察生物生活习惯以及生物的物理现象的一种随机搜索算法。SSA算法模拟了麻雀的觅食行为和反捕食行为。该算法比较新颖,具有显著的全局寻找能力,并且收敛速度较快。

在麻雀觅食的过程中,分为发现者、追随者和警戒者,作为发现者的麻雀主动寻找食物并且提供觅食的路径和方向,作为追随者的麻雀则会通过加入者提供的方向来获取食物,二者是可以相互转换的。对于追随者,在觅食过程中,一些追随者会时刻追随着发现者,而且会同发现者进行食物的争夺或者围绕在发现者周围进行觅食。当整个麻雀种群受到捕食者威胁时或者意识到危险时,警戒者的麻雀会进行反捕食行为:处在种群外围的麻雀极其容易受到捕食者的攻击,需要不断地调整位置以此来获得更好的位置。与此同时,处在麻雀种群中心的个体也会去接近它们相邻的同伴,这样就可以尽量减少它们的危险区域,降低捕食者对它们的危险。

文献[15]中提出了5条规则,通过规则,得出了如下麻雀搜索算法的数学表达式。

假设由n只麻雀组成的种群可表示为如下形式

(7)

其中n表示待优化LSSVM的超参数γ和σ,m为麻雀的数量。因此适应度函数可以表示如下

(8)

式中,f(·)表示适应度函数值。

根据规则1和规则2,发现者的位置更新用下式表示

(9)

式中t表示当前的迭代次数;
itermax表示最大的迭代次数;
α为 [0,1]上服从均匀分布的随机数;
R2表示预警值,其取值范围为[0,1];
S表示安全值,其取值范围为[0.5,1]。Q是服从正态分布的随机数。L是维数为1*d的全1矩阵。

其中追随者的位置更新描述如下

(10)

当麻雀受到捕食者威胁时,警戒者麻雀位置更新的公式如下表示为

(11)

综上,麻雀算法的主要步骤如下:

Step1:设置麻雀种群数目和迭代次数,提前设置麻雀的发现者、追随者和警戒者的比率,设置预警值;

Step2:计算麻雀的适应度值,并进行排序;

Step3:利用式(9)更新麻雀发现者的位置;

Step4:利用式(10)更新麻雀追随者的位置;

Step5:利用式(11)更新麻雀警戒者的位置;

Step6:计算式(8)的适应度值并不断更新麻雀的位置;

Step7:是否满足停止条件,满足则退出,输出结果,否则,重复执行Step2-6。

麻雀搜索算法的流程图如图2所示。

SSA 算法在寻优过程中具有良好的鲁棒性能,而且由文献[19]在搜索精度、收敛速度和稳定性方面都优于其它优化算法相比。

图2 麻雀搜索算法流程图

为了解决最小二乘法支持向量机参数的确定问题,采用了SSA优化算法对最小二乘法支持向量机进行优化,确定了最优参数γ和σ,根据最优参数γ和σ提高大学生体育成绩的预测精度。

该算法的改进主要是在麻雀搜索算法基础上,通过利用萤火虫算法对麻雀搜索算法进行添加萤火虫扰动[18],通过将发现者、追随者和警戒者麻雀的位置更新与萤火虫扰动更新方式相结合,不断进行位置更新,提高其算法的搜索性和鲁棒性,通过添加扰动后的麻雀与扰动前的麻雀搜索算法进行对比,可以发现其参数搜寻结果更优,更新麻雀位置更及时。

在萤火虫算法(Fireflyalgorithm)中,某一个萤火虫发出光亮,可以作为信号灯光源头,从而吸引其它的萤火虫靠近。

下面是对萤火虫的假设:

1)萤火虫会被其它发出更亮的萤火虫所吸引。

2)萤火虫的亮度越大,对其它的萤火虫吸引力越大。所以对于任意一组萤火虫,其中的一只萤火虫会朝着亮度大的萤火虫移动。

3)萤火虫的亮度会随着距离的增加而减少。

4)萤火虫个体如果没有更亮的目标源,它会自己随机移动进行寻找目标。

因此,假设萤火虫个体的相对荧光亮度为

I=I0*e-γri,j

(12)

其中I0为萤火虫个体的最亮萤光亮度,它与LSSVM目标函数的函数值相关,LSSVM函数的γ和σ越优其自身的亮度越亮;
γ为光强度的吸收系数,由荧光算法假设得知荧光会随着距离的增加和传播媒介的吸收而逐渐减弱;
ri,j为萤火虫i与萤火虫j之间的欧式距离。

萤火虫的吸引力如下所示

(13)

式中β0为萤火虫个体的最大吸引度;
γ为光强度的吸收系数;
ri,j为萤火虫i与萤火虫j之间的空间距离。

假设萤火虫i的亮度小于萤火虫j的亮度,因此萤火虫i被吸引向萤火虫j移动的位置更新公式如式(14)所示

(14)

式中,xi和xj分别为萤火虫i和j的所位于的空间位置;
α为步长因子,其取值范围为[0,1];
rand为 [0,1] 上服从均匀分布的随机数。

为比较麻雀算法和萤火虫改进的麻雀算法迭代性能的不同,参照文献[19]中的测试方法,分别选取两个函数进行测试。为了保证两种算法比较的合理性,两种算法均采用相同的参数设置,如表1所示。另外,在麻雀搜索算法中,麻雀发现者的比例为0.7,追随者的比例为0.3,预警者的麻雀占比为0.2,预警值为0.6。在基于萤火虫扰动的麻雀搜索算法中,麻雀发现者的比例为0.7,追随者的比例为0.3,预警者的麻雀占比为0.2,预警值为0.6。添加萤火虫扰动中后,参数α为0.2,参数β0为2,参数γ为1。

表1 SSA和FASSA参数

所有测试均在AMDRyzen53350H、16G内存、2.10GHz的计算机上进行,编写程序在Matlab2019b上实现。

第一个函数为Schwefel函数公式如下,函数图像如图1所示

(15)

式中i表示自变量的个数。

图3 Schwefel函数的函数空间

第二个函数为Quartic函数公式如下,函数图像如图2所示:

图4 两种算法的适应度变化曲线

(16)

式中i表示自变量的个数。

图5 Quartic函数的函数空间

从图4和图6可以很明显看出,FASSA算法具有更快的收敛速度和更高的收敛精度而且明显优于SSA算法。并且在处理多峰函数问题时,FASSA算法在收敛精度方面也得到了极大改进。

图6 两种算法的适应度变化曲线

利用该模型进行大学生体育成绩预测的流程如图7所示。

综上,通过萤火虫改进的麻雀算法建立大学生体育成绩预测流程主要如下:

图7 改进麻雀算法优化LSSVM流程

1) 收集某大学待预测的大学生体育成绩,然后构建体育成绩数据集(即训练集与测试集),并对体育成绩数据进行数据预处理,得到大学生体育成绩的时间序列。

2) 利用麻雀优化算法对 LSSVM 模型的参数进行优化,主要步骤如下:

Step1:设置麻雀种群数目和迭代次数,提前设置麻雀的发现者和追随者的比率。

Step2:通过LSSVM模型的参数γ和σ,计算麻雀的适应度值,并进行排序;

Step3:由式(9)-式(11)更新麻雀的发现者、追随者和发现捕食者麻雀的位置;

Step4:利用式(14)萤火虫扰动更新麻雀位置。

Step5:通过计算适应度函数的函数值,不断更新到所有麻雀的最优个体位置。

Step6:判断是否达到要求,如果达到设定值,则运行结束,否则转至 Step3 继续迭代更新。

3) 根据最优参数得到最优模型后进行大学生体育成绩预测。

由于原始的麻雀算法在搜寻最优值时可能会陷入局部最优的问题,无法很好的寻找LSSVM模型的最优参数γ和σ,通过添加萤火虫扰动,可以很好的提高其算法的鲁棒性和全局搜索性能。

7.1 实验数据来源与处理

为了有效地预测大学生体育成绩,本文收集了南昌航空大学某年级2000名大学生100米的体育成绩样本,其中前1400名学生成绩作为训练样本,进行训练后600名学生成绩作为测试样本。

7.2 数据预处理

对于某一个体育项目的历史数据进行收集时,由于数据跳动角度,因此需要进行均一化处理,如下式子表示:

(17)

式中xmin和xmax分别表示大学生体育成绩的最小值和最大值。通过对大学生体育数据的归一化使得LSSVM模型的预测效果得到了改善,使预测精度更高。

7.3 实验结果分析

对大学生体育成绩预测的结果采用下面的数学指标进行评价预测:

均方误差(MeanSquaredError)

(18)

均方根误差(RootMeanSquaredError)

(19)

平均绝对误差(MeanAbsoluteError):

(20)

平均绝对百分比误差(MeanAbsolutePercentageError)

(21)

为了评价本文中所提出萤火虫改进的麻雀搜索算法的优势,采用LSSVM模型、PSO-LSSVM模型、SSA-LSSVM模型与本文方法进行对比,各自独立运行100次取评价指标平均值,对比结果如表2所示。

仿真结果如下图8-图11所示,通过对比分析得到如下结论:

1)通过表2可知,基于萤火虫改进的SSA-LSSVM模型对于大学生体育成绩预测与其它算法相比,各类的评价指标明显优于其它算法。

图8 均方误差

图9 均方根误差

2)由图11可知,基于萤火虫改进的SSA-LSSVM模型预测的曲线更接近实际值,预测的精度更高。

图10 均方根误差

3)由图8-图10可知,SSA-LSSVM的模型评价结果由于SSA算法在寻优过程中,很容易受到γ 很大,σ 很小因素影响,导致LSSVM预测模型出现过拟合现象,从而陷入局部最优的问题。而基于萤火虫改进的SSA-LSSVM模型增加了萤火虫扰动,从而避免了陷入局部最优的问题,更加容易寻找LSSVM模型的最优参数。

图11 模型平均预测值对比

为了有效地验证本文中所提出来的基于萤火虫改进的SSA-LSSVM模型预测在体育教育中的通用性,选取了南昌航空大学某年纪男生1000米长跑、女生800米长跑、男生立定跳远、女生仰卧起坐,男生俯卧撑等5项体育成绩进行预测,来检测本文中所提出模型的通用性,各自独立运行100次取评价指标平均值,预测结果如表3所示。

表3 不同体育项目评价指标结果对比

体育教育是提高当代大学生身体素质的主要途径之一,因此为了提高基于 LSSVM模型的大学生体育成绩预测的精度和效果,本文提出了基于萤火虫改进的麻雀搜索算法对 LSSVM参数(惩罚因子γ和核函数参数σ)进行优化。为了提高麻雀搜索算法的全局寻优搜索能力,也为了避免其过早的陷入局部最优等问题,在原有麻雀算法的基础上添加了萤火虫扰动,提升了麻雀搜索算法的搜索性能,增加了算法的泛化能力,提高了模型的预测精度。最后,通过对大学生体育成绩进行仿真,结果显示出FASSA-LSSVM模型与 SSA-LSSVM模型、PSO-LSSVM模型、LSSVM模型相比增强了其泛化能力,因此相较于其它算法模型,改进后的模型能够获得更优的预测精度,其模型自身的鲁棒性与泛化能力也提升较大。最后通过验证模型的通用性,显示出FASSA-LSSVM模型在体育教育方面应用的前景,可以很好地进行各种体育成绩预测,为大学生体育锻炼,提高身体素质提供理论保证,同时也为老师制定相关体育课程提供更好的科学指导。

猜你喜欢搜索算法萤火虫麻雀改进的和声搜索算法求解凸二次规划及线性规划烟台大学学报(自然科学与工程版)(2021年1期)2021-03-19拯救受伤的小麻雀作文小学中年级(2019年10期)2019-11-041958年的麻雀新世纪智能(高一语文)(2018年11期)2018-12-29萤火虫小天使·一年级语数英综合(2018年7期)2018-09-12麻雀趣味(语文)(2018年2期)2018-05-26萤火虫小天使·一年级语数英综合(2017年6期)2017-06-07紧盯着窗外的麻雀山东青年(2016年1期)2016-02-28抱抱就不哭了为了孩子(孕0~3岁)(2016年1期)2016-01-16夏天的萤火虫小天使·一年级语数英综合(2015年8期)2015-07-06基于汽车接力的潮流转移快速搜索算法电测与仪表(2015年15期)2015-04-12推荐访问:模型 改进 成绩
上一篇:支持一般电路的高效安全基于属性签名
下一篇:基于STM32的智能海水油污清洁系统

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有