大学英语多媒体课件资源定向检索技术研究

来源:优秀文章 发布时间:2023-02-17 点击:

薛艳

(西安美术学院, 艺术教育学院, 陕西, 西安 710000)

互联网技术的飞速发展以及多媒体技术的广泛应用,使人类获取多媒体资源的方式发生了很大的变化[1-2]。在这种情况下,各种类型的多媒体资源定向检索已经逐渐成为不同类型用户获取多媒体的重要工具[3]。但是传统的资源检索主要是通过关键词进行搜索,检索效果往往无法令人满意。为此,相关专家给出了一些较好的研究成果,例如郑伟等[4]通过贝叶斯网络组建信息检索模型,实现信息检索。李爱勤[5]重点分析不同平台中地名的表达特征,设计了面向地名信息的多级索引组织方式以及检索框架,以有效实现信息检索。以上2种方法虽然取得了较为满意的研究成果,但是由于未能对多媒体课件资源进行降维处理,导致定向检索错误率增加,检索效率和课件资源的总相似度降低。为此,提出一种大学英语多媒体课件资源定向检索方法,最后通过仿真实验证明本文所提方法的优越性。

1.1 大学英语多媒体课件资源降维

在大学英语多媒体课件资源定向检索中,对图像和视频的内容进行描述,通常情况下使用特征向量的形式表示,特征向量是指在变换下方向不变,或者简单地乘以一个缩放因子的非零向量。为了更加精准地描述多媒体信息[6],大部分特征向量往往是高维的。为此需要选择特征组合进行降维处理。以下采用LLE算法对大学英语多媒体课件资源进行降维处理,具体步骤如下。

给定N个输入特征向量集合{x1,x2,…,xn},采用LLE算法,获取降维后的输出向量,整个算法主要划分为以下几个步骤。

(1) 获取各个特征向量的k个最近邻点,即距离每个特征向量最近的点。

(2) 采用各个特征向量的近邻点对特征向量进行重建[7],获取重建过程中误差最小的近邻局部重建权值矩阵。

(3) 通过步骤(2)中组建的矩阵和对应邻近点计算特征向量的输出向量。

计算各个特征向量的k个近邻点,其中k为一个固定值。设定一个误差函数,主要用于求解局部重建权值矩阵,具体计算如下:

(1)

(2)

当求解局部重建权值矩阵W时,需要使误差函数的取值达到最低[8-9],即通过样本点的近邻点组建最优W矩阵使误差函数取值达到最低。

针对特征向量xi,通过k个近邻进行局部重建,则误差能够表示为

(3)

其中,Q(i)为k×k的矩阵,具体的表达形式如下:

(4)

如果设定r是一个规范化参数,I为单位矩阵,则:

(5)

将全部的特征向量映射为低维空间中的向量,同时需要使输出数据在低维空间中保持初始拓扑结构。以此为依据[10],建立一个代价函数,在映射的过程中需要使代价函数的取值为最低,具体为

(6)

式中,yi为xj的输出向量,y(i)j为y(i)的k个近邻点,同时需要满足以下约束条件:

(7)

其中,误差代价函数式(6)可改写为以下形式:

(8)

式中,M为一个N×N的对称矩阵,利用式(9)给出具体的表达形式为

(9)

通过拉格朗日乘子法将其进行转换,则特征值和特征向量为

(10)

为了使代价函数最小化,需要选取M的最小m个特征值对应的向量为列向量组建矩阵YT,则Y的列向量为m维空间的降维向量。

当确定特征向量的局部最近邻个数k值后,组建如下的稀疏矩阵,即:

(11)

给定限定条件,将上述问题转换为最小化问题,即转换为最小代价函数的特征值和特征向量:

(12)

在上述分析的基础上,通过LLE算法对大学英语多媒体课件资源进行降维处理,即:

(13)

1.2 大学英语多媒体课件资源定向检索

采用多模态检索机制进行大学英语多媒体课件资源定向检索,利用图1给出多模态检索体系结构。

图1 多模态检索体系结构

当给出交叉参照索引时,需要优先设定多媒体对象,以下将交叉参照多媒体对象简称为广义关键字,即:

P(Oi)=(〈gki1,wi1〉,〈gki2,wi2〉,…,〈gkik,wik〉,…,

〈gkiN,wiN〉)

(14)

在组建检索系统的初级阶段,需要优先对多媒体进行预处理,多媒体对象的交叉参照索引可以根据分析已有的多媒体文档组成结构以及网络上的超链接组建。

通过自动得到的交叉参照索引全面利用大学英语多媒体课件资源间的隐式语义关系,针对面向用户的检索而言,仅仅使用这些交叉进行检索能力是有限的。首先,在大学英语多媒体课件资源进行预处理以及用户提交查询的过程中,会出现单一的多媒体对象,这些多媒体对象的交叉参照索引很难建立。同时,大学英语多媒体课件资源组成的结构仅仅是课件设计者对多媒体对象语义关系的理解,由于检索是面向用户的,所以在进行交叉参考索引时还需要全面分析大学英语多媒体课件资源语义间的关系。

为有效提升检索精度,需要加入相关反馈这种人机交互手段,通过用户对检索的反馈信息及时调整多媒体对象的交叉参照索引。其中,交叉参照索引以及关键字索引两者存在一定的相似性,两者的主要差异是交叉参照索引使用的是一组多媒体对象进行标注,而关键字索引使用的是关键字标注多媒体对象。

在交叉参照索引中,各个广义关键字gkik所对应的权重wik体现了上述的第一个因素,所以需要对其进行调整,如式(15):

(15)

式中,M为关键字的总数量,Mik为交叉参照索引中含有gkik广义关键字的多媒体对象总数。

两个多媒体对象间交叉参照索引间的相似度计算主要通过余弦距离完成,同时能够将交叉参照索引间的相似度转换为对应夹角的余弦值,具体表达形式如下:

(16)

(17)

通过加权平均算法计算多媒体对象P和查询对象Q两者间的距离,即:

(18)

其中,相关反馈信息的处理问题能够被描述为通过用户的反馈信息获取理想的查询对象,同时使反馈正例和查询向量间的加权距离平方和最小化,即:

(19)

采用拉格朗日乘子法将具有约束条件的优化问题转换为无约束的最优问题,即:

(20)

检索主要是通过多个不同的阶段完成的,首先通过索引进行候选对象匹配;
再更新查询矢量和相似度度量,计算候选对象的综合相似度;
最后排列对象并且返回至用户。其中,多媒体对象和例子对象两者间的总相似度计算式为

(21)

式中,Ri为第一阶段计算出Oi和例子对象两者间的对等索引相似度。

为进一步提升检索结果准确性,用户可以将大学英语多媒体课件资源标注为相关或者不相关。通过上述操作流程,对查询向量以及欧拉相似函数进行优化处理,通过一个全面的相似度量方法来重新计算各个对象的总相似度,具体计算式如下:

(22)

由此,实现大学英语多媒体课件资源定向检索。

为了验证本文所提方法的综合有效性,在Ubuntu16.04,电脑配置为GPU(NVIDIA GTX-10606G显存),CPU(i7-6700),8G内存,进行仿真实验测试。在仿真实验测试过程中,为保证实验结果的准确性,使代价函数的取值为最低,大学英语多媒体课件资源总数为800条,共进行50次实验测试,将定向检索错误率作为测试指标,具体的实验对比结果如图2所示。

图2 不同方法的定向检索错误率对比结果

分析图2可知,随着实验次数的持续增加,文献[4]、文献[5]方法的定向检索错误率均呈直线上升趋势,而本文所提方法的定向检索错误率则处于稳定的状态,这是因为设计方法优先对不同的课件资源进行了降维处理,有效剔除了无价值信息,从而使错误率得到了明显降低。

为预测各个检索方法的性能,以下实验测试将检索效率设定为测试指标,具体实验结果如表1所示。

表1 不同方法的检索效率对比结果

分析表1可知,本文所提方法能够获取课件资源中有价值的信息,剔除无用的信息,有效降低资源重叠,大大提升整个方法的检索效率,且明显优于另外2种方法。

为了更深入验证本文所提方法的优越性,将大学英语多媒体课件资源总相似度作为测试对象进行实验,对比如图3所示。

图3 不同方法的大学英语多媒体课件资源总相似度对比结果

分析图3可知,相比另外2种方法,本文所提方法的大学英语多媒体课件资源总相似度明显更高,最高可达到97.5%,这是因为其他2种方法未能对资源进行降维处理,导致其受到外界因素和人为因素影响严重,无法获取理想的检索效果,而本文设计方法对相关资源进行降维处理,能够满足大学英语多媒体教学的需要,具有一定的实际应用价值。

本文设计并提出一种大学英语多媒体课件资源定向检索方法。仿真结果表明,本文所提方法能够有效降低定向检索错误率,提升检索效率和课件资源总相似度。由于受到时间以及环境等因素的限制,致使本文所提方法仍然存在一定不足,后续将对其进行全面的完善和改进。

猜你喜欢 特征向量检索对象 二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例九江职业技术学院学报(2022年1期)2022-12-02克罗内克积的特征向量保定学院学报(2022年2期)2022-04-07涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象湖南税务高等专科学校学报(2021年4期)2021-08-30判断电压表测量对象有妙招中学生数理化·中考版(2020年10期)2020-11-27瑞典专利数据库的检索技巧科学与财富(2019年27期)2019-10-25一种基于Python的音乐检索方法的研究电子制作(2019年14期)2019-08-20一类三阶矩阵特征向量的特殊求法数学大世界(2019年7期)2019-05-28攻略对象的心思好难猜意林(2018年3期)2018-03-02EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用中华建设(2017年1期)2017-06-07专利检索中“语义”的表现专利代理(2016年1期)2016-05-17推荐访问:大学英语 定向 技术研究
上一篇:基于Spearman相关系数法与有功分量法的高阻接地故障选线方法研究
下一篇:基于消息队列的前置系统数据库同步转异步方案设计

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有