推荐系统技术与架构在数字图书馆中的应用

来源:优秀文章 发布时间:2023-04-07 点击:

孙蒙琦,姜瑞华

(内蒙古医科大学附属医院,内蒙古 呼和浩特 010030)

随着网络的普及,信息技术的不断发展,图书也在逐步完成电子数字化的转变,图书馆进入了线上电子服务的新阶段[1]。数字图书馆将海量的信息资源进行收集、储存并通过互联网完成资源的传播,世界上大部分国家已经将数字图书馆当做创新体系和创新能力的组成部分,将其作为国家信息建设的基础。信息化社会给人们的生活带来了便利的同时,海量的资讯也会导致信息过载[2]。一般信息系统对于客户的喜好无法给予智能、主动的推荐,只能由用户在搜索引擎中对目标信息进行相关描述后得到搜索结果,因此,推荐系统顺应时代的需求随之出现。推荐系统会将用户以及系统中相关项目的信息进行建模,并通过系统自有的特定算法为用户快捷地推荐感兴趣、有价值的信息,以达到提供个性化服务的目标[3]。本文对推荐系统与数字图书馆进行搭载的作用和意义,展开详细的研究分析。

1.1 节省存储空间

数字图书馆将图书进行数字化的转化并储存,相比于传统书籍,数字图书馆的产生节省了空间,同时减少了资源的浪费,对资料的保存和管理较传统图书馆更具有优势[4-5]。

1.2 方便检索

数字图书馆以庞大的数据网络为依托,用户通过对信息的检索,输入关键字即可获取大量信息,将以往传统的、烦琐的检索简单化,节省时间的同时提高了效率。

1.3 信息的远程传递

由于传统图书馆的建设受到多种因素的影响,数量和规模有一定的限制,而数字图书馆出现后,用户能够随时随地地进行阅读和信息获取,节省了往返图书馆的时间,使阅读和信息的获取、传递打破了时间和空间的限制,实现了用户阅读的自由性[6]。

1.4 多人共享

传统图书不能多人同时进行阅读,在一定程度上限制了资源的共享和传递,而将图书资源进行数字化的转换和管理,可以同时满足多个用户的需求,还会为用户提供多种同类别的信息推荐和选择,使图书资源的利用率得以提高[7]。

2.1 资源过滤不完善

数字图书馆的检索功能只能根据用户对目标的描述进行相关推荐[8],推荐的情况取决于用户对目标的描述,对于用户的喜好无法给予智能、主动的推荐,在一定程度上,对资源的过滤不够精准,也使用户将时间浪费在了信息的筛选上。

2.2 信息超载

数字图书馆海量地收集了各类信息,并将其进行有序地存储,再通过互联网进行传播[9]。虽然节省了时间、带来了便利,但同时也会出现信息过载。用户需要对大量信息进行分辨来获取有用的信息,这给用户造成了一定的困扰。

3.1 数字图书馆个性化服务的特点

数字图书馆是网络和信息技术发展的产物,实现了对广泛的用户群体提供个性化服务的计划[10]。个性化服务作为数字图书馆面向广大客户提供服务的基本模式,以及在新时代中发展的重要手段,其主要内容就是针对不同阶层和年龄的用户群体,根据用户的基本信息,通过不同的算法,为用户进行有针对性、目标性的推荐,以满足用户对信息的不同需求。以信息系统的庞大数据体系为依托,为用户提供资源浏览、查阅等服务。

3.2 图书数据的检索

应确定检索内容以及数据描述方式的选择。用户在检索图书和文献时,会根据书名、作者、出版时间等关键信息进行检索,所以在确定检索内容时,需将具有检索需求的所有字段数据进行收录。此外,应在索引中将用户不可见的字段内容进行保存,为后续业务的拓展、系统的升级改造做好准备。

在互联网海量信息传递的同时,为解决信息超载的问题,推荐系统应运而生。通过技术处理,有效解决用户进行信息浏览时发生的各种问题,对信息进行整合、归类、分析,最终根据用户的喜好推荐信息。

5.1 非个性化推荐

这是指用户在进行信息检索和浏览的过程中,所接收的推荐是相同且无差别的。对于不同类别的信息,都会根据搜索情况和浏览量,按照由高到低的算法向用户推荐。

5.2 根据属性推荐

根据用户的搜索类别进行推荐。例如,数字图书馆中的杂志、报纸、书籍等特定的类别,搜索后将所属类别下的所有信息进行展示。

5.3 用户相关性推荐

系统根据用户注册的基本信息、历史浏览记录进行相关性推荐。以数字图书馆为例,对曾经阅读过计算机类书籍的用户,进行相关以及相似品类书籍的推荐,包括一致方向、一致兴趣。

5.4 知识相关性推荐

由于系统囊括了新老用户的相关注册信息,对老用户的浏览和搜索记录进行相关性推荐的同时,同归特定算法对新用户的基本需求进行推断分析,系统需要具有推荐满足用户需要的产品的功能,整合不同的算法,将推荐进行合理优化以满足用户需求。

6.1 模型的提出

根据数字图书馆为用户提供个性化服务的特点,进行综合性的具体分析,结合推荐系统的基本理念,建立起数字图书馆推荐系统的基本架构。输入/输出、系统处理(输入识别和模糊匹配)、反馈以及交互组成了数字图书馆的推荐系统。其中,系统输入主要包括系统用户以及相关图书资源的信息、用户要求(自主检索)、推荐方法模糊匹配。输出是系统通过用户的检索,结合用户的信息、历史浏览等相关信息进行计算、整合,最终为用户提供个性化的推荐结果。推荐系统在使用过程中会获取到数字图书馆用户的喜好、信息。文献、书籍信息包括文献和书籍的类别、历史的浏览和借阅数、用户的评价等。用户信息包括个人信息的职业、性别、年龄、专业等。用户的输入包括关键字、书名、文献、浏览记录等。读者的借阅包括借阅图书、文献的记录、给出的书评和相关文献的评价。

系统通过对比不同数据进行分析处理,以完成为用户进行个性化推荐的任务,而数据在处理的过程中,通过对数据进行识别、分析、关联,再通过不同的技术算法,将用户本身的兴趣以及文献特征进行具体描述。

6.2 推荐系统技术的算法在数字图书馆中的应用

根据数字图书馆搭载推荐系统的特点,采用基于用户——用户关系的协作筛选算法、基于文献——文献关系的协作筛选算法、Bayesian 网络以及协同过滤法[11]。

6.3 基于用户——用户关系的协作筛选算法

首先,要通过计算机Pearson 相关系数对用户之间的相似性进行估算;
其次,以目标用户为中心,将与之关系数值最高的n个读者作为邻居;
最后,完成对文献喜好程度的预测。根据系统的预测结果和最终的分析结果,为数字图书馆的用户提供相关兴趣、信息的推荐。

6.4 基于文献——文献关系的协作筛选算法

将文献之间的联系作为重点,集合目标用户所查看的所有文献,通过对该类文献与考虑推荐的文献之间的相似度的计算,得出用户对文献的评分。结合用户的喜好,根据文献、图书、资料的既往评分以及综合价值进行测算和分析,将优质的、高分的文献、图书以及资料向用户推荐,保证用户获取信息的质量和时效性。

6.5 Bayesian 网络

这是以概率分析为基础,对不确定性知识进行表达和推理的模型。在数字图书馆推荐系统中应用时,更加适用于用户兴趣转变比较慢的情景下。从原始数据入手,进行挖掘,将符合原始数据的网络图关系进行确定,再根据已确定关系中的因果关系计算出用户或文献的时间节点的相关程度。该算法对于相对稳定的数字图书馆用户更具优势,目标用户检索内容、浏览历史的偏好较为一致,经推荐系统精准推荐,用户对知识、信息的获得将更加快速且具有较高质量。

6.6 协同过滤算法

协同过滤,也称为社会过滤,主要是通过用户的兴趣,在用户群体中找到与目标用户相似的用户,将用户的信息进行综合分析计算,将目标用户的喜好进行预测并提交反馈,通过系统的测算和目标用户喜好的预测,将用户偏好的信息进行过滤,完成将有效的高质量信息向目标用户的精准投递。

6.7 基于模型

在数字图书馆已有用户信息的基础上,通过用户评价模型对数据的处理将项目之间的关系进行识别,实现对数字图书馆用户群体喜好的准确预测。该算法在数字图书馆中的应用,减少了信息数据的重新计算,避免了预测时的稀疏性问题。

6.8 基于项目

计算未评价项目和已评价项目的相似度,将计算结果作为权重,对各个已评价项目进行评分,得到一个预测值。由此,在数字图书馆中应用,可以通过该算法,找到用户的若干“邻居”,根据相似的评分为数字图书馆的目标用户提供推荐列表。

6.9 基于项目评分预测

由于部分系统对相关项目评分的收录数据少之又少,使系统进行相关性推荐时的质量有一定的下降,所以,针对项目评分进行预测,弥补了数字图书馆可能存在的数据稀疏性问题,使推荐系统在运行过程中,保证了对用户推荐的质量,协助用户快速高效地完成信息和知识的选择。

互联网渗透于人们生活的各个方面,越来越多的资讯、信息丰富和便利了人们生活的同时,也导致人们对信息应接不暇。而推荐系统的出现,在极大的程度上,将当今社会网络“填鸭”式的信息输入、“信息过载”的问题有效缓解。将人们对知识的发现能力、选择性获取的能力有效地激发,将数字图书馆的用户体验有效地提升,同时,使服务提供方的效益更好,实现了用户和数字图书馆方面的互惠双赢。推荐系统在数字图书馆中的应用,使个性化服务得以充分发挥,将数据收集、分析、处理、反馈进行结合,使用户在对信息进行检索时,得出的结果更接近于用户的偏好,使信息获取更加及时、准确。

总而言之,推荐系统在数字图书馆中的应用,为用户提供了更加便捷、个性化、智能化的服务,纠正了信息过剩带来的弊端,提高了信息检索的效率,节省了用户的时间和精力,使数字资源的利用更加充分。该系统应用效果显著,值得推荐。

猜你喜欢检索个性化图书图书推荐南风(2020年22期)2020-09-15坚持个性化的写作文苑(2020年4期)2020-05-30欢迎来到图书借阅角小学生优秀作文(低年级)(2019年5期)2019-04-25新闻的个性化写作新闻传播(2018年12期)2018-09-19班里有个图书角小学阅读指南·低年级版(2017年12期)2017-12-26上汽大通:C2B个性化定制未来汽车与新动力(2016年6期)2017-01-04专利检索中“语义”的表现专利代理(2016年1期)2016-05-17满足群众的个性化需求中国卫生(2015年1期)2015-01-22国际标准检索质量与标准化(2010年5期)2010-05-03国际标准检索质量与标准化(2010年3期)2010-05-03推荐访问:架构 数字图书馆 推荐
上一篇:联合试验环境对象模型建模方法
下一篇:专访虎扑CEO殷学斌从内容、社区文化,走向群体认同

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有