本文作者:杨玉枝 发表期数:现代职业教育 2021年47期 本文字数:2469
[摘 要] 为解决推荐系统具有用户行为数据极度稀疏的问题,研究对跨域图书推荐系统模型进行了研究,通过在系统用户数据、推荐系统算法、内容与算法融合三个层面,结合图书馆图书的特点,分别对跨域图书推荐系统模型进行分析。结果表明,跨域推荐系统为图书推荐系统提供了丰富的理论支撑。[关 键 词] 跨域推荐;图书推荐系统;模型分析
[中图分类号] TP391.4 [文獻标志码] A [文章编号] 2096-0603(2021)47-0104-02
推荐系统较好地帮助我们解决了信息量过载的问题,比如在商品推荐系统中,受限于个人的时间因素以及投入的精力限制,消费者常常仅与海量商品中极少部分的商品产生相互关联,容易引发推荐系统数据稀疏的问题。为了更好地克服并尽可能解决数据稀疏性问题,国内外学者们大多采用跨域推荐系统的方法,具体是通过取长补短的方式实现知识迁移,进而达到采用数据相对丰富的信息去弥补数据相对稀疏的目标[1-4]。
跨域推荐系统按照用户层面可以划分为:已知用户匹配的跨域推荐、不依赖用户的推荐、基于概率偏好模型的跨域推荐以及基于多视角神经网络的推荐。按照推荐系统算法的角度进行分类:基于内容的推荐,基于协同过滤的推荐、内容与算法融合的混合推荐以及基于迁移学习理论的推荐。该文以图书推荐为背景,结合用户层面和推荐系统算法的角度分别对跨域推荐系统进行阐述和分析,旨在为跨域图书推荐系统模型研究提供指导思想[5]。
一、用户层面的跨域推荐
(一)已知用户匹配
通过导入和整合相同图书跨域的评分数据,国外学者Berkovsky等人提出了非常经典的跨域推荐系统模型[6]。Lu[7]等人借用AdaBoosting弱学习器理论框架,用基于经验误差的信息筛查方式,有效地去除跨域推荐系统模式不一致的情况。Elkahky[2]等人提出了一种基于深度学习理论的内容跨域推荐系统MV-DNN,通过跨域的丰富内容数据共同映射到同一隐语义分布空间中。研究者通过整合图书之间的匹配信息,寻求在匹配信息之间的特征表征,更大限度地提高已知用户匹配的推荐系统的准确性。
(二)不依赖用户匹配
针对同一隶属平台,充分利用数据账号匹配信息方便的特性。著名学者Li[8]等人提出了以codebook为基础的跨域推荐系统模型CBT,该模型无需知道匹配学生跨域间的账号信息,仅仅通过学生或者图书的重叠部分信息可以作为推荐的重要依据。Chen[4]等人以矩阵分解理论为依据,提出张量分解思路,较好地解决跨域推荐的问题,目的是更好对隐因子进行分解,降低烦琐的二元关系转换表。通过不依赖用户进行学生和图书之间的匹配,较好地实现不依赖用户信息匹配的跨域推荐。
(三)基于概率偏好
基于隐语义模型的协同过滤算法目前越来越广泛,以PMF[9]模型为例,将学生和图书进行归纳,同步映射到不同层的隐聚类上,仅借助学生和图书的ID信息,另外凭借例如学生人口统计学特征和物品类别属性等信息进行辅助,最终通过概率偏好模型PPF,有效地解决隐语义模型存在的固有过拟合等问题。为继续丰富样本数据,较好地提升模型的精准率,采用跨域推荐模型,引入CMF[1]学习机制,隐向量权值共享,将引入的超参数模型拓展为贝叶斯概率生成模型,借助马尔科夫-蒙特卡洛算法求解,最终实现了基于概率理论的跨域推荐系统。
(四)基于多视角神经网络
神经网络可较好地解决特征提取的难题,尤其是在非线性特征的表征方面具有独特的优势,将跨域概率偏好模型与神经网络相结合[10]。例如以豆瓣平台为例,若在图书方面有兴趣爱好的用户,那么在电影推荐方面较大概率具有相同的兴趣爱好。进而可以推断,采用多领域间的内在联系可以较好地共享相同的隐语义向量信息,借助多视角用户信息的共享通道,不断优化多级训练的方式,大大地缓解了模型表现出的数据严重稀疏等问题。此外,通过不断对传统的推荐模型进行神经网络训练,较好地实现了特征难表征的难题,有效地增加了跨域推荐模型的自由度,同时也可以根据不同的实际场景,增加以及扩充更加复杂的神经网络模块。在充分挖掘神经网络特征表示的优越性的同时,实现神经网络的跨域图书推荐系统。
二、基于推荐系统算法的跨域推荐
(一)基于内容
基于内容的推荐[11],可以理解为基于历史行为数据对图书进行推荐,可以根据学生之前喜欢图书的相关信息,搜索与该图书相似度最高的图书进行推荐。推荐的依据来源于学生借书时留下的信息以及学生和图书关联信息,有效地获取学生的兴趣爱好。通常情况下,基于内容的推荐系统会出现数据丢失,通过分析数据分布的特点,可以得到原始数据的稀疏性以及离散性等特点,单纯通过内容的推荐,效果不佳。
(二)基于协同过滤
基于协同过滤的推荐[12],属于图书推荐与学生的兴趣相似度较高的推荐。协同过滤思路可以挖掘学生和图书之间的相似隐层关系,带来了丰富的内容信息,,基于学生或者图书的协同过滤思想进行跨域推荐方法,可以进一步挖掘跨域推荐中丰富的语义关联信息。基于协同过滤的方案可以较好地弥补单纯通过基于内容的推荐系统的缺陷,有效地解决数据稀疏性等问题,目前协同过滤推荐系统算法已经作为当前学者研究的热点。 相关阅读:
- 《新课程》杂志征稿通知
- 论文发表中的DOI是什么意思
- 《新课程》杂志论文知网收截图
- 新课程杂志主管单位主办单位说明
- 如何提高发表论文的“命中率”
- 《现代职业教育》杂志每版字数调整为2000字
- 现代职业教育杂志中国知网全文收录截图
- 中国知网期刊大全检索《现代职业教育》杂志
- 编辑在论文发表工作中的重要性
新课程杂志社提示:
本文标题:跨域图书推荐系统模型分析
当前网址:http://www.xinkecheng.cn/laigao/19904.html