作者:王嫣妮
来源:《中国集体经济》2020年第27期
摘要:随着推荐应用的不断拓展和深化,多样性在个性化推荐中得到了越来越多的重视。为了对多样性推荐有着更加深入且准确的理解,文章对于推荐多样性研究相关的国内外研究现状进行综述,主要从以下两个方面进行论述:推荐多样性的定义与度量、提高推荐多样性的方法,在此基础上,对多样性推荐的研究现状进行梳理与总结。 关键词:个性化推荐系统;推荐多样性;研究进展
个性化推荐系统是在信息过载的大背景下应运而生的产物。在个性化推荐系统产生之初,学者们的关注焦点落在推荐结果的准确性上,随着用户对推荐结果的要求越来越高,推荐的多样性受到了越来越多的关注。推荐多样性与用户的满意度以及长尾效应密切相关。提高推荐结果的多样性不仅能提供用户的满意度,增加用户粘性,还能拉动长尾物品的潜在价值,增加商家的收益,因此,其研究意义重大。学者们对个性化推荐系统的多样性进行了研究并取得了较大的进展。如何在维持一定程度的准确性的基础上,提高推荐的多样性就成为了推荐系统研究的重点。为了更好地梳理个性化推荐系统中的多样性推荐的研究进展,为未来的研究提供参考思路,本文分别从推荐多样性的定义与度量、提高推荐多样性的方法两个维度来对推荐多样性的研究现状进行综述。 一、推荐多样性的定义与度量
推荐多样性的定义从提出开始,一直在被不断完善。Smyth和McClave最先提出了推荐系统的多样性问题并进行了研究,指出推荐结果除了考虑准确性外还应该考虑新加入的物品与列表中物品间的不相似程度,这也促成了内部多样性评价指标的提出。不同的研究人员对于多样性的定义不同,因而采用不同的方式来度量推荐结果的多样性。在众多的关于多样性的定义与度量中,最基础的还是以推荐列表中两两物品间的不相似程度来衡量其多样性。
在对多样性进行评估时,不同的研究采用不同的度量标准与方法。比如,Vargas 等认为推荐多样性是类型覆盖率与非冗余性的结合,其中类型覆盖率值推荐列表包含的物品的种类多少,非冗余性指推荐列表中不出现属于同一类型的物品。因此,该文献采用两者的乘积来度量推荐结果的多样性。此外,从对推荐结果多样性的不同分类上,有着不同的度量方法。安维等将推荐多样性分为个体多样性、总体多样性、时序多样性,并总结出以下几个主要的衡量个性化推荐系统多样性的指标:ILS(推荐列表中项目的平均两两相似性)、海明距离、平均度、SSD(没有在之前的推荐列表中出现过的推荐项目所占的比重)、集中指数、覆盖率。王斌和曹菡采用EPD和ILD来衡量旅游推荐系统的新颖性和多样性。除了以上三种多样性,有的学
者提出分布多样性,即用以衡量推荐结果在整体分布上的丰富程度。其中,推荐结果的个体多样性和总体多样性最为常用。 二、提高推荐多样性的方法
在对各种提高推荐多样性的方法进行分类过程中,根据所选择的标准不同会有不同的分类结果。安维等从信息物理方法、二次优化方法、社会网络方法以及时间感知方法来论述提高推荐多样性的不同方式。而从提高推荐多样性的方法所发生的阶段上来看,主要有两种方式:改善推荐算法和进行二次优化。下文分别从这两个角度来对提高推荐多样的方法进行综述。 首先介绍通过改善推荐算法来提高推荐结果的多样性的研究。改进推荐算法发生在推荐列表产生过程中。有的研究通过考虑除了评分之外的其他因素来进行改进,比如用户的多样性偏好、用户间的信任等。相似度的计算是推荐算法的核心步骤,因而在相似度的计算上采取一定的措施不失为一个提高多样性的好思路。而根据现有的研究文献,对相似度的计算进行改进的方式又大致可以分为以下两种:对流行性进行惩罚以及改变选择邻居用户的策略。其中前一种方法,对流行性进行惩罚又可以分为两种:惩罚活跃用户和惩罚流行物品。其次,提高多样性的方法是进行二次优化,其对面向准确性的推荐列表根据不同的优化策略进行二次优化操作,从而提高推荐结果的多样性,而这类方法集中在重排序阶段。Adomavicius 和 Kwon引入评分阈值作为参数来对阈值以上的物品进行重新排序。吴颖杰等采用分段推荐法来提高系统的多样性。此外,有的研究还采用将多样性推荐问题转化为其他问题来实现推荐多样性的提高。比如,Malekzadeh 和 Kaed通过将推荐问题转化为一个多目标优化问题,采用模拟退火算法来进行计算。该方法的三个目标为:个性化多样性、减少流行物品增加长尾物品以及准确性。刘慧婷和岳可诚将最大化总体多样性问题转化为最大化物品分布均匀度的问题。 三、结语
推荐系统作为缓解信息过载的有效手段之一,从出现至今不断发展完善。最初,一个好的推荐系统往往聚焦于推荐准确性。随着推荐系统地不断发展,推荐质量的衡量已不仅局限在推荐准确性上,推荐多样性等其他维度的推荐质量越来越受到重视。推荐多样性自提出以来,其定义在被不断完善,对多样性的度量也不断丰富。学者们将推荐多样性进行了分类,主要有个体多样性、总体多样性、分布多样性、时序多样性等。在提高推荐多样性上,学者们尝试了很多方法,主要包括直接改进推荐算法与二次优化。对于直接改进推荐算法,主要通过考虑除了评分之外的其他因素来实现,比如用户对物品进行评分的概率、用户的多样性偏好、用户的好奇心等。另外,对相似度的计算进行改善也有着较好的效果。在二次优化方法中,重排序方法是提高推荐多样性的较为高效简洁且可扩展性的方法,不同的学者尝试了不同的重排序方法,比如将物品根据流行性倒排序。
任何拋开推荐准确性的多样性都会失去原本的意义,面向多样性的推荐常常需要以面向准确性的推荐算法为基础。未来,如何在推荐准确性与多样性之间更好地达到平衡,有着重要的研究意义。 参考文献:
[1]Bradley K, Smyth B. Improving recommendation diversity[C].2001.
[2]Vargas S, Baltrunas L, Karatzoglou A, et al. Coverage, Redundancy and Size-Awareness in Genre Diversity for Recommender Systems[C].Foster City,Silicon Valley,California,USA:ACM,2014:209-216.
[3]安维,刘启华,张李义.个性化推荐系统的多样性研究进展[J].图书情报工作,2013,57(20):127-135.
[4]王斌,曹菡.基于新颖性和多样性的旅游推荐模型研究[J].计算机工程与应用,2016,52(06):219-222.
[5]Fleder D M, Hosanagar K. Recommender Systems and their Impact on Sales Diversity[C].San Diego, California,USA: ACM New York,NY,USA,2007:192-199. [6]邓明通,刘学军,李斌.基于用户偏好和动态兴趣的多样性推荐方法[J].小型微型计算机系统,2018,39(09):2029-2034.
[7]李吉,黄微,郭苏琳.一种基于相似度和信任度融合的微博内容推荐方法[J].图书情报工作,2018(11):112-119.
[8]Karakaya M, Aytekin T. Effective methods for increasing aggregate diversity in recommender systems[J]. Knowledge and Information Systems,2018,56(02):355-372. [9]Adamopoulos P,Tuzhilin A.On Over-
Specialization and Concentration Bias of Recommendations: Probabilistic Neighborhood Selection in Collaborative Filtering Systems[C].Foster City, Silicon Valley,CA,USA:ACM,2014:153-160.
[10]Yang J X, Wang Z Y. An Improved Top-N Recommendation for Collaborative Filtering[A].Li Y,Xiang G, Lin H, et al. Communications in Computer and Information Science.SINGAPORE: SPRINGER-VERLAG SINGAPORE PTE LTD,2016:233-244.
[11]Zhao X, Niu Z, Chen W. Opinion-Based Collaborative Filtering to Solve Popularity Bias in Recommender Systems[C]Springer-Verlag Berlin Heidelberg, 2013:426-433.
[12]Adomavicius G, Kwon Y. Improving Aggregate Recommendation Diversity Using Ranking-Based Techniques[J].IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING,2012,24(05):896-911.
[13]吴颖杰,徐洪波,康瑞.一种基于协同过滤和排序的多样性增强的推荐算法[J].电子测量技术,2018,41(08):7-12.
[14]Malekzadeh Hamedani E, Kaedi M. Recommending the long tail items through personalized diversification[J]. Knowledge-Based Systems,2019,164:348-357.
[15]劉慧婷,岳可诚.可提高多样性的基于推荐期望的top-N推荐方法[J].计算机科学,2014,41(07):270-274.
(作者单位:浙江理工大学管理科学与工程系)
因篇幅问题不能全部显示,请点此查看更多更全内容