1、推荐系统在高校图书馆的应用研究 马东明 山西财经大学 摘 要: 大数据时代, 信息技术和网络的不断发展诱发了信息的过载问题。为了向师生提供跨数据源的信息推荐服务, 高校图书馆必须构建数字图书推荐系统。文章对国外较为成熟的图书推荐系统进行分析, 对其推荐模型, 关键技术等进行了概括分析。最后对高校图书推荐系统的研究难点和发展趋势进行展望。关键词: 推荐系统; 高校图书馆; 个性化服务; 作者简介:马东明 (1964-) , 女, 山西财经大学南校区图书馆副研究馆员。收稿日期:2017-08-11Received: 2017-08-11随着信息网络的不断发展, 高校图书馆作为网络信息资源与师生的桥
2、梁, 面对纷繁复杂的信息海洋, 高校图书馆应针对网络信息与用户阅读体验等方面, 为高校师生提供高质量的信息服务来满足用户的阅读要求。以用户为中心, 信息化与智能化的服务为基础的智慧型图书馆成为图书馆发展的必然趋势。一、高校图书馆个性化服务高校图书馆作为高校师生的文献信息管理者, 为教学科研工作提供信息服务。面对“信息过载”, 读者如何找出适合自己的信息资源, 图书馆应当如何将其丰富的资源有效的利用成为目前传统图书馆面临的严峻挑战。图书馆在其服务中应当突出其智慧性, 为读者提供个性化的阅读体验, 提高其阅读满意度。推荐系统作为解决“信息过载”问题的主要手段, 本文就推荐系统在高校图书馆的应用进行
3、深入探讨, 并就其应用前景以及研究难点进行分析。随着教育水平的提高, 国家对高校建设的力度不断加大, 使得目前高校图书馆馆藏资源十分丰富, 而信息资源的高速增长同样使得高校图书馆电子信息资源越来越多。导致信息资源利用率偏低, 甚至多数资源无人问津。而高校图书馆的服务对象主要是高校师生, 其对于信息服务质量要求较高, 这就要求高校图书馆能够为读者提供符合其专业程度以及专业方向的个性化信息服务。二、国内外图书推荐系统(一) Amazon 图书推荐系统亚马逊作为应用推荐系统最为广泛的电子商务网站, 在其网络书店中采用了基于项目的协同过滤模型, 获得了较好的推荐效果。算法首先在用户评分矩阵中利用相似性
4、算法获取项目之间的相似度, 并以此得到与项目特征最为匹配的邻居项目集合, 为用户推荐邻居项目中评分最高的 Top-N 项目列表。图 1 协同过滤推荐流程 下载原图图 1 为协同过滤推荐算法的推荐流程, 协同过滤思想自 1992 年由 Goldberg 等人提出后得到了广泛的应用。其目的在于为当前用户推荐符合用户兴趣的项目或者与测用户对某一项目的评分。推荐系统中通常将用户集合记为 U, 其中U=u1, u2um, 项目集合记为 I=i1, i2im。对于某一个用户 ua, 存在一个对系统项目评分向量 Iaj来记录用户 ua对项目 ij的历史评分。通常将基于协同过滤需要计算用户如下内容:1.为用户
5、 ua预测在 ij项目的评分值 Pa, j。2.以预测评分值的排序选取用户评分值最高的 N 个项目作为用户 Top-N 推荐列表供用户选择。Amazon 图书推荐系统具有如下优势:1. 完备的推荐内容:Amazon 以其完备的用户历史信息和图书资料能够完成各种角度下的图书相似度计算。包括:图书的外部特征、图书的出版特征、图书销售情况、图书的关键词标签等等通过侧面信息对图书进行描述, 为用户提供全方位信息服务。2. 较高的自动化推荐能力:Amazon 通过记录用户历史点击、访问记录、购买记录、页面停留时间等等数据, 并以此建立用户兴趣模型。当用户查找图书时, 能够为读者实现实时的图书推荐。3.
6、多种推荐方式:Amazon 采用多种推荐方式结合的策略。其中最为突出的是其提供的书评推荐, 以作者、读者等人的角度交流提交书评, 能够让读者在选择时从多种角度了解图书, 以便读者与读者, 读者与作者之间的交流。(二) 斯坦福大学 Fab 系统斯坦福大学在数字图书馆研究中提出了 Fab 系统, 其主要作用是为了帮助读者从海量资源信息中筛选出用户需要的信息。系统采用基于内容的推荐和基于协同过滤的推荐模型, 利用混合推荐技术将其结合使用, 有效的向用户推送其感兴趣的信息。系统通过用户的历史阅读信息以及评分, 利用协同过滤等推荐模型为提取用户兴趣方向, 并将其喜好的书籍推荐给具有相同兴趣偏好的用户。F
7、ab 综合基于内容和基于协同过滤的推荐模型, 能够为用户推荐合适信息的同时, 混合推荐也有效缓解了推荐系统中存在的冷启动问题。实现了个性化推荐服务。(三) Citeseer 系统Citeseer 是 NEC 建设的一个学术论文图书馆, 利用自动引文表示技术提供了通过连接检索文献的检索方式。2000 年 NEC 研究院的 Kurt 等人将个性化推荐功能引入 Citeseer。通过收集用书签, 收藏等方式, 得出用户偏好与兴趣方向。利用最近邻方法方式计算用户相似度, 并将合适的网页推荐给用户。(四) 加州大学 Melvyl 推荐系统2006 年, 加州大学图书馆为提高读者阅读体验以及图书馆服务退出
8、了 Melvyl推荐系统。其主要使用两种推荐方式:第一种利用加利福尼亚大学的图书馆阅读数据进行推荐, 根据图书的被借阅历史, 将不同书目建立联系。在模型中, 以图书作为节点, 以借阅相同书籍的用户数作为权重, 根据书籍权重排序为用户进行推荐。(五) 当当网推荐系统当当网将其推荐系统分布在各个角落。通过收集用户在其网站上的点击, 收藏, 购买等记录。通过多种推荐模型的计算为用户提供个性化推荐服务。凭借其大量用户数据的优势, 以及多层面的推荐算法, 当当网的推荐系统实现了对于海量用户数据挖掘, 并为其提供了精确实时的推荐。利用用户历史数据发掘用户潜在需求, 提高其推送质量, 为用户购买提供了便利,
9、 同时提升其网站的用户忠实度。其他的包括 SERF 推荐系统, 百度学术的订阅等等都有着其各自的推荐方式。总体来说, 图书推荐系统有着其明显的特点。 (1) 推荐针对性较强, 尤其是高校图书馆推荐, 主要的服务对象是高校的师生群体。有着较高的专业度与信息新颖度需求; (2) 图书推荐的自动化程度较高, 尤其是在读者偏好采集困难地情况下, 如何有效利用其他方式分析用户兴趣度, 为其主动推送符合读者需求的信息, 是图书推荐的重要研究点; (3) 推荐方式丰富, 由于图书馆推荐的基础是推荐系统, 尤其近些年信息高速发展, 推荐系统的研究不断进步, 传统的推荐系统与新型推荐方式的结合, 为推荐系统的发
10、展注入了新的活力; (4) 实时性与载体多样化, 图书推荐的实时性影响着读者的阅读体验, 在线推荐能够及时满足读者阅读需求。而载体的多样化体现在推荐内容, 不仅包括图书, 还包括多媒体等网络资源。三、图书推荐的难点与发展前景针对高校图书馆馆藏丰富产生的“信息过载”问题和面对高专业度的服务对象, 其推荐模型的难点与其他电子商务的推荐有着明显的不同。(一) 读者的偏好获取用户偏好是推荐系统中的推荐前提。在电子商务领域中, 用户的偏好信息可以通过其登录方式, 好友推荐等其他方式获取。而在高校图书馆的推荐系统中, 由于多数高校图书馆的仅仅通过学号方式登录系统, 根据其学号系统可以得到读者的专业方向与班
11、内同学并为其进行推荐。但由于图书馆借阅方式的独特性, 许多读者仅仅在馆内进行阅读, 并未借阅, 这时系统将无法及时收集用户的偏好变化。同理, 由于其登录方式的单一化, 系统无法收集其在网站搜索历史, 好友信息, 严重制约了高校图书馆推荐系统的信息收集能力, 进一步影响了读者的偏好获取从而使得推荐难以凑效。在移动推荐的发展下, 多数图书馆可以在移动终端为读者进行信息服务。通过显示方式采集用户信息会影响到用户的阅读体验, 如何利用隐式方式来获取用户偏好成为了移动终端下图书推荐的一大难点。(二) 推荐的冷启动问题推荐系统中存在冷启动问题, 在高校图书馆中应用的图书推荐系统同样会出新读者和新的书目等问
12、题。尤其对于首次使用系统的新生或者教师, 系统没有用户的信息, 无法获取用户偏好。新项目问题是指当图书馆购入新的书籍一段时间后才可能有读者进行借阅并对其评级, 在使用协同过滤方式的图书推荐系统中, 对于新用户和新书籍无法进行有效的推荐。如何利用如读者好友信息, 书籍在其它图书馆或者网站的评分来解决冷启动问题值得研究人员的关注。(三) 图书推荐结果的解释在推进系统领域中, 很少有研究者关注推荐结果的解释性。但有效的推荐结果解释性可以让使用者能了解如何进行推荐, 可以提高用户对推荐结果的信任度, 提高用户的系统忠实度。如在高校图书馆推荐中, 为读者推荐其导师或者专业领域中新的知识内容, 为读者推荐
13、其好友的阅读书目等等, 让读者了解系统推荐的机制, 帮助读者更好的做出决定, 也是推荐系统中的一个重要研究方向。(四) 图书组推荐多数推荐系统针对个人进行个性化推荐, 但在一些情况下, 尤其在高校图书选择方面, 对一组人, 如一个导师和学生组成的团体或者教师团队进行图书推荐。组推荐中需要均衡多用户偏好, 如何处理组内用户的偏好冲突, 为一组读者进行有效高质量的推荐, 是组推荐的重点。目前, 在推荐系统中对于组推荐的研究很少, 但这一推荐方式在高校图书馆服务对象的特定情况下却很有必要。四、结语随着知识信息时代的发展, 人们对于知识和文化渴求愈发强烈。而信息资源的快速增长使得“信息过载”问题越来越
14、严重。这一问题在高校图书馆中显得更为突出, 许多资源长期无人问津。近年来, 随着推荐系统在电子商务领域的快速发展, 推荐系统引入高校图书馆能有效化解其面临的困境。利用其馆藏丰富的特点, 为高校学生和老师进行图书推荐, 担当起促进学术交流的使命和重任, 并为读者提供个性化的推荐服务, 为读者创造良好的阅读体验, 使图书馆资源得到更充分的利用。因此, 高校图书馆推荐具有重要的研究意义和应用前景, 本文将该领域的研究进展和发展趋势进行分析总结, 希望促进图书馆推荐领域的研究工作。参考文献1黄奇奇, 邓仲华.高校图书馆网络信息资源利用现状及评价体系研究以推荐学术站点为例J.图书馆学研究, 2013 (
15、22) :44-49. 2高媛.高校图书馆网络信息资源共享现状与对策探析J.图书馆工作与研究, 2009 (12) :102-103. 3王连喜.一种面向高校图书馆的个性化图书推荐系统J.现代情报, 2015, 35 (12) :41-46. 4黄晓斌, 张海娟.国外数字图书馆推荐系统评述J.情报理论与实践, 2010, 33 (08) :125-128. 5Balabanovic M, Shoham Y.Fab:Content-based, collaborative recommendationJ.Communications of the Acm, 1997, 40 (3) :66-72.