收藏 分享(赏)

推荐方法总结.pptx

上传人:weiwoduzun 文档编号:4181568 上传时间:2018-12-14 格式:PPTX 页数:18 大小:661.53KB
下载 相关 举报
推荐方法总结.pptx_第1页
第1页 / 共18页
推荐方法总结.pptx_第2页
第2页 / 共18页
推荐方法总结.pptx_第3页
第3页 / 共18页
推荐方法总结.pptx_第4页
第4页 / 共18页
推荐方法总结.pptx_第5页
第5页 / 共18页
点击查看更多>>
资源描述

1、推荐系统方法总结,Reporter:吕瑞,目录,推荐系统概述 推荐方法的分类 相关理论与技术 常用的分析工具 个人体会,推荐系统概述,推荐系统是为解决大数据时代“信息选择难”问题而产生并在近些年来得到广泛应用的信息过滤技术。该技术主要根据与目标用户具有相似偏好关系的其它用户(邻居用户)的选择行为进行推荐,即协同过滤。与推荐系统相关的理论基础主要有数据挖掘、信息过滤、人工智能、统计建模、概率论、信息安全、隐私保护等。推荐系统因其主动式的服务模式和个性化检索结果而受到关注,并在亚马逊、Netflix、天猫、豆瓣、微博、百分百、一号店、银泰、聚美优品、王府井网上商城、海尔商城、中关村商城、360团购

2、导航、麦包包、新东方等网络平台中得到广泛的应用。,推荐方法的分类,基于用户特征的推荐此类方法通过为用户构建合适的特征向量,基于用户特征分布的特点计算用户之间的相似度。该方法具有方法简单、试用范围广等特点,在电子商务领域中应用广泛。关键内容是为用户建立特征向量、定义相似度计算方法。 基于内容的推荐此类方法首先对资源对象进行抽象和形式化的描述,如抽取标签等,然后根据资源形式化后的特征和属性计算资源对象的相似度,发现资源对象间的潜在关系。该方法在处理音频、视频、文本、图片等多媒体资源时应用很多。关键问题是资源对象建模。,推荐方法的分类(续),基于关联规则的推荐此类方法根据一些频繁共同出现或发生的事件

3、,实现关联推荐,主要用在话题推荐、购物推荐等。常用的算法是Apriori算法和FP-Growth算法 。 基于知识推理的推荐此类方法首先对对象关系建立规则库,在实时推荐时根据用户所处的状态对规则库进行检索从而为用户推荐可能感兴趣的内容。该类方法主要对具有依赖关系的事件进行推荐。关键在于构建合理的规则库。,推荐方法的分类(续),基于统计分析的推荐主要是利用统计学中的方法和原理(如数据集的数字特征:期望、方差、熵)进行统计分析从而发现数据中可能存在的潜在关系或者规律。该方法通常是一个基于概率的模型。 基于数据挖掘方法的推荐常用的数据挖掘方法有:聚类(距离聚类、层次聚类、密度聚类),分类(贝叶斯分类

4、、SVM、C4.5等),关联规则,主成分分析(因子分析、矩阵分解、 LDA),线性回归(线性回归、非线性回归),矩阵分解(MF 、SVD+ )等。,推荐方法的分类(续),基于图理论的推荐通过为用户构建关系网络(如二部图网络、社交关系网络等),并利用传播学的理论和分子动力学方法对用户关系进行演化,发现用户之间的关系。常用的图理论有PageRank、分子动力、热传递。 其他推荐(1)基于地图坐标信息的推荐(2)基于社交网络中用户关系和交互记录的推荐(3)多领域交叉推荐,推荐方法的分类(续),基于多种方法的推荐推荐系统中的算法众多,涉及的领域很广,单一的推荐算法很难适应动态变化的实际应用。而且,每种

5、推荐方法都存在明显的局限性,如基于用户关系特征的推荐更适合基于用户和特征评分关系的场景,不能直接处理多媒体对象,且当所处理的数据为稀疏数据时,算法效果较差。矩阵分解方法具有较好准确率且对数据集的稀疏程度要求较低,但该方法仅适用于矩阵模型的数据结构。因此,产生了多种混合推荐模型,从而克服单一方法的不足。,相关理论与技术,基于网络结构关系的方法以“二部图网络”为例 基于矩阵分解的方法以“MF”( Matrix factorization)为例 基于用户关系特征向量的方法常用的相似度计算方法,基于网络结构关系的方法,二部图网络结构将用户和Item抽象为两层网络,根据用户和Item的交互关系构成无向边

6、(有向边),然后通过节点间的信息传递发现用户之间潜在的关系,基本模型如图所示:,基于网络结构关系的方法(续),扩展的二部图模型:1.单模网络:将二部图网络映射到 单模网络中2.多模网络:为二部图网络建立中间层, 建立用户和Item之间更为广 泛的联系,基于矩阵分解的方法,思想:将一个稀疏的二维矩阵分解为两个矩阵,为求得原始稀疏矩阵中未知的评分项,为分解后的矩阵赋初值,并通过迭代拟合原始矩阵中已有评分项预测原始矩阵中的未知评分,可以根据预测出来的未知评分进行推荐,该方法已被多次证明在评分预测预测方面具有较好的效果。基本原理如图所示:,基于矩阵分解的方法(续),矩阵分解方法的扩展基于矩阵分解模型的

7、评分预测方法之所以能够受到人们的重视,一方面该方法在多个推荐算法比赛中得到了充分的检验,具有较高的评分预测准确率,另一方面该算法还具有较好的可扩展性。基于矩阵模型的评分预测方法不仅可以利用矩阵模型中自身的数据信息还可以对矩阵中的数据进行额外处理和添加新的其它信息到分解模型中。其中比较著名的改进方法包括以下几种方法:(1)增加偏差(biases)因素;(2)考虑时间(time)因素;(3)用户的信任(trust)关系;(4)用户的社交关系(social relation),基于用户关系特征向量的方法,用户特征向量与相似度通过为用户抽取合适的特征,为用户建立特征向量然后计算用户或者Item的相似程

8、度。示意图如下图:,基于用户关系特征向量的方法(续),常用的距离和相似度计算方法余弦距离、皮尔逊相关系数Jaccard 相关系数绝对值距离(或欧式距离)马氏距离聚类,常用的工具,Mahouthttp:/mahout.apache.org/ R语言1.薛毅, 陈立萍, 统计建模与R语言. 清华大学出版社, 2007.2.Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systemsJ. Computer, 2009 LibFMRendle S. Factorization machines

9、with libfmJ. ACM Transactions on Intelligent Systems and Technology (TIST), 2012, 3(3): 57. SVDFeatureChen T, Zhang W, Lu Q, et al. SVDFeature: a toolkit for feature-based collaborative filteringJ. The Journal of Machine Learning Research, 2012, 13(1): 3619-3622.,个人体会,推荐系统在信息超载时代会有越来越重要的应用,亚马逊通过引入推荐

10、系统提高其销售业绩,客户更希望使用有推荐功能的信息平台 推荐系统的理论方法很多,涉及领域多种多样,需要结合实际的应用背景 学术研究中很好的模型并不一定适用于工业应用,工业应用有明显的应用背景和特殊性,淘宝网目前的推荐系统的主要方法仍然是传统的统计分析(2014年) 推荐系统的方法需要综合应用,单一方法具有较大的弊端,很难起到较好效果 做好推荐必须对数据集中用户以及资源对象的表象特征、潜在特征有深入了解和分析,个人体会,银行业务的特点 (1)数据项和字段格式相对有限和固定,变化幅度较小,特别适合进行初步的统计分析与数据可视化; (2)与银行业务有交互的人群多种多样,但可以进行分类; (3)推荐系统的结果对新产生的业务要求较高的敏感性 银行业务中的推荐 (1)通过统计分析、数据可视化获取用户的数字特征和行为特征,深层理解用户和推荐对象的潜在特征; (2)根据用户数字特征和行为特征建立一定的模型或者规则,该模型同时需要考虑推荐的准确性、实时性、用户体验以及动态适应性(博弈论); (3)基于发现的规则和建立的模型为用户进行推荐,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用文档 > 工作总结

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报