1、报告人:冯沁原 导 师:代亚非 Q 2011.7.1 学 术 背景 2006.3-2008.9 虚假投票反作弊 2008.10-2010.10 个 性化商品推荐 工业背景 2010.11至今 设计了通 用推 荐服务平台 为 每日千万在线用户 提供实时音乐和广告推荐 音乐推 荐: 遇 见你最喜欢的那首 歌 广告推 荐: 激发用户的参与 推荐系统的终极目标 在恰当的时候 把恰当的物品 用恰当的方 式 提供给 恰当的 人 为什么那多么牛 人研究了十几年算法 推 荐系统 还 是不能令人满意呢 ? Lesson1: 决策不要拍脑袋 Say NO to HIPPO Highest Influencing
2、Persons Personal Opinion Say YES to TRUTH based on DATA 统计你的 河马 指数 =每天拍脑袋做决定的次数 Lesson2: 指标为用户服务 避免用户为指标服务 一个总目标 易懂、全面、实用 一批子目标 简 约、专注、 相关 Lesson3: 推荐 需要个性化 也许只需要做好分类 也许只需要最好的十个商品 用 户能够消化的商品数量有限 存 在一批绝大多数人都会喜欢的商品 即 使需要个性化 也许简单的 相似 性算法就足够了 Lesson4: 平均是陷阱 平均值 阈值比例 生活水平指标 北京人平均收入 收入大于 1000的北京人比例 推荐系统指标
3、 用户平均收藏的歌曲数 收藏歌曲超过 5首的用户比例 Lesson5: 精 与 惊 新用户 推 荐精品商品 老用户 持续给予惊喜 Lesson6: 六成是数据 数 据决定了 60%的推荐效果 宁缺勿滥 引导用 户主动反馈 过 滤用户虚假反馈 推荐效果的决定因素 数据因素 交互因素 算法因素 Lesson7: 三成是交互 交互体验决定了 30%的推荐效果 不让用户思考 简 约清晰的设计 引导用户思考 给 用户解 释 给用 户 20%的熟悉音乐 Lesson8: 速度就是质量 一秒钟更新一个用户口味 一分钟部署一个新算法 一 天验证一个新算法 一 周打一套补丁 三 个 月重构一次架构 初级程序员
4、高级程序员 算法工程师 算法执行时间 Lesson9: 关键人写关键算法 2秒 0.2秒 0.02秒 所有算 法线性化 关键算 法常数化 减 少内存触摸数 Lesson10: 小心典型的非典型用户 他们很可能是非典型用户 老 板 朋友 同 事 “热心用户” 你自 己! 他们的典型特征 自以为是典型用 户 Lesson10+1: 多走一步 可用与不可用 之间 好用与不好用 之 间 也许只差一步 不 懂产品的后台不是好测试 为什么那多么牛 人研究了十几年算法 推 荐系统 还 是不能令人满意呢 ? VANCL 科研诚品 爱思考,爱发 论 文; 不喜欢实际系 统 , 喜 欢模拟实 验; 不喜 欢复杂系统,喜 欢简约模型 ; 经常挑选实验结果; 偶尔伪 造实验结果; 不关心用户是否满意; 只关心评审人是否满意; 我是一名伪科研工作者 联系方式 Q W