ImageVerifierCode 换一换
格式:PPTX , 页数:10 ,大小:466.48KB ,
资源ID:339064      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-339064.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于l-bfgs逻辑回归的mpi并行化.pptx)为本站会员(无敌)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

基于l-bfgs逻辑回归的mpi并行化.pptx

1、Logistic Regression MPI并行化,刘小兵,Logistic回归模型(背景),Logistic分布: ()= 1 ( 1+ 极大似然估计MaxLikelihood:已知广告的展现和点击情况,求解模型参数,使得出现该状况的条件概率最大化广告点击率,Logistic Regression的训练问题是Unconstrained Optimization问题,Logistic Regression训练,基于梯度的优化方法: 最速下降法、共轭梯度法、牛顿法、拟牛顿法、BFGS、L-BFGS、OWLQNGradient & Function Evaluation 函数值:()= log(

2、1+ )+ log(1+ ) 梯度:()= Pr(=0| ,) + Pr(=1| ,) ,Step1: 初始点 0 ,给定终止误差 ,k=0Step2: 计算 ( , 满足条件|( )| 则收敛退出Step3: 根据计算搜索方向 的不同,分为:最速下降法、共轭梯度法、牛顿法、拟牛顿法、BFGS、L-BFGS的方法Step4: 确定步长,求t,使得:( + )= ( + ) ,计算 +1 = + 从Step2开始计算循环,训练的一般过程,并行化-Why MPI,LR并行化平台-Olympic,Olympic:更快(捷) 更高(效) 更强(大)“快捷”:使用方便,单机版Uni-processor和

3、并行版Multi-processor程序是同一个二进制的Binary,有或者没有MPI环境均可以使用,SVN checkout即可以使用,接口简单。在MPI的环境中,只要配好MPI环境即可立刻启动并行版Olympic_train“高效”:训练速度高效,大数据量支持 训练速度分钟级“强大”:处理数据的能力强大,Olympic_train支持并行多任务(集群非独占),即到即用。对Instance number和Feature number均不做限制(不管任何数据量,加机器即可以解决)。目前的机器数量下可以支持25亿的Instance number和10亿Feature number数目的高效训练。

4、加到500台机器可支持10000亿的曝光!“容灾”:支持完美的容灾,Olympic-架构,Parallel Batch Learning 1、Hybrid Application Model Parallel Gradient & Function Evaluation 数据&计算并行 2、Feature Shards/Instance Shards/Checkerboard 3、稳定 能达到最优的Empirical Loss的水平Parallel Online Learning 1、One Pass training data 高效 在线学习 收敛快 2、参数敏感 不容易达到最优Empirical Loss 3、不稳定 不易于监控,评测,Offline Evaluation,评测,PerformanceMulti-tasksScalabilityResources,评测,PerformanceMulti-tasksScalabilityResources,思考,Scaling技术应用Hessian Matrix Scaling集群机器数目达到W台网络通信问题容灾效率的考虑框架的思想:Hadoop + MPI(后续分享)Pregrel(Super-step graph-processing),

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报