ImageVerifierCode 换一换
格式:PPT , 页数:16 ,大小:358.50KB ,
资源ID:1160469      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-1160469.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(阿里巴巴大数据竞赛介绍.ppt)为本站会员(无敌)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

阿里巴巴大数据竞赛介绍.ppt

1、相关介绍,ALIDATA DISCOVERY阿里巴巴大数据竞赛,刘晓中国科学院计算技术研究所2014.3.21,竞赛机制数据介绍评比机制,竞赛机制,阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。,竞赛机制,天池-大数据研究平台“平台、金融、数据”“数据分享平台”针对当前学术界面临的两个问题,一是缺少有价值的真实的商业数据;二是缺少具有强大功能的计算平台支持复杂的数据处理。阿里巴巴集团于2014年正式推出“天池”平台,“天池”平台基于阿里集团的海量数据离线处理服务ODPS,向学术界提供科研数据和开放数据处理服务。,竞

2、赛机制,ODPSODPS (Open Data Processing Service)阿里云开放数据处理服务,是阿里巴巴公司借助阿里云提供的大规模分布式数据处理服务。ODPS以REST API的形式,支持用户提交类SQL的查询语言,对海量数据进行处理。,竞赛机制,赛制安排,赛制安排,竞赛机制,奖项设置:Season 1 不设奖项,但是会从参赛队伍中选择较优者进入Season 2阶段比赛 Season 2 阶段奖项:一等奖:1支队伍,奖金贰拾万 二等奖:1支队伍,奖金伍万 三等奖:1支队伍,奖金贰万 (上述奖项以决赛答辩成绩的最终名次决定) 月星星奖:每期月度榜单排名Top10的参赛队成员都将获

3、得搭载云OS的手机一部(具体手机型号在公布榜单时公布) 优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书 总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年Season 3 线上阶段奖项:Season 2 阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season 2结束后公布细则),数据介绍,赛题介绍本赛题适用于season1 和

4、season 2的比赛,season 3 为线上赛(season 2 赛后公布题目)。 在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。,数据介绍,数据介绍天猫提供了884位用户对于9531种商品的操作类型,共提供了182881条记录。,用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。,数据介

5、绍,数据介绍天猫提供了884位用户对于9531种商品的操作类型,共提供了182881条记录。,用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。,数据介绍,数据介绍天猫提供了884位用户对于9531种商品的操作类型,共提供了182881条记录。,t_alibaba_data.csv,数据介绍,Season 1赛季数据1) 数据说明: 用户4种行为类型(Type)对应代码分别为:点击:0;购买:1;收藏:2;购物车:3 2) 提交评分方式: 参赛者将预测的用

6、户存入文本文件中,格式如下: user_id t brand_id , brand_id , brand_id n 上传的结果文件名字不限(20字以内),文件必须为txt格式。 如图:将预测结果文件上传至大赛官网结果提交入口即可。(提交结果入口在参赛者的个人中心),数据介绍,Season 2赛季数据1) 数据获取方式: 参赛者只能登陆阿里巴巴天池集群获取数据,且数据不能下载,所有数据分析,计算,提交评分都将在天池集群上完成。2) 数据说明: 提供的数据量,涉及千万级天猫用户,万级天猫品牌,时间跨度4个月的行为记录。,评比机制,评比机制准确率与召回率,准确率: 注: N 为参赛队预测的用户数 pBrandsi为对用户i 预测他(她)会购买的品牌列表个数 hitBrandsi对用户i预测的品牌列表与用户i真实购买的品牌交集的个数,评比机制,评比机制准确率与召回率,最后我们用F1-Score 来拟合准确率与召回率,并且大赛最终的比赛成绩排名以F1得分为准。,排行榜,现阶段排名,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报