1、2016运营 中的数据分析基础篇什么是数据分析?数据分析的误区数据分析的六大步骤十个有趣的数字案例CONTENTSONE什么是数据分析?定义数据分析是指用适当的统计分析方法,对收集来的大量数据进行分析,提取有用信息和形成结论,而对数据加以详细研究和概括总结的过程。 探索性数据分析侧重于在数据中探索新的特征,验证性数据分析侧重于验证之前假设的真伪性;探索性数据分析以及验证 性数据分析属于高级 分析方法,常见的分析方法有相关分析、因子分析、回归分析等。描述性数据分析属于初级分析方法,是我们工作中最常用的数据分析方法;类型作用“ 知错能改,善莫大焉 ” 可是错在哪里,数据分析告诉你。“ 运筹帷幄之中
2、,决胜千里之外 ” 怎么做好 “ 运筹 ” ,数据分析告诉你。“ 以往鉴来,未卜先知 ” 怎么发现历史的规律以预测未来,数据分析告诉你。 知乎 绡页作用数据分析的三大作用:现状分析、原因分析、预测 分析 案例 1: 草榴社区的运营现状和用户习惯 现状分析 案例 2: 从多个男友中挑选老公的评价体系 原因分析 案例 3: 分析女优数据 ,寻找下一位苍井 空 预测分析TWO数据 分析的六大步骤数据分析的第一步是什么?六大步骤明确分析目的数据收集数据处理数据分析数据展现报告撰写 评估产品 机会 :产品机会评估对后期产品设计及迭代都至关重要,甚至说决定了一个产品的未来和核心 理念。分析解决问题 :通过
3、 必要的数据试验才能追溯到问题源头,进而制定合理的解决方案,彻底解决问题。支持运营活动 :你这个产品功能上线后效果怎么样? A方案和 B方案哪个更好些呢?预测优化产品 :数据分析的结果可以预测未来发生什么,缩短迭代周期,精益求精。梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标 。明确分析目的数据收集数据库 第三方统计工具 统计年鉴或报告 市场调查数据埋点,就是在正常的功能逻辑中,预先添加统计代码,将自己需要的数据统计出来。 数据收集自己研发,开发时加入统计代码 ,并搭建自己的数据查询系统 。Tcclick串
4、接第三方统计工具 Google Analytics、AppsFlyer不同产品,不同目的,需要的支持数据不同,确定好数据指标后,选择适合自己公司的方式来收集相应数据 。数据埋点数据计算数据转化数据清洗Garbage In,Garbage Out!数据处理定义:数据处理是从 大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据 。万能工具: EXCELTips: 在做数据处理时 ,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。 数据分析数据分析 :用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形
5、成有效的结论 。数据挖掘 :侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。 常用指标1234离散趋势 :方差 、标准差、全距变化趋势:同比 、环比相对位置 :百分比 、四分位数、比率集中趋势 :平均数 、加权算术平均数、中位数、众数数据的描述纵向比较:指对同一事物在不同时间里的发展变化进行比较的方法 。对比分析法数据分析对比 分析法:将两个或两个以上的数据进行对比分析,分析其中的差异,从而揭示这些事物发展变化的规律和情况 。横向比较:指对同类 的不同对象在统一标准下进行比较的方法 。要注意事物的可比性。数据分析细分(逻辑树分析法)不断用更小的量化指标去细分一个大的指标
6、,从而达到定位问题的目的。成交额客单价成交价件单价 连带率人均成交数客户数新客户自然量 推广量老客户二次成交 多次成交数据分析漏斗分析法用来分析从 潜在用户到最终用户这个过程中用户数量的变化趋势,从而寻找到最佳的优化空间,这个方法被普遍用于产品各个关键流程的 分析中。浏览商品 100加入购物车 30生成订单 20完成支付 15完成交易 10数据分析AARRR模型Acquisition、 Activation、 Retention、 Revenue、 Refer,获取、激活、留存、收入和推荐。 数据分析AARRR模型能用图说明问题的就不用表格,能用表说明问题的就不用文字 。数据展现折线图 :按照
7、时间序列分析数据 的变化趋势时 使用。柱状图:指定一个分析轴进行数据大小的比较时使用。饼 图 :指定一个分析轴进 行所占比例的比较时 使用。散点图:描述两个变量相关关系时使用。1、要有一个 好的框架报告撰写最重要的:给谁看!123 43、每个 分析都有结论,而且结论一定要明确2、一定 要有解决方案和建议方案4、尽量图表化1、不要试图面面俱到,要有重点3、不要 回避 “ 不良结论 ”2、不要记叙 文,要议论文4、不要有猜测 性的结论THREE数据分析的误区分析 目的不明确,为了分析而分析缺乏行业、公司业务认知,分析结果偏离实际。数据必须和业务结合才有意义。盲目依赖数据,对数据中呈现的问题缺乏求证
8、忽略环境是动态变化的,数据分析的方法和标准一成不变。四大误区数据是客观的,但解读数据的人是主观的 。只有正确的认识数据,才能正确的利用数据FOUR十个有趣的数字案例案例一忽略沉默用户用户的迫切需求 产 品的核心需求粉丝:无条件的热爱一个产品 ,盲目地推崇产品的一切,认为他们热爱的产品是完美的。呐喊者:因为产品 使用中碰到问题而大声呐喊,他们会通过各种途径投诉, 给出一些意见反馈或建议。沉默的大多数 :如果满意,他们下次就会再来;如果不满意,他们就会默默地离开 。先因后果消失而消失因果关联错误,或忽略关键因素。 A和 B的数据高度相关,有人就片面认为 A影响了 B,或者 B影响了 A;但是,有时
9、候真实原因是 C同时影响了 A和 B,而 C被忽略掉了。 相关关系 因果关 系 某广告公司分析人员发现:每月广告投入越高的用户,越不容易流失,而广告投入低的用户群则很容易流失,从而得出结论: “ 高投入会降低客户流失率,建议销售引导客户提高首月广告投入,从而降低新客流失率 ” 。案例二2008案例三姚明的三分投篮命中率为 100% 实情:姚明只投了一个 三分球,科比投了 53个科比的三分投篮命中率为 32%在样本量足够时误差才会较小, 结论才会可靠当比尔 盖茨走进某个普通的酒吧,一瞬间,酒吧里面的所有人都变成亿万富翁。案例四平均数使用不当Tips:当数据 的分布极度不均匀时,看 “ 平均数 ” 不如看 “中位数 ” 和 “ 众数 ” 。 参加美国海军比生活在纽约市更容易保命?案例五不匹配的对比 Tips:对比分析时,不同变量必须是同类的或具有相同性质的, 而且必须是处于同一时间区间内的。