收藏 分享(赏)

谁说菜鸟不懂数据分析(入门篇)-读书笔记.pdf

上传人:精品资料 文档编号:10173596 上传时间:2019-10-16 格式:PDF 页数:27 大小:1.44MB
下载 相关 举报
谁说菜鸟不懂数据分析(入门篇)-读书笔记.pdf_第1页
第1页 / 共27页
谁说菜鸟不懂数据分析(入门篇)-读书笔记.pdf_第2页
第2页 / 共27页
谁说菜鸟不懂数据分析(入门篇)-读书笔记.pdf_第3页
第3页 / 共27页
谁说菜鸟不懂数据分析(入门篇)-读书笔记.pdf_第4页
第4页 / 共27页
谁说菜鸟不懂数据分析(入门篇)-读书笔记.pdf_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、谁说菜鸟 不懂数据分析 张文 霖 刘夏璐 狄松 一、 简要说明 采用如何阅读一本书中的规则进行分析,不涉及主题阅读,按照主动阅读的顺序:从检视阅读到分析阅读进行。 二、 检视阅读 1. 有系统略读: 了解书的架构,适用于不知道想不想读,不知道有没有必要做分析阅读, 或者 时间有限。具体做法有: (一 ) 先看书名页,如果有序就先看序。了解书的主题,特别注意副标题,或者其他的相关说明,或作者写本书的特殊角度。 本书题目 是谁说菜鸟不懂数据分析 -入门篇,副标题是告诉你职场图表背后的故事 。 通过 前言 ,评论和内容 简介 可知,本书是基于 excel 的 各种实用技巧,加上基础性的数据分析概念,

2、以风趣的小说形式,为 初入 数据分析大门的人 解释 什么是数据分析,以及如何有效的数据分析。 (二 ) 研究目录页,对这本书的基本架构做概括性的理解。 本书分为 8 章 ,分别是关于数据分析的基本介绍, 以及 数据分析 的 整个流程,包括确定分析 目的 和思路、数据准备、 数据 处理、数据分析、数据展现和撰写报告 。 (三 ) 索引和 出版者的介绍 没有 ,略 去 。 (四 ) 挑几个和主题息息相关的篇章来看。 也可以 是感兴趣的章节。 略,经推荐 的书准备认真研究 。 (五 ) 快翻整本书。 尤其是 最后一页总结。 略, 只有每章总结,无 全书 总结 。 2. 粗浅的阅读:了解全书内容的第一

3、个步骤。 整体性的浏览全书。 三、 分析阅读 1. 第一阶段:找出一本书在谈些什么。 规则一:依照书本的种类与主题做分类。 论说类的作品,具体是实用性的。 规则二:用最简短的句子说出整本书在谈些什么。 入门级别 的 基于 excel 的数据分析 方法 和方法论 。 规则三:按照顺序与关系,列出全书的重要部分。将全书的纲要拟出来之后,再将各个部分的纲要也一一列出。 目录 (一 ) 数据分析的那些事儿 . 2 1. 什么是数据分析及作用: . 2 2. 数据分析六部曲: . 3 3. 数据分析三大误区: . 3 4. 数据分析师的要求: . 3 5. 常用术语和指标: . 3 6. 数据分析心法:

4、 . 4 (二 ) 结构为王 确定分析思路 . 4 (三 ) 无米难为巧妇 数据准备 . 7 1. 理解数据: . 7 2. 数据来源: . 7 (四 ) 数据处理 . 7 1. 何谓数据处理: . 7 2. 数据清洗 . 8 3. 数据加工 . 8 4. 数据抽样: . 9 (五 ) 工欲善其事必先利其器 数据分析 . 9 1. 数据分析方法 . 9 2. 数据分析工具 15 (六 ) 给数据量体裁衣 数据展现 15 1. 图表 15 2. 表格 16 3. 给图表换装 16 (七 ) 专业化生存 图标可以更美的 21 1. 别让图表犯错 21 2. 图表美化 23 3. 数据报告 26 (

5、一 ) 数据分析 的那些事儿 1. 什么是 数据分析 及 作用 : 数据分析 是 为了提取有用信息和 形成 结论,而对数据进行研究和 概括 总结的过程,一般分为描述性数据分析、探索性数据分析 和验证 性数据分析。 其中 ,探索性数据分析重在发现新的特征, 验证 性数据分析则是验证已有假设。 数据分析 的作用 是现状 分析、原因分析及预测分析。 2. 数据分析 六部曲: 明确 分析目的和思路 数据准备 数据处理 数据分析 数据呈现 撰写分析 报告 。 3. 数据 分析三大误区: 分析 目的不明确 , 缺乏业务知识,以为追求高级分析方法 4. 数据 分析师的要求: 职业 要求: 懂业务 、懂管理

6、(分析 框架和建议)、 懂分析 、 懂 工具、懂设计 职业 素质:态度严谨、好奇心强、逻辑清晰、擅长模仿 、勇于 创新 5. 常用 术语和指标: 名称 解释 平均数 一般指算数平均数,代表总体的一般水平,掩盖了总体内各单位的差异 绝对数 一定时间地点条件下 总体情况的综合指标或者数量增减变化的绝对数 相对数 =比较数值(比数) /基础数值(基数),两个有联系的指标对比计算而得到的数值,反应客观现象之间数量联系程度的综合指标 百分比 相对数的一种,百分数 百分点 不同时期以百分数形式表示的相对指标的变动幅度。变动幅度最好用百分点,比如“今年公司利润比去年提高了 10 个百分点”,而不是“ 10个

7、百分比” 频数 某个别数据出现的次数,绝对数 频率 个别数据出现次数占总次数的比值,相对数 比例 部分与总体的关系,反应总体的构成 比率 部分与部分的关系。比如,我国人口性别比,指的是每 100 名女性相对的男性数量 倍数 表示数量增长或者上升幅度的商。下降可以用百分比 番数 原来数量的 2 的 N 次方,翻一番是 2 倍 同比 与历史发展同时期比较,反应事物发展的相对情况 环比 与上一个统计时期,反应事物逐渐发展的情况 6. 数据 分析心法: 学习 :先了解,后深入;先记录,后记忆;先理论, 后 实践;先模仿,后 创新 方法 :先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手

8、分析 :先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议 (二 ) 结构为王 确定分析思路 数据分析方法论:跟数据分析相关的营销和管理理论,宏观指导数据分析 数据分析法:具体的数据分析方法,如对比分析等,微观指导数据分析 名称 适用范围 基本 要素 4P 营销理论 了解公司的整体运营情况 产品( product); 价格( price) 最高价取决于需求,最低价取决于成本,中间取决于竞争; 渠道( place); 促销( promotion) 促销四大要素(广告、宣传推广、人员推销、销售促进); 用户行为理论 用户行为分析 用户获取产品的各种行动:认知 熟悉 试用 使用 忠诚客户

9、 PEST 行业分析,宏观环境的分析,指影响一切行业和企业的各种宏观力量 政治( political) 社会制度,执政党性质以及政府的方针、法令 经济( economic) 宏观(国家总体情况)、微观(企业所在地或者服务区的情况) 社会( social) 文化水平(需求层次)、宗教信仰 /风俗习惯(禁止或者抵触某些活动)、价值观念(活动目的或者组织本身的认可)、审美观念(活动内容、方式及成果的态度) 技术( technology) 直接技术手段 ,技术领域的发展和政策 5W2H 用户行为研究或者业务专题分析的逻辑分析方法 5W 何因( why)、何事( what)、何人( who)、何时( w

10、hen)、何地( where)、 2H 如何做( how)、何价( how much) 逻辑树 业务问题专题分析 问题树,演绎树,分解树: 将问题的所有子问题分层罗列,从最高层开始,逐步向下扩展,要素化、框架化、关联化 5W2H Pest 逻辑树 4P 用户 行为分析 (三 ) 无米难为巧妇 数据准备 1. 理解 数据: 1) 字段 与记录 : 列 与 行,特征与特征的具体表现 2) 数据类型 : 字符和数据 3) 数据表 : 标题行 +数据;第一行是 字段名 ,不能重复 ; 第二行是数据 , 不允许出现空白行和空白列; 数据 表中无合并单元格;数据表与其他数据至少隔开一个空白行和列;一般用一

11、维表, 二维表用数据透视表 转化 2. 数据 来源 : 1) 导入 数据: 文本 导入 (确定 分隔符),网站导入 (可选择 自动更新) 2) 调查 问卷录入: 单选(录入 对应 数值 ),多选 (二分法 ),排序,开放性 编号 第 3 题 第7题 第 10 题 第 23 题 第 40 题 年 月 A B C D 第一重要 第二重要 第三重要 建议 增加培训费用 112 2001 9 2 1 0 1 0 3 4 1 (四 ) 数据 处理 1. 何谓 数据处理: 1) 三心二意 : 信心、 细心和平常心; 诚意 和合意 2) 数据 处理过程:数据清洗 (删除 重复、处理异常和 缺失 ),数据 加

12、工(提取 想要的信息) 根据 数据分析的目的,将数据处理成数据分析的要求样式。 2. 数据 清洗 1) 重复 数据: 函数 ( countif 对 满足条件的 计数 ) ,高级筛选 (高级 筛选 +选择不重复的项) ,数据透视表 (选择 编号到行,同时 到 汇总) ,删除重复 (菜单 、 countif 后排序删除 等 ) 2) 缺失 值: 可接受 的是 10%以下 查找 中的条件 定位 处理,一般有 4 种 处理方法, 样本 平均值代替 (典型 做法) ,删除,模型计算值代替, 缺失值 保留在分析时处理 定位条件配合ctrl+enter 3) 异常值 : 从 逻辑和业务上去检查, 用 if

13、函数检查错误,用 条件 格式标记错误 3. 数据加工 1) 数据 抽取:字段分列,截取某字段一部分的信息 ,根据 分隔符菜单操作、用 left和 right 函数 ;字段合并 ( concatenate、 &) ; 字段匹配,将几个数据表中的数据有效 匹配 ( vlookup) 。 2) 数据 计算: 简单 计算,通过加减乘除就能计算出来的; 函数 计算,常用的 如下 用途 函数 平均值 Average() 求和 Sum() 自动 输入日期 now()、 today() 日期年月日加减 Date(year(),month(),day() 日期 年月日间隔 Dateif(start,end,un

14、it) 3) 数据 分组:使用 vlookup 函数将不同 区间 的数据分组 , vlookup(数据 ,查找区域,列数,逻辑值 )。 4) 数据 转换:数据表的行列 互换 ,转置; 通过 选择性黏贴可以对数据进行简单的加减乘除; 多选题 录入数据方式之间 的 转换 (用 Isnumber 函数 和 hlookup 函数-按行查找 ) 。 4. 数据 抽样: 配合随机 函数, rank 函数对 随机 结果 进行排序防止重复, vlookup 函数 进行 数据抽样。 或者随机 函数 +f9 固定 +删除重复项。 (五 ) 工欲善其事必先利其器 数据 分析 1. 数据分析方法 数据分析作用 基本方

15、法 数据分析方法 现 状分析 对比 对比分析 平均分析 综合评价分析 原因分析 细分 分组分析 结构分析 交叉分析 杜邦分析 漏斗图分析 矩阵关联分析 聚类分析 预测分析 预测 回归分析 时间序列 决策树 神经网络 1) 对比分析法:横向(同一时期不同指标 ) , 纵向 (同一条件不同时期 ) 。 实践运用: 与目标 对比,不同时期对比, 同 级部门、 单位 、 地区 对比, 行业内 对比,活动 效果对比 。 目标 对比 不同 时期对比 各部门 /地区 对比 行业 内对比 活动 前后对比 注意事项:指标的口径、 计算 方法、计量单位要一致; 对比 的对象要有可比性; 对比 的指标类型一致。 2

16、) 分组分析法: 与 对比分析法结合, 重要 的是确定组数和组距, 可以 等距也可以不等距。 3) 结构分析法:部分占总体的比例, 最 常见的市场占有率 =某商品销售量 /该商品的市场总销售量。 4) 平均分析法:用平均数反映一般水平。 5) 交叉分析法: 二维表 6) 综合分析法: 步骤:确定综合指标体系 收集数据 ,对不同计量单位的指标数据标准化 确定 各指标权重 汇总 计算总分 根据 分值排序, 并 由此得出结论。 特点:指标不是顺次, 而是 同时评价;指标根据重要性加权; 评价 结果以分值体现。 权重确定法: 常见 的目标优化矩阵, 将 纵轴上的项目与横轴项目对比, 专家 投票表决,更

17、重要则填 1, 否则 0, 最后 每行数据相加的和排序。 人才评价 人品 动手能力 教育背景 合计 排序 人品 0 1 1 2 动手能力 1 1 2 1 教育背景 0 0 0 3 某指标权重 =( 重要性得分 /重要性总分 ) *100%, 其中 有零分则全部加 1 7) 杜邦分析 法 :各 财务指标之间的关系, 也可以 用于市场分析,用户 分析 等。 净资产收益率总资产收益率主营业务利润率净利润主营业务收入 全部成本营业成本其他利润 所得税主营业务收入总资产周转率主营业务收入 资产总额流动资产 长期资产权益系数 8) 漏斗图 分析法: 分析 业务流程, 结合 对比分析, 明白关键流程中各步骤

18、转化率的好坏,以及各种业务 的 受欢迎程度和重要程度。 如 网站转化率。 9) 矩阵 关联分析法 ; 根据事物的两个重要属性指标,做关联分析,按一定标准投放到四个 象限 中,先解决主要 矛盾 , 再 解决次要矛盾。 发展 矩阵 是 在此基础上,把 不同时期的数据绘制在同一矩阵上。 改进难易 矩阵 是 增加一位指标,用气泡的大小来体现。 2. 数据分析 工具 1) 数据 透视表:对 各字段 快速分类 汇总 ,交互式报表 ,鼠标 拖动字段位置即可。 2) 数据透视表小技巧: 值 汇总方式选百分比为百分比计算,选差异百分比为同比和环比计算; 选择 单元格创建组可以 对 日期、数值和文本型数据 进行分

19、组 (六 ) 给 数据量体裁衣 数据展现 1. 图表 1) 通过 关系选择 图表 成分(整体 的一部分) 一般 情况用饼图,也可以用条形、柱形 排序 ( 数据间 比较) 柱形图、 条形图、气泡图 、 帕累托图 时间序列 ( 走势 、趋势) 首先 折线图,其次考虑柱形图 频率 分布( 数据 频次) 柱形 、条形、折线,横轴只能按惯例由小到大 相关性 ( 数据 间关系) 柱形 、条形、气泡、散点 多重 数据比较 雷达图 2) 图表制作 五步法: 确定 表达目的 确定图标样式 选择数据作图 检查是否展现数据 检查是否表达观点。 2. 表格 1) 突出 显示单元格 : 用条件 格式 2) 项目 选取:

20、 针对对 原始数据经过计算的数据 3) 数据条 :查看某个单元格相对于其他单元格的值 , 数据条长度表示单元格中的值 , 越长越大。 4) 图集 :可以对数据注释,用临界值,一般 3-5 个 类别 , 比如绿色代表较高的箭头,黄色代表中间值,红色代表低值。特 别 适合企业运营指标发展态势。 5) 迷你图 :可以 塞到 一个单元格里的图 3. 给图表 换装 1) 平均 线图:加一 列 平均值,然后作图时 将 平均值的图标类型 更改为 折线即可。 2) 双 坐标图:添加次坐标轴,然后用 柱形 图显示 主坐标 数据,折线图展现次坐标数据 ; 或者通过 占位 数据,制作双柱图。 3) 竖形折线图: 也

21、叫 蛇形图, 展现 产品在消费者心中的评价,得到指标偏向。 一般 用消费者打分的形式, 越同意 靠右的观点, 数字 越大, 越同意 靠左的观点, 数字 越小。 4) 瀑布图: 也叫步行图、 阶梯图 , 多用于 企业的经营分析和财务分析, 表 示企业的成本构成、 变化 等 。 方法 是用占位的方法作图。 第 N 个占位数据大小 =总成本 -( 成本 1+成本 2+ ) 5) 帕累托图: 排列图 、 主次图 , 按照 发生频率的高低绘制的直方图 。 四个 注意点: 一, 柱形图按降序排列,折线图 是 累计百分比,在次坐标轴显示 二, 折线图 起始数值为 0%,并且位于第一个柱子的最左下角 三, 折

22、线图 第二个点位于柱形图第一个柱子的最右上角 四, 折线图 最后一个点为 100%,在整张图形的最右上角。 6) 旋风图 : 适用于 同一事物 在不同时期、不同条件下的变化,以及不同指标的对比。 可以通过设置次坐标轴或者做两个条形图的方式。 7) 人口 金字塔:类似旋风图,专门用来反映人口的过去、现在和未来。 8) 漏斗图 : 用 堆积条形图作的,需要用占位 数据 把实际的条形图挤到中间去。 第 N环节占位数据 =( 第 1环节 进入人数 -第 N环节进入人数) /2 第 N环节转化率 =第 N环节进入人数 /第 ( N-1) 环节 进入人 数 第 N环节总体转化率 =第 N环节进入人数 /第

23、 1环节 进入 人数 9) 矩阵图 /发展 矩阵图 /改进 难易矩阵图: 以象限 区分难易和效益的平衡,多通过将坐标轴移到 中间 ,作为象限分隔,然后画上 新的 坐标轴。 (七 ) 专业化 生存 图标可以 更美 的 1. 别让图表 犯错 1) 图表五脏俱全 :标题、图例、单位、脚注、资料来源 2) 要注意 的条条框框: 决定 做不做图标的唯一标准 能够有效表达信息 最好 一张图反应一个观点 只 选对的,不选复杂的 一句话 标题,将短语变成句子 图表 类型 注意 事项 饼图 数据 从 12点 钟方向开始,最重要的紧靠 12 点; 数据 项保持在 5项 以内; 不要 使用爆炸性的 “ 饼图分离 ”

24、 不要 使用图例 尽量 不要用标签连线 尽量 不要用 3D效果,如果用也厚度薄一 点 当 扇区使 颜色 填充时, 推荐 使用白色的 框线 复合 饼图 当 饼图 数据项 超过 5,将 多余的放入第二个饼图,构建符合饼图 , 通过设置第二绘图区来实现多余的个数 柱形图 同一 数据 序列 使用相同的颜色; 不要 使用倾斜的标签 ; 纵坐标 轴 从 0开始; 最好 添加数据 标签 ,让读者一眼看到具体数值 数据 标签字体为 arial 条形图 同一 数据 序列 使用相同的颜色; 不要 使用倾斜的标签 ; 纵坐标 轴 从 0开始; 最好 添加数据 标签 ,让读者一眼看到具体数值 数据 标签字体为 ari

25、al 折线图 折线 线形要相对粗些,最好比网格和坐标轴更突出 线条 一般不超过 5条 , 线条 过多可以分开作图 不要 用倾斜的标签 纵坐标轴 一般刻度从零开始 预测 值的线改为 虚线 离散 数据点,而且数量不多的话,设置 圆圈 数据标记,内是白色,外是折线 颜色 2. 图表美化 1) 三原则 : 简约 整洁( 亲近 原则,相关内容放一起) 对比( 突出 ,抓住重要信息) 2) 美化 技巧: 最大化数据水墨( 曲线 、条形、扇形 +,坐标轴、网格线、填充色 -) 找出 隐形的线,用来 对齐 图表的 数字格式,最好用 arial 突出 对比,改变颜色、直线、箭头和阴影 3) 常见 颜色搭配 红

26、、黄、 绿 不要滥用,一般 红色 重大问题,黄色 存在隐患,绿 色 发展良好。 4) 图表 妙招 创建 我的 图表 模板; F11+默认 快速制图 ; 添加标签小工具 ;修剪 超大 值 3. 数据 报告 1) 数据 报告 的 三大作用:展示分析结果,验证分析质量,为决策者提供参考依据 2) 数据报告 三种常见类型:专题分析,适合 word和 ppt,综合分析,适合 word和 ppt;日常数据通报、适合 word和 excel。 3) 数据报告 的组成:标题 (一眼 看懂、艺术性、加上作者、部门和时间) 、 目录、前言 (分析 背景和目的 、 分析思路)、正文、结论及建议 (结论 不是分析结果

27、的简单重复,而是要结合业务) 规则四:找出作者在问的问题,或者作者想要解决的问题。 数据分析 领域的菜鸟,如何能够浅显易懂的掌握职场 数据 分析的思路 。 2. 第二阶段,找出一本书到底在说什么?诠释一本书的内容。 规则五:诠释作者使用的关键字,与作者达成共识。 数据分析 、入门、 excel、数据分析六部曲 。 规则六:从最 重 要的句子中抓出作者的重要主旨。 数据 分析是为了提取 有用 信息和形成结论对数据加以详细研究和概括总结的过程,分为描述性 、探索性和 验证性 数据分析,三大作用是现状分析、原因分析和预测分析 。 数据 分析的 六部曲 是明确分析目的和思路,数据准备,数据处理,数据分

28、析,图表展现,报告撰写。 3. 第三阶段:像是沟通知识一样评论一 本书的规则。必须能够评论,提出批评,才算真正的完成了主动的阅读 本文 是数据分析的入门书籍,从最浅显 易懂 的例子和风趣的语言,为我们介绍了数据分析的主要思路和方法,其中以 excel 的使用作为线索,充分发掘了 excel 的强大功能 , 以及数据分析前期准备,中期分析和后期结论建议各方面的概览,让数据分析的入门选手能够真正先 理论 ,后实战,先模仿,后创新。 本 文采取总分的逻辑,不拘泥于刻板的公式,十足是数据分析的入门精品书籍,值得反复揣摩。 但 也陷于入门的水平,想要更好的进行数据分析,则需要在实际中演练,同时根据需要, 朝着 某一方向深入的学习。 木小青 2014.11于上海

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报