1、常 用数据分 析方 法1 、 了 解数据、总体、样本的含义及随机抽样的一般方法; 2 、 掌 握排列图、因果分析图的作图方法和应用; 3 、 掌 握分层法、统计图表法的应用; 4 、 了 解直方图的原理、作用、作图方法及应用; 培训要求 培 训 主 要内容:统计分析 工具 对 帐 单 (检查表); 流 程图; 散 布图; 直 方图; 排 列图; 控 制图; 因 果 分 析图; 有 一 些 统计分 析工具可供书业公司用 来解决经营问题,它们 有助于 收 集 和 分析数 据以便为决策提供依据 。第 一部 数 据 分析概述1、什么是数据? 数据是对 图书销 售业务 全过程 记录 下来的、 可 以 以
2、鉴别 的符号 。数据 是销售 业务全 过 程 的 属性数 量、位 置及相 通关系 等等的 抽 象表示 。 数据表现 形式表现形式一 2006年客户销售分析报表 A客户 12月 1月 2月 3月 4月 5月 6月 7月 8月 B客户 99 98 98 100 101 108 108 114 110 C客户 67 70 73 74 75 77 82 80 80 D客户 87 84 88 85 79 85 91 92 93 E客户 148 143 143 145 137 141 136 134 139 F客户 75 76 76 77 79 78 82 78 78 G客户 87 86 92 100 1
3、03 100 97 89 91 H客户 132 134 141 142 160 154 150 136 137 合计 696 692 712 724 735 743 746 723 728 数据 列表数 据表现形 式二 248 269 224 245 381 595 255 254 237 211 171 166 247 422 303 320 412 420 667 470 366 410 403 330 343 477 0 100 200 300 400 500 600 700 800 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 描 述 性 分析
4、:数据分时段走势 、差距变化情况 以及 相应的时 间背 景 销 售 码洋趋势图数 据表现形 式三 31.0% 36.2% 43.4% 36.4% 64.3% 85.3% 57.5% 60.2% 53.5% 47.4% 39.5% 35.5% 33.0% 13.2% 21.1% 30.8% 36.1% 49.0% 67.0% 51.5% 47.3% 43.3% 37.4% 30.4% 25.5% 27.3% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 销 售 码洋结构比2、数据
5、分析目的 让数据说话; 行动的向导; 杜绝浪费; 提供决策的依据。3、数据的分类 按数据的性质一般可归纳为: 定性数据。往往用于频数 或频率 分析。 定量型数据。可以用数字 量化的 数值。 按数据的来源可分为: 人力资源数据; 财务数据; 营销数据; 采购数据; 仓储数据; 生产数据; 编辑数据。4、运用统计方法应遵循的原则 坚持用数据说话的基本观点。 有目的地收集数据。 掌握数据的来源。 认真整理数据。5 、统计分析 流 程 确定问题确定分析目标 采用科学方法收集数据 考察数据时效性整理数据 统计分析 出具分析报告,提出解决 意或建议5 、 数据 分析 误区 误区一: 展示元素不宜大于3 个
6、 0 100000 200000 300000 400000 500000 600000 700000 800000 900000 1000000 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月5、数据分析误区 误区二: 时 间序列数据最好使 用折线图,而不宜 使 用柱状图 等 0 100000 200000 300000 400000 500000 600000 700000 800000 900000 1000000 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月误区三: 研 究 用 数据最 好不使用 三维立体 图
7、 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 S1 S3 0 100000 200000 300000 400000 500000 600000 700000 800000 900000 1000000 5、数据分析误区误 区 四 :为 避免图表的欺骗性 ,图线最好占据2/3 至3/4 的高度(调整Y 轴刻度) 73.7% 68.1% 69.0% 72.9% 73.1% 75.6% 70.9% 71.9% 71.6% 69.0% 62.2% 67.1% 75.7% 83.5% 71.5% 75.4% 79.0% 75.8% 76.9% 74.5% 68
8、.9% 72.9% 77.3% 67.7% 75.5% 79.6% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 73.7% 68.1% 69.0% 72.9% 73.1% 75.6% 70.9% 71.9% 71.6% 69.0% 62.2% 67.1% 75.7% 83.5% 71.5% 75.4% 79.0% 75.8% 76.9% 74.5% 68.9% 72.9% 77.3% 67.7% 75.5% 79.6% 60% 65% 70% 75% 80% 85%
9、 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 5、数据分析误区第 二部 常 用 的数据分 析 方法总体: 总体、个 体 个体: 总 体 又 叫母体 ,是研究对象的全体。 出 版 商 一个批 次到货 的全 部都 可以称 为总体 。 构 成 总 体的基 本单位,称为个体。 每册书都是一 个 个体 。 来 货 检 验常用 抽样方法进行,即从来 货总件数中抽出一部分 件数,并 测 试 每 件的有 关册数是否够数的特性 数据,进行统计分析后 ,对总体 作 出 估 计和判 断。样本: 样本 样本又叫 子样 ,是从总体中抽出来一 部分个体的集合。 样 本 中 每个个
10、 体叫 样品,样本中所包 含样品数目称为样本大 小, 又叫 样 本量,常 用n表示。 对 样 本 的特性 进行测定,所得的数据 称为 样本值。 当 样 本 个数越 多时,分析结果越接近 总体的值,样本对总体 的代 表性就越 好 。抽样方法 学 用 的统计抽样方法主要有以下三种 随 机 抽样法 分 层 抽样法 系 统 抽样法 书 业 公 司抽样方法 随 机 抽样 指总体中每一个个 体都有 同等 可能 的机 会被抽 到。 这种 抽样 方法 事先不能考虑抽取 哪一个 样品 ,完 全用 偶然方 法抽 样, 常用 抽签 或利用随机数表来 抽取样 品以 保证 样品 代表性 。 抽样 当图书品种不多时 ,随
11、机 抽样 是一 种有 效的 抽样方法;抽样方法 分 层 抽样 分层抽样是先将总 体按照 研究 内容 密切 有关的 主要 因素 分类 或分 层,然后在各层中 按照随 机原 则抽 取样 本。分 层抽 样可 以减 少层 内差异,增加样本 的代表 性。 抽样 样本 当 到 货 产品较 多时,分层抽样是一种 有效的抽样方法;抽样方法 系 统 抽样 从总体中每隔K个个 体抽 取一 个个体 的抽 样方 法, 比值K 是总 体容 量N与样本容量n之比 ; 当出版商批量发货及产品特别多时 ,并且 易作某种次序的整理时, 系 统 抽 样比分 层抽样好; 1 , 2 , . K K+ 1 , K+2 , , 2K
12、2K + 1 , 2K+2 , , 3K 直到 N 为止 例,从具有1000 个 个体的 总体中 抽取50 个个体 。总 体 、 样本 、数据间的关系 总体 样本 结论 数据 抽样 分析 管 理 测 试数理整理 和统 计 抽 样 的 目的是 通过样本来反映总体。 在 书 业 公司经 营管理中,常常将测试 的样本数据,通过整理 加工, 找 出 它 们的特 性,从而推断总体的变 化规律、趋势和性质。 一 批 数 据的分 布情况,可以用中心倾 向及数据的分散程度来 表示, 表示中心倾向的有平均值、中位值 等,表 示数据分散程度的有方差、 标 准 偏 差、极 差等。 描 述 总 体数据 离散程度的参数
13、为方差 2 , 描 述 总体数据中心倾向 的 数为均值 。 若 利 用样本参数近似描述 总体状况时,可以利用样 本 方差S 2 近似 代替总体方差 2 ,利用样 本均值X 近似代替总体均值p。数理整理 和统 计 样 本 平均值 样 本 中位值 X = X 1 +X 2 +X 3 .+X n n 中位值是按照数据 大小顺 序排 列位 于中 间的数 值, 中位 值记 为X 若n为偶数,则取位 于中 间两 个数值 的平 均值 为中 位值;数理整理 和统 计 样 本 极差 样 本 方差和样本标准偏差 样本方差和样本标 准差就 是用 来度 量数 据波动 幅度 大小 的一 个重要 特性值。样本方差 是一组
14、 数据 中每 一个 数值与 平均 值之 差的 平方和 的平均值,通常记 为S 2 ;样 本方差 的平 方根S 称作样本 标准偏 差, 它 与样本方差一样, 是反映 一组 数据 分散 程度的 特性 值: 样本极差表示一组 数据分 布的 范围 ,是 指数据 中最 大值 与最 小值的 差: R = X max - X min检查表 检查项目 8月1日 8月2日 8月3日 . 8月19日 合计 报订 2 4 开单 10 13 拣货 2 8 返单 4 8 收货 1 2 合计 19 35 检查数 100 100 不良率 19 35 在书业公司日常管理中最强调的是事实管理 , 就是 要掌 握事实,要掌握事实
15、就必 须设计 检查表 收集数 据。 业 务 记录用检查表层别法 层 别 法是所有手法中最基本的概念,即将多种多样的 数 据 ,因应用目的的需要分类成不同的“类别”,使 之 方 便以后的分析; 公 司 数据仓库层别法 不良项目 8月1日 报订 2 开单 10 拣货 2 发货 4 返单 1 合计 19 检查数 100 不良率 19 用在检查表上 用在排列图上 0 2 4 6 8 10 12 2007年8月1日 报订 开单 拣货 发货 返单排 列 图(帕累拉图) 关 键 的少数 ,次要 的多数 。 通常所说的80/20 法 则。 针对问题所收集的数据按 其重要 性的顺 序,记 录在 帕累托分析表中。
16、 公司80% 的销售来 自于20% 教 辅图书 产品。排列图的 作用 公 司 要解决的问题很多,但从何入手呢? 事实上,大部分的问题,只要能找出 几个影响 较大的因素,并加以处置及控制,就 可解决问 题的80%以上。柏拉图是根据收集的数 据,以不 良原因、不良状况发生的现象,有系 统地加以 项目别分类,计算出各项目所产生的 数据(如 作业准确率、损失金额)及所占的比 例,再依 照大小顺序排列,再加上累积值的图 形产品销售排列 图 销售名次 产品名称 销售码洋 所占% 备注 合计排 列 图 的作 图方法步骤 将 用 于 排列 图所记 录的数 据进行 分类。 确 定 数 据记 录的时 间。 按 分
17、 类 项目 进行统 计。 计算累计 频 率 。 准 备 坐 标纸 ,画出 纵横坐 标。 按 频 数 大小 顺序作 直方图 。 按 累 计 比率 作排列 曲线。 记 载 排 列图 标题及 数据简 历。排列图: 例 1 如一公司由物流中心人员操作问题, 导致图书损耗。记录两季教辅销售期 所产生库存损耗不良情况数据,并分 别将不良项目归结为下表排列图: 例 2 物流中心由于操作问题导致图书损耗 断 数 印刷质量 污染排列图: 例 2 断数 污染 印刷质量排列图: 练习 序号 产品 损耗 占损耗比率(%) 累积比率(%) 1 A 130 66.7 66.8 2 B 35 17.9 84.7 3 C 1
18、0 5.1 89.8 4 D 8 4.1 93.9 5 其他 12 6.1 100 合计 195 100 上例中物流库存损耗项目 ,此损 耗为全 年损耗 码洋的 总 和,再将产品类别用柏拉 图法分 析如下 :排列图: 练习 序号 产品 损耗 占损耗总数比率(%) 累积比率(%) 1 A 130 66.7 2 B 35 17.9 84.6 3 C 10 5.1 89.7 4 D 8 4.1 93.8 5 其他 12 6.2 100 合计 195 100排列图: 练习 损 耗 50 100 150 200 比 率 66.7% 17.9% 5.1% 4.1% 6.1% % 20 40 60 80 1
19、00 A B C D 其他排列图的 应用 1 、 利 用排列图寻找图书损耗的 改善重点; 2 、 利 用排列图验证改善图书损 耗的效果; 之前 100% 之后 100% 实现的改善排列图的 应用 3 、 利 用排列图对图书损耗进行 分层研究; A B C因果图 因 果图 某 项 结 果之 形成,必定有其原因 ,应设法 利 用 图 解法 找出其原因来。因果图 库存损耗 采购报订 出版社发货 运输 搬运 在库保管 配货呆滞库存 客户 市场环境 库存管理 模式问题 仓储库存 管理方面 出版社问题 采购管理 问题 未作先进先出管制 未作库存管制 库存帐 不准 延迟交货 印刷错 误 无理性采购决策 未严
20、密按 照应采购 量 销售期已过 定量法 安全存量营销法 客户取消订 单 滞 库 图 书因果分 析因果图 运用因果 图有利 于找到 问题的 症结 所在,然 后对症 下药, 解 决 问题。 因果图 再经营 管理活 动中, 尤其是 在物流 作 业 中 、问题 分析中 有着广 泛的用 途。 库存损耗 人的因素 技术不佳 粗心 缺乏培训 无责任心对策表 对 策表 当利用鱼刺图确定了经营 问题产 生的主 要原因 后,有 必 要采取措 施去消 除这些 原因, 以达 到改进的 目的。 这时, 可以采用对策表的方法。 用以针对经营问题产生的 原因制 定对策 或措施 ,作为 实 施时的依据。 对 策 表的目的对策
21、表的 格式 1 操作者不能掌握 组织学习作业流程 物流作业流程 强货责任心 . 2 软件不稳定 做好日常维护 更换软件 3 来货不准确 及时与出版商沟通确认 4 发货不准确 更换物流人员 改拣货作业流程频数分布 表 频数分布表是一种把分散 和不规 则的数 据,整 理成一 个 能顺着其度量的尺度,清 楚地显 示出该 数据的 集中趋 势 和离散程度的一种统计方 法。频数分布 表 测定客户报订教材完全 解读100 次订单 教 材 完 全解读订货频数分布表频 数 分 布表 编制步骤 1 1 、从数据中找出最小 值S 和最 大值L 。 S = 11.45 L = 12.35频 数 分 布表 编制步骤 2
22、 2 、决定组数。 m = 1 + 3.3lgn 当 n = 100 时 m = 1 + 3.3 lg100 = 1 + 6.6 = 7.6 8频 数 分 布表 编制步骤 3 3 、计算组距。 组距 h = = 全距 组数 L - S m 组距 尽可能取为10、5 、1 、0.5 、0.1 、0.05 组距 h = = = 0.1125 0.1 12.35-11.45 8 0.9 8频 数 分 布表 编制步骤 4 4 、求界限值。 在划分界限时,必须明确 端点的 归属, 所以在 决 定组的界限值时,可以从 每一个 界限值 上加上 或 减去1/2 测量单 位。频 数 分 布表 编制步骤 5 5
23、、计算组中值。 各组的下界限值与上界限值的 平均值称为该组的组中值。频 数 分 布表 编制步骤 6 6 、统计频数。 落在各组中的数据的个数 称为频 数。频 数 分 布表 编制步骤 7 7 、列频数分布表。频数直方 图 以坐标横轴表示组距,坐 标纵轴 表示频 数,所 画出的 矩 形图称为频数直方图,简 称直方 图。 0 5 10 15 20 25 30 订 货 码洋 11.405 11.505 11.605 11.705 11.805 11.905 12.005 12.105 12.205 12.305 12.405 频数直 方 图 在销 售中应用 1 、判断分布类型 客 户 订货特 性值的
24、分布, 一般都 是服从 正态分 布或近 似 正 态 分布。 当客户 订货特 性值的 分布不 具有正 态性时 , 往 往 是公司 营销政 策不理 想,或 教辅供 应能力 不足。 因 而,由 客户 订货特 性值所 作的直 方图的 形状, 可以推 测 营 销 政策是 否稳定 ,或供 货是否 充足, 由此可 对客户 订 货 作 出初步 判断。 根据客 户订货 特性值 的频数 分布, 可 将 直 方图分 为正常 型直方 图和异 常型直 方图两 种类型 。正常型直 方图 看直方图时应着眼 于图形 的整 体形 状, 根据形 状判 断它 是正 常型还 是异常型。正常型 直方图 具有 “中 间高 ,两边 低,
25、左右 对称 ”的特 征,它的形状像“ 山”, 字。 因此 ,根 据客户 订货 特性 值的 频数分 布所画出来的直方 图是正 常型 时, 就可 初步判 断为 经营 过程 是稳定 的,或供货能力是 充足的 。不正常直 方图 孤岛型直 方 图 双峰型直 方 图 折齿型直 方 图 绝壁型直 方 图孤岛型直 方图 在主体直方图的左 侧或右 侧出 现孤 立的 小块, 像一 个孤 立的 小岛。 出现孤岛型直方图 ,说明 有特 殊事 件发 生。造 成原 因可 能是 一时供 货发生变化,或者 一段时 间内 出版 商断 故障, 或者 短时 间内 从第三 方进货等。所以, 只要找 出原 因, 就能 使直方 图恢 复
26、到 正常 型。双峰型直 方图 双峰型直方图是指 在直方 图中 有左 右两 个峰, 出现 双峰 型直 方图, 这是由于观测值来 自两个 总体 、两 种分 布,数 据混 在一 起。 往往是 由于将两季教辅销 售列示 在一 起所 造成 的。折齿型直 方图 折齿型直方图形状 凹凸相 隔, 象梳 子折 断齿一 样。 出现 折齿 型直方 图,多 数是 由于 备货不 合理 ,或 处理 数据 时分组 不适 当等 原因造 成。绝壁型直 方图 绝壁型直方图左右 不对称 ,并 且其 中一 侧像高 山绝 壁的 形状 ,当用 剔除了 客户 退货 特性值 数据 作直 方图 时, 往往会 出现 绝壁 型直方 图。 此外,亦
27、可能是操 作者的 工作 习惯 ,习 惯于偏 标准 下限 ,于 是出现 左边绝壁的直方图 。偏态型直 方图 某种原 因使 下( 上)限 受到 限制 时, 容易 发生“ 偏 左型 ” (偏右 型) 。平顶型直 方图 与双峰型类似,由 于多个 总体 、多 种分 布混在 一起 。直方图与 标准 比 较 对 于 正常型 直方图 ,将其 分布范 围B=S ,L (S 为一批 数 据 中 的最小 值,L 为一 批数据 中的最 大值) 与标 准范围 T=S L ,S u , S L 为 标 准下界限, S u 为 标 准上界限 ) 进行 比较,就 可以看 出订货 特性值 的分 布是否在 标准范 围内, 从 而
28、 可以了 解销售 过程是 否处于 所希望 的状态 。为了 方 便 , 可在直 方图上 标出标 准下界 限值和 标准上 界限值 。直 方 图 在标 准范围内的情况 当教辅供应特性值符合规定标准时,其对应的直方图,必定在标准范围之内。 符合规定的直方图大致有下面四种类型: T B S L ( S ) ( L ) S u T B S L ( S ) ( L ) S u T B S L ( S ) ( L ) S u T B S L ( S ) ( L ) S u直 方 图 在标 准范围内的情况 直方图的分布 范 围B 位于 标准范 围T 内 ,但 有余量; 直 方图的 分布中 心与标 准 中 心 近
29、 似 重 合,这 是理想 的直 方图。 此时, 销售处 于正常 管理状 态。 T B S L ( S ) ( L ) S u直 方 图 在标 准范围内的情况 直方图的分布 范 围B位于 标准 范围T 内,数 据变化 仍比较 集中, 但分布 中心偏 移 标 准 中 心 ,并且 直方图 的一 侧已达 到标准 界限, 此时状态稍有变 化, 产 品 就 可 能 超 出 标准, 出现销 量下 滑。因 此,需 要采取 措施, 使得分 布中心 与标 准中心重合。 T B S L ( S ) ( L ) S u T B S L ( S ) ( L ) S u 直 方 图 在标 准范围内的情况 直方图的分布 范
30、 围B没有 超出 标准范 围T, 但没有 余量。 此时分 布中心 稍有偏 移 便 会 出 现 跑单, 所以应 及时 采取措 施,缩 小订货 特性值 的分布 范围。 T B S L ( S ) ( L ) S u直 方 图 在标 准范围内的情况 客 户 订 货 特 性值的 分布非 常集 中,致 使直方 图的分 布范围B与标 准范围T之间 的 余 量 过 大 。此时 ,可对 客户 订货管 理等适 当放宽 要求, 从而降 低渠道 库存 积压 T B S L ( S ) S u ( L )直 方 图 超出 标准范围内的情况 客户订货特性 值 的分 布 中心 向左(或 向右 偏离标 准中心 ,致使 直方
31、图 分布范 围B 的下界限(上 界限) 超出 标准范 围T的 下界限(或上 界限) ,因而 在下界 限( 或 上 界限) 出现客 户后期 从第 三方进 货或者 由于订 数据不 退货害 怕库存 慎重 销售。 T B ( S ) S L ( L ) S u直 方 图 超出 标准范围内的情况 直方图的分布 范 围B超出 标准 范围T ,此时 ,在标 准上界 限和下 界限都 出现不 合 格 品 。 这 种情况 通常是 由于 产品销 售疲软 ,这时 ,应及 时采取 促销措 施, 降 低 分 布 的 标准差 。如果 属于 标准定 得不合 理,可 以放宽 标准范 围。 T B ( S ) S L S u (
32、 L )直 方 图 超出 标准范围内的情况 直方图的分布 范 围B大大 超出 标准范 围T, 此时已 出现市 场大面 积少货 ,必须 立 即分析 原因, 采取紧 急措 施;如 果营销 政策允 许改变 ,就重 新修订 营销 政策。 T B ( S ) S L S u ( L )直方图的 分层 比 较 教材解读 三基手册直方图的 缺点 0.09 0.08 0.07 0.06 0.01 波动图 直方图 时间直方图 (练习 ) 下 线 客户不同品种订货统计表直方图 (练习 ) 1 、从数据中找出最小 值S 和最 大值L 。 S = 14.2 L = 15.9 2 、决定组数。 m = 1 + 3.3l
33、gn = 6 3 、计算组距。 组距 h = 0.3 4 、求界限值。 下限值 S h/2 = 14.15 5 、计算组中值。 6 、统计频数。 7 、列频数分布表。直方图 (练习 )直方图 (练习 ) 0 2 4 6 8 10 12 14 16 18 X 14.2 14.5 14.8 15.1 15.4 15.7 16.0 频数频数多边 形 以坐标横轴表示组中值, 坐标纵轴表示频数, 所画出的 多边形图称为频数多 边图, 简称 多边图。多 边图的作法与直方图类似, 不同的只是多边图以组中值为横坐标, 频数为纵 坐标, 在坐 标平面上依 次标出各点的位置, 然后把相邻各点用直线段连接起来, 由此得到频数多边 形。 销售码洋 11.405 11.505 11.605 11.705 11.805 11.905 12.005 12.105 12.205 12.305 12.405 0 5 10 15 20 25 30 频数请大家参与讨论