收藏 分享(赏)

SAS大数据分析解决方案手册.pdf

上传人:精品资料 文档编号:11180158 上传时间:2020-02-12 格式:PDF 页数:13 大小:2.39MB
下载 相关 举报
SAS大数据分析解决方案手册.pdf_第1页
第1页 / 共13页
SAS大数据分析解决方案手册.pdf_第2页
第2页 / 共13页
SAS大数据分析解决方案手册.pdf_第3页
第3页 / 共13页
SAS大数据分析解决方案手册.pdf_第4页
第4页 / 共13页
SAS大数据分析解决方案手册.pdf_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、释放大数据真正价值 SAS可视化分析解决方案简介 一图胜千言尤其是当您试图理解您的数据并从中获得洞察的时候。您可能需要 从成千上万甚至是数百万个变量中发现它们之间的关系,并判定这些关系的重要性 程度,此时可视化技术就显得尤为重要。 各种企业机构每天、每小时甚至每分钟都在产生大量的数据。每个人从管理 层、部门主管到呼叫中心的坐席、生产线上的员工都希望能从所收集的数据中 获得洞察,这些洞察有助于他们制定更好的决策、采取更智慧的行动、进行更有效 的运营。 如果您的数据已经超过数十亿条记录,要想从中判别出重要关系,您就需要借助于 先进分析技术和高性能的数据可视化技术。设想一下,如果您能够迅速(甚至是在

2、 片刻之间)完成复杂的分析,分析结果又能够很形象地展示出其中隐含的模式,还 能支持您进行查询和探索,那么企业结构中各个层级的人员就可以更快地制定出更 有效的决策。 而要想从数据中生成有意义的可视化,您就需要考虑采用某些方法和技术。数据的 大小以及变量的组成,是在选择图形时必须考虑到的重要因素。本文针对数据可视 化中的一些基本问题展开探讨,并给出解决这些问题的若干建议。 除此之外,大数据还为数据可视化带来了一系列挑战。本文同样针对这些挑战展开 探讨,并给出可行的解决方案。如果您正在分析处理大量的数据,面临的一个挑战 就是如何展示数据探索和分析的结果,考虑该采取何种方式才不会让分析结果淹没 在数据

3、的汪洋大海之中。您需要全新的方法来查看数据,这种方法可以直观地对分 析结果进行折叠和浓缩,同时又可以按照决策者习惯的查看方式来显示图形图表。 您可能还需要通过移动设备来快速访问分析结果,让用户可以很方便地实时探索他 们的数据。 SAS可视化分析是一套全新的商业智能解决方案,采用了智能的自动绘图技术,帮 助业务分析师和非技术背景的用户来可视化地分析数据。该技术能够基于您所选择 的数据来生成最合适的图形。SAS可视化分析还采用了高性能分析技术,以极快的速 度来探索海量数据,从中发现模式和趋势,识别出需要展开深入分析的切入点,并 将分析结果展现给信息消费者。SAS可视化分析的核心与灵魂就是SAS L

4、ASR分析服务 器,它为海量数据的分析运算带来了根本性的变革,使之成为可能并大大加快,借 助内存分析技术实现了空前的性能大幅提升。 将高性能分析和易用的数据探索界面相结合,让各种用户都可以生成图形并与之交 互,就能够更快地理解这些海量数据并从中获得价值。这也带来了空前的能力,让 您可以快速而充满信心地解决困难问题,改善业务绩效,降低风险。 关于SAS SAS可视化分析技术白皮书:从基础分析到大数据应用03-15 SAS可视化分析产品说明书16-19 研究报告之如何对大数据成功运用可视化技术20-23 SAS于1976年创建于美国, 是全球领先的商业分析软件与服务供应商, 也是目前全世界范围内商

5、业 智能市场上最大的独立厂商。 目前, SAS在56个国家和地区拥有近13,000名 员 工 。全 球 范 围 内 ,超 过 134个国家的60,000多家客户都在采用SAS解决方案, 其中包括 财富 全球500强企业前100家 企 业中的90家。 90年代初SAS的产品开始被中国用户所使用, 2006年SAS将北京设立为中国总部, 在上海和广州设有 分公司, 并在北京成立研发中心和用户服务支持中心。 SAS在华业务覆盖商业智能和分析软件及解 决方案、 智能领域专业咨询服务、 基于SAS解决方案的专业培训和技术支持等。 SAS中国团队凭借久 经考验的解决方案和全球37年丰富的实施经验, 结合本

6、地客户需求, 帮助各个行业的企业透过表 面 数 据 深 入 洞 察 企 业 绩 效 、客 户 、市 场 、风 险 等 方 面 的 情 况 ,帮 助 客 户 构 建 知 的 力 量 、抓 住 未 来 机 遇 (The Power to Know) 。 伴随着SAS在中国市场持之以恒的努力, SAS赢得了越来越多国内用户的信任和支持, 包括金融、 电 信 、政 府 、制 造 、能 源 、交 通 、环 保 、制 药 等 各 个 行 业 。随 着 市 场 的 不 断 发 展 ,SAS公司将进一步加大对 中国的投入, 把先进的技术和成熟的行业解决方案带给中国的客户。 SAS 可 视 化分析 : 从 基

7、础 分析 到 大 数 据 应 用 技术白皮书The Power To Know TM 2013 SAS 版权所有 5 4 图3:条形图最常用于对不同类别进行数量比较。 条形图可以配置为横向或纵向显 示,每个条的高度用于表示取值。 条形图 条形图最常用于对不同类别或分组进行数量比较(参见图3)。各个类别的取值用条形来 表示,可以配置为横向或纵向显示,每个条的高度用于表示取值。 如果条之间的差异明显,可以通过人眼清晰分辨的话,您就可以采用简单条形图。但 是,如果这些数值彼此都很接近,或者需要显示大量条形的时候,就很难通过条形图 来清晰比较了。为了突出视觉上的差异,可以使用不同颜色来绘制彩色条形图。

8、颜色 可用于表示特定的状态或取值范围。当大多数条形位于不同取值范围或状态时,很适 合采用彩色条形图。而如果所有的条形都位于相同取值范围或状态时,颜色就与取值 无关了,此时最好使用相同颜色或根本不用颜色。 条形图的另一种变形称之为渐进式条形图,或称为瀑布图。瀑布图可以形象化地展示 这种场景:经过一系列的操作或事务之后,某个指标的初始值是如何增加或减少的过 程。第一个条形代表初始取值,后续每个条形的起始值就是前一个条形的终止值。条 形的长度和方向代表着操作或事务的规模和类型(例如正向或反向)。最终的图形就表 示一种逐步的跌宕变化,显示出一系列操作或事务是如何将指标导向终止取值。 为您的数据生成最佳

9、可视化 以下这些基本概念有助于为您的数据生成最佳可视化: 理解您想进行可视化的数据,包括数据的大小和基数。 判断您想进行何种可视化以及希望传达何种信息。 了解您的读者以及他们是如何看待可视化信息。 采取最佳的可视化方法,简单清晰地向您的读者传达信息。 基础分析: 图表技术101 对于那些想知道该在何时使用何种图表类型的读者来说,下面是一份快速指南, 帮助您决定何种图表类型最适用于您的数据。 线图 线图用于显示单个变量和另一个变量之间的关系。常用于跟踪变量随时间的变化或 发展趋势(参见图1)。当您需要在同一时间段对多个项目进行比较时,线图也很有 用(参见图2)。堆叠线图可用于比较多个变量的发展趋

10、势或各自取值。 当您需要清晰展现单个变量或多个变量的变化,或者同时也需要展现其发展趋势或 变化率的时候,可以考虑采用线图。需要注意的是,并非仅仅因为您有一系列数据 点,您就一定要采用线图。更恰当的做法是,根据数据点的个数来决定最佳的可视 化方式。举例来说,假设您只有10个数据点需要显示,查看这10个数据点的最简单 做法,也许只需要在表格中按特定顺序列出它们即可。 当决定采用线图时,您应该自问是否想传达出这样的信息:数据点之间存在某种关 系。如果是这样的话,而且X轴的取值是连续的,那么一张简单的线图就可能是您所 需要的。 什么是数据基数? 基数(Cardinality)指的是某个变量不同 取值的

11、个数。高基数意味着不同取值 的高占比(例如银行账号,因为每个 银行账号都是唯一的)。低基数意味 着重复取值的高占比(例如性别)。 图1:线图显示了单个变量和另一个变量之间的关系。 图2:多分类线图用于在同一时间段对多个项目进行比较。SAS 可 视 化分析 : 从 基 础 分析 到 大 数 据 应 用 技术白皮书The Power To Know TM 2013 SAS 版权所有 7 6 气泡图散点图的变种 气泡图是散点图的一个变种,使用气泡来代替散点图中的标记。在气泡图中,每个气 泡代表一个观测。气泡的位置对应于两个坐标轴上的指标取值,气泡的大小则对应第 三个指标的取值。气泡图适用于展现具有几

12、十至几百种取值的数据集,或者是存在数 量级差异的取值。当您想要借助不同气泡大小来可视化展现特定数值时,可以采用气 泡图。当您希望展现数据随时间的变化时,动画气泡图是一种很好的方式。 饼图 关于饼图的价值和有效性,还存在很大的争议。饼图常用语对整体中的各个部分进行 比较。但是,这种展现方式可能很难解读,因为要通过肉眼来分辨扇区的面积和夹角 常常是很困难的。采用饼图来进行分析的另一个挑战是,要想比较彼此不相邻而面积 又比较接近的扇区的确很困难。出于这些原因,在数据分析中使用饼图的机会就比较 少了。 如果您坚持要用饼图,最好是在扇区数量比较少的情况下使用,同时使用文字和百分 比来进行描述,这样的饼图

13、才能真正有效果。由于提供了描述信息,用户就无需猜测 每个扇区的含义和大小。如果您选择使用饼图,每个扇区的大小应该代表其占总体的 百分比(参见图5)。 在设计报表或仪表盘的时候,为了更好地发挥饼图的功效,还要考虑它在报表中所占 的空间大小。由于饼图是圆形的,它实际上会占用更多的报表空间,所以不太适合放 在小屏幕或移动设备的仪表盘展现中。此时,采用其他图表类型可能会更好,因为它 们能够传达同样的信息,但所需的空间却更少(参见图6)。 最好是在扇区数量比较少的情况 下使用饼图,同时使用文字和百 分比来进行描述,这样的饼图才 能真正有效果。 图5:在数据可视化领域,饼图的使用一直充满争议。 图6:线图

14、和条形图都可以作为饼图的替代。 散点图 散点图(或称X-Y散点图)是一种二维图形,用于显示两组数据的关联变化。在散点图 中,每个标记(用符号表示,例如点、方框或加号)代表一个观测。标记所在的位置就 是每个观测的取值。散点图也支持分组。如果你指派的指标超过两个,就会生成散点 图矩阵。散点图矩阵式一系列散点图,其中的每个散点图用于显示每个可能成对的指 标,这些指标是您指派用于可视化的。 当您想检视X变量和Y变量之间的关系或相关性时,散点图是非常有用的。如果变量 之间彼此依赖的,或者互相产生一定的影响,我们称这些变量是相关的。例如,“利 润”和“收入”之间常常是相关的一般来说,如果收入增长了,那么利

15、润通常也 会增长(称之为正相关关系)。散点图是可视化展现数据间关系的一种很好的方法。 在散点图中,您也可以进行统计分析,包括相关分析和回归分析。相关分析能够帮助 您判别变量间的统计相关性。回归分析则能够帮助您绘制变量间的关系模型。 一旦您在散点图中将所有数据点画出来,您就能够可视化地判别数据点是否相关。散 点图能够让您获得一种知觉,了解数据是如何散布的,数据点之间是否紧密关联,并 能够快速识别出数据分布中所包含的模式(参见图4)。在数据点众多的情况下,散点图 很有用。而当数据点比较稀少的时候,采用条形图或者数据表来展现信息,可能会更 有效。 散点图能够让您获得一种知觉,了 解数据是如何散布的,

16、数据点之间 是否紧密关联。它还能够快速识别 出数据分布中所包含的模式。 图4:散点图是可视化展现数据间关系的一种很好的方法。SAS 可 视 化分析 : 从 基 础 分析 到 大 数 据 应 用 技术白皮书The Power To Know TM 2013 SAS 版权所有 9 8 数据量有可能是个大问题,因为传统的架构和软件难以有效处理海量数据,无法及 时产生分析结果,使得您不得不采取折衷的方法,对想要可视化的明细数据进行汇 总。当您在处理大数据时,即便是最普通的描述性统计也会难以计算,因为您不得 不面对变量数的限制、存储空间的限制、以及多种数据类型的支持问题。SAS对此给 出的一个解决方案是

17、内存分析引擎,它可以加速数据探索的进程,同时还提供了可 视化的界面(通过SAS可视化分析)来清晰展现分析结果。 例如,设想一下您的数据集中有数十亿条记录,希望基于其中两个指标变量来绘制 散点图,结果会怎么样?用户会详细查看散点图上的这数十亿个点吗?显然不会。 因为这么多点他根本看不过来。同时,可视化软件也很难及时有效地将这数十亿个 点绘制出来。一个可行的方法是通过对两个坐标轴上的数据进行分箱(对数据进行分 组),从而更有效地实现大数据的可视化(参见图7)。 箱图是另一个例子,显示了数据量是如何影响可视化的展示。箱图是包含了五种统计 量 (最小值、下四分位数、中位数、上四分位数、最大值)的图形,

18、用于描述数据分布 的汇总特征。下四分位数 (第25分位数) 用箱体下沿表示,上四分位数 (第75分位数) 用箱体上沿表示。中位数 (第50分位数) 用箱体中的横线表示。极值用从箱体上下沿向 外延伸的须线表示。 图7:SAS可视化分析提供了自动绘图功能和“这是什么意思”的气泡提示,帮助非技术用户来创建和理解 数据可视化。“这是什么意思”气泡提示(图中右下角)对分组箱图中显示的相关关系进行了解释,揭示 出“unit reliability”和“unit lifespan”两个变量间存在强线性关系。 当然,您可以选择其它图表类型来展现数据和分析结果。该如何选择,一般取决于 您需要展现的类别和指标(或

19、维度)的个数。通过参照以上介绍中的建议并理解这些示 例,您可以尝试不同的可视化方式并和您的读者进行测试,以确保能将正确的信息传 达给他们。 大数据的可视化 大数据为可视化带来了新的挑战,因为您不得不面对庞大的数据量、多种多样的数据 类型、以及快速的数据增长速度和更为短暂的分析时间窗口。在可视化中您还要考虑 到变量的基数。 关于“大数据”,最常见的一个定义是:大数据是这种数据,由于它庞大的数据量、 数据种类和增长速度,使得企业机构不得不考虑采用传统技术之外的新技术,才能展 开分析并进行有效决策。 数据量 (Volume): 即数据的大小。 数据种类 (Variety): 数据是结构化的、半结构化

20、的或者非结构化的。 增长速度 (Velocity): 数据增长的速度及变化的频率。 除了提供基础的图形和可视化技术,SAS可视化分析还采用了创新性的方法,来解决 大数据可视化中遇到的种种挑战。通过采用创新的内存分析技术,结合SAS的分析和 数据探索技术,SAS在数据分析和结果展现的核心基础之上提供了全新的技术。 庞大的数据量 在处理大数据时遇到的一个挑战是,该采取哪种方式才能有效展示数据探索和分析 的结果,使之更有意义,而不会淹没在大数据的汪洋大海之中。您需要全新的方法 来查看数据,这种方法可以直观地对分析结果进行折叠和浓缩,同时又可以按照决 策者习惯的查看方式来显示图形图表。您可能还需要通过

21、移动设备来快速访问分析 结果,让用户可以很方便地实时探索他们的数据。 在处理海量数据的时候,要想迅速确定最佳的可视化方式,可能是很困难的。自动 绘图 (Autocharting) 功能可以帮助您,它会检视全部您想要探索的数据,并根据数据 量和数据类型,自动帮您选择最合适的可视化技术。SAS可视化分析采用了智能化的 自动绘图技术,帮助业务分析师和非技术用户更方便地可视化他们的数据。借助这 项功能,用户可以随时定义分析层次,交互式地探索数据,采用多种方式来显示数 据,从而回答和解决特定的业务问题。所有这些操作都可以自助完成,无需依赖IT部 门的持续支持。 除此之外,SAS可视化分析还支持“这是什么

22、意思”的气泡提示,为您解读您正在使 用的复杂分析功能,识别并解释图形中的变量间关系(参见图7)。这项功能让数据分 析和数据可视化变得更加简便,甚至对于那些非技术人员或没有太多分析技能的人 员来说也很容易掌握。 在处理大数据时遇到的一个挑战 是,该采取哪种方式才能有效展 示数据探索和分析的结果,使之 更有意义,而不会淹没在大数据 的汪洋大海之中。SAS 可 视 化分析 : 从 基 础 分析 到 大 数 据 应 用 技术白皮书The Power To Know TM 2013 SAS 版权所有 11 10 可视化的速度 对于大数据来说,速度常常指的是企业内数据急剧增长的速度,是个令人头痛的问 题。

23、如何快速访问和处理这些数据变得非常关键。而从可视化的角度来说,速度意味 着您能够看到海量数据并进行可视化和探索的速度有多快。 相关矩阵能够处理大数据并快速给出结果,让您在数百万甚至数十亿条记录中快速判 断哪些变量是相关的。它同时还会显示这种关系的强弱程度。SAS可视化分析,让您 可以更简便地查看众多变量间的关系。您只需简单地选择一组变量,然后将它们拖拽 到可视化区域即可。智能的自动绘图功能会使用不同色块来绘制相关矩阵,让您可以 快速识别变量间的强关系和弱关系。深色的方块意味着强相关,而浅色的方块则意味 着弱相关。如果您将鼠标悬停在某个方块上,会显示相关性的汇总信息。您也可以双 击矩阵中的方块,

24、以获得进一步的详细信息。 下图中的示例是针对11亿条数据进行相关分析并将45个相关系数可视化出来(参见图 11)。借助后台强大的SAS LASR分析服务器,在2至6秒内就可以完成相关分析并显示图 形。以前在这么大的数据量上进行同样计算需要数个小时,而现在只需短短几秒。通 过使用箱图和相关矩阵,SAS可视化分析能够大大加快您的分析速度,因为分析建模 人员可以更快更有效地完成变量归约。 图11:在自动绘图的相关矩阵中,深色的方块意味着强相关,而浅色的方块则意味着弱相关。您也可以双击 方块,以获得进一步的详细信息。 相关矩阵能够处理大数据并快速 给出结果,让您在数百万甚至数 十亿条记录中快速判断哪些

25、变量 是相关的。它同时还会显示这种 关系的强弱程度。 一般来说,这种图形可以很好地展示大数据(参见图8)。箱图通常用于发现数据中的 异常值。一般来说,异常值的个数可能会占到数据量的1%到5%。对于传统大小的数 据集,查看这1%到5%的数据不算困难。但是,如果您正在处理的是大数据,查看1% 到5%的数据就是个不小的挑战。例如,设想您在分析十亿条数据,可能会包含一千 万条异常值而要将这一千万条数据进行可视化就相当困难。在图8中,有一个分 类变量和两个指标变量。要将异常值可视化,意味着需要绘制两千万个孤立点。此时 您可以将结果进行分箱处理,并绘制箱图,这样就可以查看数据的分布并观察异常 值所有这些都

26、是基于全部大数据进行计算而得。 不同的数据类型 (包括半结构化和非结构化数据) 数据类型的多样性也是一个挑战,因为对结构化数据进行可视化相当简单,但对于 半结构化数据或非结构化数据来说,则需要新的可视化技术。文字云 (word cloud) 可视化技术可以用在非结构化数据上,它提供了一种有趣的方式来显示高频词或低 频词(参见图9)。在文字云中,文字的大小代表这段文字在文本中出现的频率。对于 半结构化或非结构化数据来说,另一项可视化技术是网络图(network diagram),例 如,它可以显示出微博用户及其粉丝之间的关系(参见图10)。 注意:文字云和网络图这些可视化技术都已经在SAS的解决

27、方案中得到支持,包括 SAS文本挖掘和SAS社会媒体分析等。 尽管对结构化数据的可视化相当 简单,对半结构化或非结构化数 据来说,则需要新的可视化技 术,例如文字云或网络图。 图8:基于大数据的箱图可以快速在一个分类中压缩数据分布。 图10: 网络图可以显示出微博用户 及其粉丝之间的关系 图9:在文字云中,文字的大小代表这段文字在文本中出现的频率。SAS 可 视 化分析 : 从 基 础 分析 到 大 数 据 应 用 技术白皮书The Power To Know TM 2013 SAS 版权所有 13 12 大数据的过滤筛选 当您在处理大数据的时候,是否能快速简便地进行数据过滤是很重要的,但也可

28、能是 很困难的。设想一下,如果您只能查看部分数据(比如只能查看某个地区、某种产品 的数据) 会怎么样?SAS可视化分析提供了强大的数据过滤功能,让信息的精炼变得更 加简单。您只需简单地将某个变量添加到过滤器,或者直接选择已经显示的某个值, 就可以进行数据的选择或排除。 但是,如果过滤器意义不明或者导致数据发生未曾预料的偏斜,该怎么办?理解数据 分布并更好地进行过滤的一个解决方法是使用柱状图。柱状图能够可视化地显示数据 分布,为您针对特定变量进行数据过滤时提供线索,告诉您过滤后数据会如何变化。 使用柱状图可以节约您宝贵的时间,在您进行过滤之前就可以告诉您过滤后会带来什 么影响。与以前仅仅依赖试验

29、、经验或直觉的做法不同,使用决策树有助于您锁定要 关注的范围。 自动绘图让数据可视化变得更简单 SAS可视化分析提供了智能化的自动绘图功能,它能够基于您拖拽到可视化区域的数 据,来自动选择最合适的可视化方式。需要提醒的是,自动绘图功能所选择的可视化 也许和您想要的不同。此时,您可以手动指定可视化方式。无论如何,如果您是首次 探索一份新的数据,自动绘图功能还是很有益的,让您可以快速有效地查看数据。然 后您就可以按照自己的需要来切换到其它可视化方式。例如,通过自动绘图功能,如 果您只选择了一个指标变量,那么它就会自动绘制出该变量的数据分布(参见图14)。 如果您将第二个指标变量拖拽进来,那么它就会

30、自动绘制一份散 点图(图15)。 图15:通过自动绘图功能,拖拽两个指标变量进来会自动生成散点图。 图14:SAS可视化分析的自动绘图功能,使用条形图来显示单个指标变量的 数据分布。 SAS可视化分析提供了智能化的自 动绘图功能,它能够基于您拖拽 到可视化区域的数据,来自动选 择最合适的可视化方式。 如果您是首次探索一份新的数 据,自动绘图功能是很有益的, 让您可以快速有效地查看数据。 面对大数据,基数是个值得关注的问题,因为在大数据中的每个变量都可能存在为 数众多的不同取值。图12中的例子中仅仅显示了105个不同的产品描述。而在大数据 中,这种不同的取值可能会高达上百万个。正如您在图例中所看

31、到的,即便是仅仅显 示105个数据条,您也无法看到每条的标签,整个图形也失去了含义。设想一下如果 您要显示上百万个数据条会怎么样?根本不可能分辨清楚它们。 在SAS可视化分析中,采用了一种方法来处理这种高基数的问题条形图中提供了 概览图,您可以进行局部放大,同时也支持在整个概览图上滚动浏览。您可以控制放 大的比例。将图12和图13对比,很明显可以看出图13能够更清晰地显示信息。 图12:基于大数据的高基数条形图很可能是难以解读的。 图13:增加了概览的条形图能够更清晰地显示大数据上的高基数信息。您可以很方便地在整个概览图上滚动 浏览。SAS 可 视 化分析 : 从 基 础 分析 到 大 数 据

32、 应 用 技术白皮书The Power To Know TM 2013 SAS 版权所有 15 14 结论 对您的数据进行可视化,既有趣也充满挑战。如果您正在处理大数据,与查看包含 众多行列的大表相比,使用可视化要更容易理解这些信息。 然而,由于存在众多炫目的可视化方式可供选择,您在展现信息时可能会使用了错 误的可视化方式。在某些情况下,针对特定的数据,您应该选择特定的可视化方 式。有时候您的读者还可能会要求您采用指定的可视化方式,此时,向读者展示另 一种可视化方式,它可能会更清晰有效地传递信息,而这种信息才是真正需要从数 据中理解到的。 在理解数据及其组成、想通过视觉向读者传递何种信息、以及

33、他们会如何查看这些 图表的基础上,您可以选择最合适的可视化方式。类似SAS可视化分析之类的软件可 以为您提供最好、最快的可视化结果。 针对数十亿条记录的数据进行分析,已经成为现实业务中的实际情况,SAS也已经认 识到了这一点。SAS可视化分析让您可以探索您全部的数据,使用可视化技术和业界 领先的分析技术。可视化技术诸如箱图和相关矩阵等,可以帮助您快速理解数据中 的组成与关系。 借助SAS可视化分析,大量的用户 (甚至是那些分析能力和技术水平不高的用户) 都 可以通过Web浏览器或移动设备,快速查看报表并进行交互操作,而与此同时IT部门 只需维护管理底层的数据和安全。由此带来的好处是:加快您的分

34、析速度,让您能 够进行更多的分析,使用更多的数据甚至是为达到最佳的分析结果而使用全部 的数据。通过使用所有可能的数据,用户可以快速查看各种可能情况、制定更精确 的决策、并更快地获得成功。 针对数十亿条记录的数据进行分 析,已经成为现实业务中的实际 情况,SAS也已经认识到了这一 点。SAS可视化分析让您可以探 索您全部的数据,使用可视化技 术和业界领先的分析技术。 对您的数据进行可视化,既有趣 也充满挑战。如果您正在处理大 数据,与查看包含众多行列的大 表相比,使用可视化要更容易理 解这些信息。 类别数据可分为以下三种:标准型、日期型或地理位置型。如果是标准型的类别数 据,会自动可视化为数据的

35、频数(参见图16)。如果是日期型的类别数据,则需要同时 选择一个指标变量,并以线图的方式可视化(参见图1和图2)。如果是地理位置型的类 别数据,则会自动可视化为地图(参见图17)。 SAS可视化分析的自动绘图功能,会根据数据的基数自动调整可视化的方式。以图18 中的可视化为例,“产品描述”变量的基数为105。自动绘图功能检视了该变量的基 数,发现这个基数太大而无法有效显示,于是就自动提供了概览图以方便查看。概 览图是一个选项,您可以按照需要来决定打开或者关闭。图16:如果是标准型的类别数据,SAS可视化分析会展现为数据的频数。 图17:如果是地理位置型的类别数据,SAS可视化分析会自动可视化为

36、地图叠加 频数图。 图18:自动绘图功能检视了该变量的基数,发现这个基数太大而无法有效显示,于是就 自动提供了概览图以方便查看,您可以按照需要来决定打开或者关闭概览图。SAS 可视化分析 SAS 产品说明书The Power To Know TM 2013 SAS 版权所有 17 16 SAS 可视化分析 使用高性能、内存分析等功能对大数据展开可视化探索, 更快获得 精确洞察,并将结果发布到Web和移动设备上。 今天,企业组织正在收集庞大的数据,但传 统的架构和现有的基础设施却不具备相应的 能力和容量,无法及时对大数据进行快速的 分析处理。 并且,对数据访问、即席分析和一次性报表 的需求在持续

37、增长,给IT部门带来沉重的负 担。由于现有技术的处理时间太长,或者根 本不可能生成决策者所需要的报表并快速解 决关键的问题,这令决策者们非常沮丧。而 且,他们还想通过iPad或其它移动设备终端来 访问他们需要的信息。 SAS可视化分析使用了内存分析技术和专用硬 件,为所有类型的用户提高了可视化探索大 数据的能力。面对数十亿条 的数据记录,在 几分钟或几秒钟内就能完成相关的分析,获 得有价值的洞察,并通过Web报表或移动设 备快速提交结果。 通过大数据探索技术和可用的分析,提高 所有用户进行决策制定的能力。SAS可视化 分析让不同类型的用户都能够对其所有数 据进行快速彻底的探索。而无需对数据进

38、行划分子集或抽取样本。易于使用的交互 式Web界面,让更多的人包括非专业技术 人员能够进行分析,获取新的洞察。用户 将能够查看更多选择,做出更精确的决 定,比以前更快地取得成功。 充分发挥分析人才的贡献,更快解决 复杂的 问题。SAS可视化分析能够极快地给出分析 结果,提高您的数据发现和探索能力,让 您更好更专注地进行分析。聪明的分析人 员能够从大量的数据中发现和确定机遇, 敏捷地进行更深入的调查。 改善信息分享与合作。大量的用户,包括 那些仅具备有限分析技能的用户,都可以 通过Web、PDF文件或 iPad等移动设备,快 速地浏览报表和图表并进行交互操作。与 此同时,IT部门可以保持对基础数

39、据库和安 全的控制。SAS可视化分析在正确的时间向 正确的人员提供正确的信息,提高企业组 织的生产效率和知识水平。 给业务用户提供了新的方式来访问所需信 息,解脱了IT人员的负担。将 IT人员从业务 部门无穷无尽的要求中解脱出来。业务用 户们会要求访问不同的数据量、不同的数 据视图、即席的报表以及一次性的信息要 求等等。 SAS可视化分析能够让IT人员轻松 地 为多个用户载入并准备好数据。一旦 数 据载入并准备好,业务用户就可以自行灵 活地探索数据,创建报表和分 享信息。 按照您的需要和节奏来不断成长。SAS可视 化分析提供了基于通用硬件的基础结构, 具有高度的可扩展性,支持不断增长的访 问更

40、多数据的需求。它采取了自下而上的 设计,支持与Hadoop的整合,以便支持数 据库的优化和扩展能力。 主要优点 SAS可视化分析可以做什么? SAS可视化分析,通过彻底探索分 析您的所有数据,从海量数据中获 取更深入的分析洞察。您无需对数 据划分子集或抽样。SAS可视化分 析的高性能让您充分利用您的大数 据资产,比以往更快速地获得更精 确的洞察力。 SAS可视化分析为什么重要? 它支持许多用户同时探索海量数据 的能力,再结合SAS软件强大的高 性能分析技术,给企业组织提供了 前所未有的方式去深入了解大数 据,揭示出您意想不到的洞察,更 加快速地解决复杂问题,确定更新 更好的行动策略。此外,SA

41、S可视 化分析还支持您通过Web和移动终 端设备,通过报表和KPI(关键业务 指标)的方式,来显示分享从大数 据中发现的信息。 SAS可视化分析为谁而设计? SAS视化分析为您企业组织内所有 进行数据发现和探索的人员提供 支 持,包括决策人员、分析人员、统 计人员和数据科学家。它还为IT人 员提供了一种简单的方法,来保 护 和管理数据和系统,确保它们对每 个人来说都是运行正常和安全 的。 产品概述 SAS可视化分析将高性能分析和非常易 于使用的可视化探索界面结合起来,让 企业组织能够从大规模的海量数据中, 比以往更快地取得价值。由此创造出前 所未有的机会,让企业组织可以快速自 信地解决以前难以

42、解决的问题,提高业 务绩效并减少风险。 高性能 SAS LASR TM 分析服务器 SAS LASR 分析服务器为SAS可视化分析 解决方案提供了基础,具有改变游戏规 则的能力,大大加速了分析计算处理。 由于具有内存分析能力,SAS可视化分 析提供了极快的大规模数据处理能力, 打破了以往的思维模式。而且,它是为 Hadoop整合而特别定制的,让企业组织 可以最大限度地利用大数据存储系统和 并行处理环境。 适合IT部门的环境和数据管理 SAS可视化分析帮助多种类型的用户提 高了分析能力,借助其易于使用的管 理工具, IT人员可以设置统一的工作环 境,让业务人员、数据科学家和信息消 费者们在相同的

43、应用环境下,进行他们 各自的工作。IT人员和数据架构师能够 轻松地载入并准备好数据,供多个用户 使用,将数据结构转换为所有人都能理 解的格式,同时以一致的方式来定义和 应用业务规则。通过控制哪些数据可以 被访问和检索,IT人员可以在不影响用 户的生产效率和所需灵活性的情况下, 保持对数据的掌控。一旦数据被载入并 准备好后,用户可以在需要时随时对数 据进行探索和查询。IT人员再无需疲于 应付无穷无尽的业务需要,去不断生成 那些数据新视图和一次性的报表。 可视化数据探索 在IT人员从数据源中将数据载入到SAS LASR分析服务器内之后,SAS可视化分 析就可以有力地帮助所有类型的用户 可视化交互式

44、地探索数据,获得洞察并 发现模式和趋势,以便展开进一步的分 析。这种基于Web的交互式探索分析应 用,可以帮助用户包括那些缺乏专 业分析能力的用户,拓展他们使用分析 技术的能力,获得更为精确的洞察。 非技术型用户将发现,通过从侧工具栏 或动态过滤分组数据项中进行选择,可 以轻松地创建和修改查询。其它功能如 拖拽和自动生成图表等,也拓宽了用户 理解数据获得分析洞察的能力。自动图 表功能,会自动选择最适合数据类型的 图表。“这是什么意思”的气球提示, 以一种让每个人都能切实理解数据的方 式,对复杂的分析功能和数据之间的相 互关系做出了解释。并且,聪明的分析 用户能够从海量的数据中,更快地看出 趋势

45、,更容易地发现数据的意义。这样, 当为了缩小范围以便展开进一步分析 时,您就能够消除每天那些反复尝试的 烦琐过程。对于每个人来说,您可以从 大量有吸引力的图表中进行选择,用来 呈现结果,如动态气泡图等,这都有助 于快速确定新的洞察。 图1: 通过SAS可视化分析,各种类型的用户可以轻松地以前所未有的方式探索海量数据, 理解这些数据并快速发现新的模式 和趋势。SAS 可视化分析 SAS 产品说明书The Power To Know TM 2013 SAS 版权所有 19 18 可用的自助式分析 借助采用内存计算技术的 SAS LASR 分 析服务器,可轻易征服和分析大型数据 源。解决方案针对具有

46、不同技术水平的 人员定制了不同的特性,让尽可能多的 各种类型用户,有能力自己探索数据, 而无需学习新的技术或是严重依赖IT部 门的支持。探索和定位超多变量之间的 相关性,也变得非常容易。您可以自己 动手建立层次结构,而无需不断地麻烦 IT人员的帮助。您可以轻易地在层次中 进行上卷下钻,并在任意水平进行切片 和切块。这种解决方案可以真正帮助到 分析人员,以更快的速度探索更多的数 据,并且可以让非技术型用户免受复杂 数据结构问题的困扰。用户们可以轻松 地在任何水平上,对数据进行交互式的 探索分析。 基于Web的报表开发和分发 SAS可视化分析为不同技术水平的用户 提供了不同的报表开发功能。专业小组

47、 或者业务用户可以在IT部门确定的范围 内开发报表。丰富的展现布局,让报表 开发变得更加快捷。通过一套完备的图 形化数据展现选项,用户能够在报表中 创建并轻松引用图表和图形。轻松地设 计和创建业务图表,应用公司设计规 范,然后将结果发布到Web查看器或iPad 上。 查看报表 大量用户都可以通过Web和iPad上的 PDF文件,快速打开、查看报表并进行 交互。(随后发布的版本会将这项功能 应用到其它移动设备上)。高级分析人 员能够以多视角和多种交互方式来查看 阅读大量的数据。用户可以充分检视所 有的因素。 集中式的用户集线器 SAS可视化分析集线器(Hub)是所有SAS 可视化分析应用的主页,

48、也是发出所有 命令的控制台。它提供了集中式的登录 功能,让用户可以查看和打开最近访问 的内容,添加他们自己的收藏夹,使用 类似于Google的搜索功能去搜索他们 有权访问的内容。 主要特点 高性能的 SAS LASRTM 分析服务器 针对分布式计算环境进行优化,可以充分利用多个节点的并行处理功能,从而 创建出一个SAS超级计算环境。 自下而上的Hadoop整合设计,以便支持性能优化和扩展能力。 适合IT部门的环境和数据管理 企业用户的身份认证和访问授权,在SAS可视化分析的所有组件持续存在,支 持数据管控和IT政策的执行。 提供给内存计算服务器的数据,是基于数据量、要求的更新频率和扩展要求而

49、确定的。 提供了单一的Web界面,以便您管理SAS企业信息资产,包括用户、服务器和数 据等。 可视化数据探索 为各种类型的用户提供基于Web的交互式数据探索功能。 自动图表生成功能。基于分析中所选择的数据项,SAS可视化分析能自动地选 择最适合选定数据类型的图表: 适合单个指标的频数图表,适合两个指标的散点 图,适合三个指标的气泡图等等。 地图视图提供了对地理空间数据的快速了解。 “这是什么意思”功能,自动识别和解释变量之间的关系。 为内存计算服务器数据源提供了探索功能。 可选择多种图形外观,适用于三维展示和灯光效果。 提供引人注目的可视化元素,包括箱图,热力图,气泡图等等。 开关功能让您可以显示网格线,方便调节坐标轴,优化视觉效果。通过从侧工 具栏或动态过滤分组数据项中进行选择,可以轻松地创建和修改查询。 一个总览缩放条,让您能够可视化地选取大数据集(大量记录)的某一子集。 可视化的描述统计,如最小值、最大值和平均值,让您对特定指标获得总体的 认识。 可用的

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报