1、大数据环境下的管理信息系统发展研究 杨丽彬 李海林 张飞波 华侨大学信息管理系 华侨大学现代应用统计与大数据研究中心 摘 要: 大数据时代的到来给管理信息系统带来了一定的冲击和挑战, 因此有必要研究大数据对现代管理信息系统的作用及影响, 使得管理信息系统的性能和社会服务作用得到进一步提升。首先从数据的内涵与特征来理解大数据的概念, 接着从数据处理过程的角度来讲述大数据对管理信息系统业务流程的变化和影响, 同时, 从管理信息系统的构成来解析大数据对于管理信息系统的推动与发展作用。最后, 针对基于大数据环境下的信息安全和信息人才短缺等问题进行了探讨, 并提出了相关的解决方案。关键词: 大数据; 管
2、理信息系统; 数据挖掘; 信息处理; 作者简介:杨丽彬 (1982-) , 女, 华侨大学信息管理系讲师, 主要研究方向为数据分析与知识管理。作者简介:李海林 (1982-) , 男, 博士, 华侨大学信息管理系副教授、硕士生导师, 主要研究方向为数据挖掘与决策支持。作者简介:张飞波 (1993-) , 女, 华侨大学信息管理系本科在读, 主要研究方向为管理信息系统和数据分析。收稿日期:2015-09-03基金:国家自然科学基金资助项目 (No.61300139) Research on development of management information system in big d
3、ata environmentYANG Libin LI Hailin ZHANG Feibo Department of Information Management, Huaqiao University; Abstract: The age of big data brought the management information system some shocks and challenges. So it was necessary to investigate the effects and impacts of the big data for management info
4、rmation system, which made the performance and social service of management information system more powerful. The connotation and features were given in advance to understand the conception of big data and the impacts of big data for business process of management information system were illustrated
5、. Meanwhile, the promoting functions of big data for management information system were analyzed from its constitution Finally, some problems including information security and talent shortage were discussed in the big data environment, and some solutions for them were also proposed.Keyword: big dat
6、a; management information system; data mining; information process; Received: 2015-09-031 引言近年来, 信息技术迅猛发展, 尤其是以互联网、物联网、信息获取技术、社交网络等为代表的技术发展日新月异, 促使手机、平板电脑、PC 等各式各样的信息传感器随处可见, 虚拟网络快速发展, 现实世界快速虚拟化, 数据的来源及其数量正以前所未有的速度增长。根据市场研究公司 IDC2012 年 12 月发布的数字宇宙研究报告 (Digital Universe) 显示, 2012 年全球数据总量达到2.8 ZB (相当于
7、 2 800 亿 GB) , 预计到 2020 年全球数据总量将会超出预期, 达到 40 ZB (相当于 40 000 亿 GB) , 若以现有的蓝光光盘为计量标准, 那么40 ZB 的数据全部存入蓝光光盘, 所需要的光盘总重量将达到 424 艘尼米兹号航母的总重量。从现在到 2020 年, 基本上每两年数据量就会翻一番1。而这些数据约 80%是非结构化或半结构化类型的, 甚至更有一部分是不断变化的流数据。因此, 数据的爆炸性增长态势以及其数据构成特点使得人们进入了“大数据 (big data) ”时代。如今, IBM、EMC、Oracle、Intel 等跨国 IT 界巨头纷纷进军大数据行列,
8、 发布自己的大数据战略以及产品。大数据不单单是在 IT 行业引起大量热烈关注, 各个国家对其也有很高的重视, 有些甚至提高到战略发展的高度。比如, 2012 年3 月 29 日, 美国奥巴马政府就公布了“大数据研发计划 (big data research and development initiative) ”;2013 年 8 月 2 号, 澳大利亚政府信息管理办公室 (AGIM O) 发布公共服务大数据战略, 提出了指导大数据发展的六大原则和实现目标拟采取的 6 项举措;2013 年 8 月 30 日, 日本总务省公布2014 年的任务和拟采取的重要信息化措施, 其中就包括推进 ICT
9、 增长战略, 通过促进大数据和开放数据的利用来实现经济复苏;2013 年 10 月 31 日, 英国商务、创新和技能部发布英国数据能力战略, 旨在使英国成为从数据中提取见解和价值的世界领导者。学术界更是呈现百家争鸣的热况, 就中国而言, 已经分别于 2011 年、2012 年和 2013 年的 7 月举办了 3 次大数据世界论坛 (big data world forum) , 同时 2013 年 12 月在北京举行了第一届中国计算机学会 (CCF) 大数据学术会议和国内最大规模、最具影响力的中国大数据技术大会 (big data technology conference, BDTC) 。另
10、外, Nature、Science分别于 2008 年和 2011 年针对大数据发表专刊;纽约时报、华尔街日报也都推出大幅报道。在其他的电商行业、社交平台上也都有大数据的踪影存在。从这些大数据的研究与应用可以看到, 现今对于大数据的研究主要还处于宏观层面, 部分的微观性研究也多是针对技术方面, 极少有针对管理方面的研究。另外, 大数据与其他相对已经成熟的技术结合的研究也是一块缺失。对于大数据的应用和研究仍处于初级阶段。近些年由于各种新技术、新理论的不断涌现, 管理信息系统也在随之改变。近5 年来, 射频识别 (RFID) 技术、地理信息系统 (GIS) 、面向服务的架构 (SOA) , 尤其是
11、物联网和云计算的运用发展, 给管理信息系统带来了新的发展点。通过整理我国近 5 年在管理信息系统领域的部分学术研究成果, 发现管理信息系统与新理论、新技术的结合给管理信息系统的发展带来了新的推动力。例如, 物联网与管理信息系统结合应用于逆向物流管理方面, 解决了逆向管理信息系统中数据采集更新以及共享的难题;将 GIS 与管理信息系统结合应用于城建部分的配电网建设, 能满足配电网“安全、经济、优质”的要求2;SOA 与管理信息系统结合应用于社区管理信息, 使得系统具备了适合基层工作业务流程要求的能力, 具有更强大的生命力3;云计算与管理信息系统结合应用于高校资源管理, 有利于降低教育信息化成本,
12、 加强信息的整合与共享4;R FID技术与管理信息系统结合用于冷库的仓储管理, 能够做到对冷库内货物进行实时跟踪和精确定位, 使得冷库的管理走向透明化和自动化5。另外, 国家自然科学基金委员会管理科学学部管理科学与工程很早就开始资助管理信息系统的研究6。例如, “十五”至“十二五”期间, “信息化条件下的管理模式与方法研究”、“信息系统技术对管理模式的影响规律”、“电子商务/政务管理的理论与方法”和“智能健康信息服务管理”等分别被纳入优先或重点资助领域和发展方向。管理信息系统经过 40 多年的发展, 已经成为了一套相对成熟的集技术、管理思想、系统等于一体的信息管理体系, 并且成功地应用于各个领
13、域。无论是在企业、政府、公共服务事业, 还是在航空、交通等领域都有不俗的表现。大数据时代的到来给人们的生活带来方方面面影响的同时, 也影响着管理信息系统的发展。对此, 国家自然科学基金委员会信息科学学部在 2014 年项目申报指南中明确指出7, 将大数据管理系统评测基准的理论与方法作为大数据技术和应用中十大挑战性科学问题之一, 并拟以重点资助。大数据对管理信息系统数据处理过程中的数据采集、清洗、集成、存储、分析以及数据可视化都产生了影响, 并对管理信息系统的硬件、软件、人才培养以及管理思想方面都有一定的推动作用, 也存在着不少的挑战, 例如, 人才短缺、数据共享、信息安全等相关问题;反之, 管
14、理信息系统的发展也将会加快大数据的发展进程。2 大数据影响信息的处理过程管理信息系统是一个以人为主导的, 综合利用计算机硬件、软件和网络设备进行信息的采集、传递、存储、加工、整理和挖掘工作, 以提高组织的经营效率为目标的信息系统。信息的整个加工处理过程是管理信息系统中最重要的一环。大数据的出现使得信息的采集、存储、清洗、集成、数据挖掘等工作内容都发生了不同程度的变化。2.1 数据的采集源与采集技术大数据拓宽了数据的采集源。传统的数据大多是来自于人为主动产生的数据, 比如 QQ、微博、照片等。但是随着电子商务、物联网、互联网、大数据的发展, 机器数据日益显现它的价值, 这就导致了各种公司及机构开
15、始重视收集机器数据, 无论是散落在不同地理位置的传感器收集的数据、移动互联设备中的数据信息 (如通过手机或平板电脑获得的个人位置信息) 、网络点击数量 (如淘宝的客户浏览数据) 的数据, 还是射频 ID 数据, 都成为新的热门数据来源。其中射频识别数据 (R FID data) 可以算是大数据发展以来的新宠, 将 RFID 嵌入产品, 进行实时数据分析, 是未来包括物流、交通、零售、动物保护研究等在内的物联时代的智能首选。数据源的变化也带来了数据采集技术的变化。大数据推动下产生的新的数据采集技术主要体现在以下几个方面。 对于互联网企业, 采用分布式架构的系统日志采集方法, 满足每秒百兆字节的日
16、志数据采集的要求。如 Facebook 的 Scribe, Scribe 将信息从各个日志源分别收集, 然后存储于中央存储系统中, 等待集中式的处理分析, 以“分布收集、统一处理”的方式来提高数据采集的速度。 对于网络上的数据, 采用网络数据采集方法, 主要是指垂直搜索引擎和网络爬虫等。由于数据的海量性, 通常对于采集后的数据需要进行分拣和二次加工, 所以要做到既快速又尽可能准确地把握数据的采集。例如, 国内的“火车采集器”就是将垂直搜索引擎、网络雷达、信息追踪与自动分拣和自动索引技术结合起来的应用, 达到海量数据采集与后期处理相结合的目的, 以此应对数据的海量性。 对于网络流量, 可以采用深
17、度分组检测 (DPI) 、深度流检测 (DFI) 或是盲检测 (BLINC) 的宽带管理技术。现在也有学者提出将 DPI 和 DFI 技术相结合的联合检测方法, 使得其具备检错和纠错的能力, 提高网络流量检测的准确性8。 对于保密性要求较高的企业经营数据和科学研究数据, 采用系统接口方式以确保数据的安全。2.2 数据集成与清洗技术数据集成是用各种手段和工具, 在已有的数据基础上按照一定逻辑关系对数据进行统一的规划和组织, 以实现数据资源共享的目标9。数据集成主要是将异构性的数据进行处理, 以便在数据挖掘阶段能够进行统一的操作。对于大数据时代数据以非结构化、半结构化数据占主要部分的情况, 数据快
18、速、有效、实时、动态地集成成为一个重要研究方向。因此, 分布式的协作策略、动态式的实时集成成为最新的信息技术方面的研究热点。大数据时代用于企业数据挖掘的数据增多, 而数据质量参差不齐, 往往存在数据冗余、不完整、稀疏甚至错误的现象。在数据挖掘分析前, 先进行预处理, 可以减少数据的错误率, 这是保证数据挖掘成果高准确性和高效率的有效且必要的方法。而数据清洗就是这样一个减少错误和不一致性的过程。面对海量的数据, 盲目收集所有数据显然是一个很大的负担, 所以数据清理的研究趋势是能够从最小的数据资源里获取最准确、最正确的知识。2.3 数据存储的发展大数据时代, 传统的数据存储系统遇到了瓶颈, 已经不
19、能满足数据指数型暴增所带来的海量存储的需求。数据存储正朝着横向和纵向无限扩容的方向前进, 即对存储系统能力的提升和存储量的扩容, 使得存储系统能够满足大数据“类型”的需求和“量”的需求。另外, 为了提高系统的扩展性、降低系统维护复杂度, 提出了以对象作为基础的存储形式。在这样的发展和需求背景下, 云存储成为了首选。云存储就是通过应用软件将网络中大量存在的各种不同类型的存储设备集合起来, 协调各设备的工作来满足大数据对于数据存储的要求。云存储主要可以分为两类, 一类就是生活中常会用到的一些个人的云存储应用, 比如最初的酷盘, 后来的 360 云盘、百度云等, 主打个人资料的上传与共享。另一类是企
20、业级的云存储应用, 比如 E M C 推出 EMC ATMOS 云存储, 主打大规模非结构化数据的存储、归档和访问, 以面向云的设计, 确保企业和服务提供商在保持庞大规模数据的同时高效运行;IBM 推出的 IBM Smart Cloud Virtual Storage Center, 是一种存储虚拟化平台, 有助于快速迁移到基于云且面向服务的敏捷存储环境, 支持数据的大规模增长, 降低复杂性。2.4 数据挖掘与分析数据分析是管理信息最重要的一环, 也是创造价值的一环。新类型的数据不断涌现, 如实时数据、动态数据、时空数据、W e b 数据, 这些都是值得关注的数据。对应这些不同类型的数据, 出
21、现了不同的数据分析方法。具体来说, 分为以下几种类型。 实时数据, 作为一种动态的数据流, 如微博、微信等, 是大数据发展以来数据分析非常重要的一个方面。主要采用的是动态的数据流处理方式。 动态数据主要是通过时间序列从时间维度来分析发现相关的变化规律。零售、电信、金融行业对此都已经有了广泛应用, 如零售行业通过分析历史数据在时间维度上的规律来发现企业潜在的商机, 并预测未来客户群体以及客户的潜在需要, 有针对性地制定营销策略和采购计划。 时空数据由于各种移动传感器、定位系统的应用而变成了热点。经过几年的发展, 在时空挖掘领域已经出现了许多价值的工作, 如时空模式发现、时空异常检测、时空预测和分
22、类、时空聚类以及时空推理与数据挖掘相结合10。 Web 数据, 大数据时代对于互联网的重视尤为突出, 因此大数据的数据量以及其重要程度使得 Web 数据研究技术进一步发展。这个发展就是基于云计算的Web 数据挖掘, 同时也为 Web 数据挖掘成功找到了适应当前网络需求的可行方案。这个需求指的是对于当前互联网海量数据的地理分布、异构、动态以及高复杂性这些特性的应用需求11。大数据对于数据分析方面的影响不单是在分析数据类型的变化及相对应的数据挖掘方法的变化上, 还给分析处理带来新的要求实时分析12。从现有的技术和模式来看, 主要是从流处理、批处理以及两者相结合的方面入手。数据的价值会随着时间的流逝
23、而减少, 基于此, 流处理将数据当作流, 将连续不断的数据当成数据流, 获得实时近似的结果。Map Reduce 模型是批处理最具代表性的模型, 通过廉价的服务器集群实现大数据的并行处理13, 将问题分开处理, 以此避免因大规模数据传输造成的通信负担。两者的结合是近些年来的又一热点, 可以相互取长补短, 使得数据分析能够更加实时化。大数据时代的数据分析应用于方方面面, 每个人的生活中或多或少都在应用着分析的成果, 从试验性的接触到熟练的掌握, 人们渐渐发现数据分析带来的好处, 对其需求也渐渐扩大。作为卖家, 需要从各种营业数据里分析自已销售商品的未来走向, 找出什么是卖点;作为买家, 需要对各
24、种产品的参数进行深度比较分析, 获得最优于自己的购买方案。因此, 数据分析已经不是大企业的专利, 渐渐地应开始走向平民化。对于这点, IT 巨头微软公司已经有了准确的认识。2013 年 10 月, 微软全球高级副总裁、大中华区董事长兼首席执行官贺乐斌在“大数据媒体日”发布大数据愿景:推动数据分析平民化, 希望基于标准化的产品, 使所有人都能够在任何时间、任何地点利用数据, 并更好地做出决策。2.5 辅助决策在大数据背景下, 人类的决策方式将不可避免地发生改变。大数据将把数学算法运用到海量数据上, 通过让数据做主的方式进行科学决策, 以此来修正人类的偏见和直觉。将信息系统和辅助决策进行有效的结合
25、是大数据时代的必然结果, 而这将为辅助决策带来新的变革。特别地, 由于信息之间的联系越来越紧密, 孤立地看待问题必将被时代淘汰, 单项决策支持的辅助决策在大数据时代能发挥的作用已经越来越小, 综合、全面地看待问题, 是大数据对决策者提出的新要求, 也是决策支持在大数据时代的发展。信息系统的接入在消除信息孤岛的同时, 也使得辅助决策实现了从单项决策支持向企业级决策支持的转变14,15。传统的辅助决策系统往往不能实现信息检索, 而是主要进行智能决策。在大数据时代下, 决策者将面对海量决策信息, 信息检索的实现是帮助决策者进行信息分析与筛选的重要环节。信息系统现有的检索功能对这一环节的实现起着至关重
26、要的作用, 如何将信息系统的检索功能高效地运用到辅助决策中, 是未来的系统开发者面临的挑战。大数据时代的到来使得各行各业都不可避免地受到了冲击与改变, 决策者在面临大量信息的同时也对辅助决策系统提出了更高的要求。信息系统对辅助决策的改变提高了辅助决策系统对海量数据的分析与处理能力, 实现了从单一决策的制定到综合决策支持的改变, 同时如何高效地兼并信息系统与辅助决策系统是每个从业人员面临的共同挑战, 需要进一步研究。2.6 数据可视化数据展示是数据分析后将结果传递给人的一个过程, 大数据分析得到的结果之间的关联关系更加复杂, 传统的展示方式已经不能满足要求。大数据带来了更为直观、互动的方式, 以
27、便人们更好地理解。可视化技术的引入就是其中重要的一项。可视化技术是将数据转化为图形, 以此来给予人们深刻而意想不到的洞察力。可视化技术是能够放大人类感知的数据的图形表达方式, 聚焦于关键的信息特征, 以压缩信息的方式使得复杂信息能够快速被人理解16。同时, 从数据到图像的转变也能从中发现单纯数据处理时不易发现的信息。信息设计师 David Mc Candless 在 TED 上说道:“通过可视化, 可以把信息变成一道可用眼睛来探索的风景线, 一种信息地图。当你迷失在信息中时, 信息地图非常实用。”3 大数据对管理信息系统基本构成的推动性管理信息系统的主要功能包括:给企业提供能反映实际情况的信息
28、来支持企业决策;辅助管理者监督控制来有效利用资源;用过去的信息预测未来和为不同管理层提供不同的报告来控制企业行为。管理信息系统是由硬件、软件和人构成, 它的应用也代表了一种企业管理思想。所以, 管理信息系统是硬件、软件、人以及管理思想的有机结合体, 而大数据对管理信息系统的这几个方面产生了影响。3.1 大数据推动管理信息系统的硬件发展管理信息系统的硬件主要包括计算机硬件和网络管道两方面。大数据的海量数据特性首先冲击的是计算机硬盘的存储容量, 而其庞大的数据量所需的计算次数又给计算性能带来了新要求, 另外, 半结构化与非结构化的数据占多数的特性也要求数据处理方式的转变。CPU 的架构已经从单核转
29、向多核, 现今的发展主要是通过软件架构来完美组合多核 CPU, 使得能够更好地利用多核 CPU 的并发机制来展示价值。对于硬盘存储, 磁性介质硬盘 (H DD) 因其读写速率的限制, 不能很好地适应大数据的要求, 进而出现了基于闪存的固态硬盘 (SSD) 。固态硬盘有许多独特的优点, 比如它的抗震性、低耗性、小体积, 尤其是良好的读写性能, 能为管理信息系统提供优良的存储性能。对于内存部分, 典型代表 P C M -S C M 的出现, 使得内存同时具备了处理速度快和不容易丢失的内存与磁盘的两方面优点。IDC 曾预测“大数据会显著推动基础架构横向扩展”。显然, 硬件企业已经认识到这一点, 并开
30、始积极地靠近。以 Intel 公司为例, Intel 公司为实现容忍网络隔离而推出具有良好横向可扩展性的 x86 架构, 另外在存储领域里也推出了基于开放架构的云计算体系。Intel 公司的至强处理器强劲的计算能力, 加上数据直接 I/O 技术 (DDIO) 性能和 SATA 接口的固态硬盘 (SSD) 可以提高原始存储的读写率, 更好地适应并满足大数据的存储、处理速度要求。另外, 大数据的发展和市场需要, 势必引起大数据一体机研发热潮, 使得大数据存储、处理、软硬一体化得到充分利用, 进而更好地为大数据研究和发展提供硬件平台支持, 这在一定程度上解决了原有架构的扩展瓶颈, 进一步推动了大数据
31、向产业化发展, 并使得大数据技术在相关行业中得到充分应用。管理信息系统的硬件还有重要的一个方面就是网络管道。大数据对于数据传输速度更快、数据量更大的要求, 促使管道技术向宽带化演进。另外, 在管道架构方面, 为了实现系统时延性的降低, 网络管道趋于扁平化。软件定义网络和多管道组合技术也将使管道技术走向虚拟化与智能化。3.2 大数据推动管理信息系统的软件发展管理信息系统的软件方面主要包括操作系统、数据处理系统、数据库系统、应用软件等, 可以从文件系统、数据处理系统、数据库系统这几方面看到大数据影响下的管理信息系统的软件发展。文件系统是一种存储和组织计算机数据的方法, 是操作系统用于明确磁盘或分区
32、上文件的方法和数据结构, 使对其访问与查找更加明确与便利。现如今的文件系统基本已经都采用分布式文件系统, 经过这几十年的发展, 该系统技术已经趋于成熟。在大数据的冲击下, 分布式文件系统应大容量、高性能、高可用等要求出现了 Hadoop 分布式文件系统 (HDFS) , 它的优点是高度容错性和高吞吐率, 并且可运行在通用硬件上。另外一个比较热门的分布式文件系统是 QFS (quantcast file system) , 这是一个开源的文件系统。与 HDFS 相比, 它的性能更加优异, 从容量来看, QFS 可以节省 50 %的磁盘空间;从吞吐率来看, Q F S 的读写速度是 HDF S 的
33、两倍;另外, QFS 更容易与系统软件兼容, 实现命令式的终端。数据处理系统模式主要就是批处理与流处理两种。而现代数据处理最重要的就是数据处理的实时快速, 也就是数据实时处理。对此, 出现了内存计算, 希望以此达到实时处理或是近似于实时处理的效果。内存计算的意思就是在服务器的内存里处理超大量的实时数据, 从而达到在分析和交易中提供即时结果的效果。另外, 大数据时代下的数据挖掘算法研究成为管理信息系统决策支持的研究重点。深度学习是大数据时代又一重要的人工智能方法, 是一种深度神经网络的机器学习模型, 其成为了现代人工智能研究的发展方向。然而, 大数据背景下的深度学习具有模型庞大、计算量大、耗时长
34、等特点, 使得分布式管理系统通常需要并行计算来加速数据的处理与分析。大数据的数据规模性、低密度价值性、类型多样性等特性及数据在不同领域应用的时间、处理方式的差异, 推动了数据库系统的前进。现今, No SQ L 和 New SQ L 数据库阵营迅速崛起。No SQL 就是“not only SQL”, 是对关系型数据库的一种补充, 即非关系型数据库。No SQL 指的是非关系型数据库, 首要解决的问题就是如何对大数据进行有效处理。No SQL 普遍采用简单的数据模型, 通过元数据和应用数据分离技术以及弱一致性技术来处理大量数据, 实现较高的吞吐率, 并可以应用于便宜的 PC 服务集群上, 实现
35、可扩展性17。New SQL 是支持关系型数据库的, 同时以 SQL 作为其主要的接口, 但是内部结构产生了较大变化:它丢弃了原有的单线程服务的锁制和昂贵的恢复机制, 采用冗余机器来实现复制和恢复故障。如今的数据库系统已经在这两个概念领域里呈现出百花齐放的景象。3.3 大数据推动新体系架构的研发信息系统体系结构是对信息系统各构成要素及其关系的描述, 信息系统体系结构包括信息系统的概念、信息系统的基础设施架构、信息系统的信息资源结构和信息系统的软件架构等。基于云计算的军事信息系统架构18以云计算资源管理“虚拟化”分布式数据管理和分布式数据处理等作为基础支撑技术, 对已有军事综合电子信息系统体系架
36、构进行改造, 能够满足信息系统的高可靠性和高可扩展性要求, 该体系结构为了对数据进行高效的利用, 发生了以下改变:采用分布式数据处理技术, 大幅提高了大规模数据访问和情报处理容量, 提高了系统处理的实时性、可靠性;采用虚拟数据存储的方式, 提高系统访问数据实时性和可靠性, 降低系统反应时间, 提高作战效能。除了以上几个适应于大数据的信息系统体系结构框架之外, 国内外还有很多学者和组织都在这方面做了许多有益的尝试, 使得信息体系结构具有更好的数据处理与分析性能。如今数据就是新能源, 高效地利用数据已经成了企业乃至国家的重点研究课题, 研发具有更高大数据适应性的信息系统架构具有很高的社会及现实意义
37、。3.4 大数据推动数据收集分析的人才发展由于现今用于各种大数据分析的策略性产品还没有完全成熟, 不能单靠一家大数据服务供应商解决所有问题。如果一家企业外购这类产品, 要做的并不只是简单的购买、安装、运行, 更重要的是要有优秀的系统管理员来持续这样的应用过程, 这样才能使系统发挥应有的效能。只有充分地了解建立这些环境的实现方法, 才能应用科学系统为企业服务。管理信息系统重要的一个部分是数据挖掘, 而在大数据时代这点尤为突出, 即怎样利用现有的系统从众多类型各异的数据中找出真正的价值。而采集数据和清洗数据作为数据分析的前提也显得尤为重要。大数据时代的管理信息人才要掌握整个系统运行的知识、大数据应
38、用的基本原理以及管理信息系统的整个管理思想和运作模式。除此之外, 还要掌握的就是数据挖掘的能力, 要有掌握机器学习、知识图谱的应用能力, 能够熟练应用各种数据挖掘模型以及统计学的专业技能等。总而言之, 管理信息人才要利用现有的大数据产品, 做好信息管理工作, 从海量的大数据中发掘有用信息。企业里面大多数人都是管理信息系统的使用者, 但基本都缺乏上述的能力, 所以大数据时代的企业具备专业的技术和管理人员更加重要。大数据推动了专业数据方面的技术和管理人才的发展。3.5 大数据推动企业管理思想转变就管理信息系统本身而言, 它通过信息收集、存储、传输、加工和输出等实现辅助企业事务处理和管理职能以达到管
39、理的目的。所以, 以往一般企业的决策只是将管理信息系统做一个辅助参考, 并不以数据挖掘的结果为真正的决策, 而主要采用以目标驱动决策的方法进行决策。但是大数据给决策带来了新的思潮 数据驱动决策。根据美国麻省理工学院的一个团队对北美 330 家企业调查走访的结果19可知, 把自身企业定义为数据驱动的企业, 能更好地完成既定的财务和运营目标, 尤其是处在行业排名前 1/3 的企业。数据驱动企业平均比非数据驱动企业的生产力高出 5%, 利润高出 6%。可见, 数据驱动能给企业发展带来推动作用。数据驱动决策并不是说管理者可以完全依赖数据, 管理者要做一个提问的专家, 要清楚地理清企业脉络并具有长远发展眼光, 能够总体控制方向, 然后由数据来告知答案。比如, 零售商的管理者会提出:谁是优质客户;什么样的广告可以刺激购买等。当然也有些问题不是数据可以回答的, 比如, 企业在竞争对手中的地位。总而言之, 一些由数据可以回答的问题在渐渐地表达数据本身的意见, 最终实现数据驱动决策。有学者提出, 将传统的“目标驱动策略”与“数据驱动策略”结合起来, 形成双向决策模型, 从而构建了“评估与预测”和“监测与预警”的技术创新管理模型20。这是管理决策思想的另一个创新, 新与旧的结合使企业能更好地从传统“目标驱动决策”逐渐转向“数据驱动决策”, 让企业管理者逐渐相信数据说的“话”。