1、大数据与旅游业,大数据,2012年12月,英国人维克托迈尔舍恩伯格在其大数据时代书中指出: 大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。 哈佛大学社会学教授加里金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”,什么是大数据,“大数据”是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 大数据的特征归纳为4个“V”,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety
2、)、巨大的数据价值(Value)。 第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T); 第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。 第三,价值密度低,商业价值高。 第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。,大数据,根据互联网数据中心的中国互联网市场洞见:互联网大数据技术创新研究2012报告显示:截至2011 年年底,中国互联网行业持有的数据总量已达到1.9EB,预计2015 年该规模将增长到8.2EB 以上。,所以,培养“在多样的或者大量数据中,迅速获取信息的能力”。 客户定了一张飞机票,
3、但是由于大雨,赶到机场需要一个半小时,可能会赶不上航班。此时服务供应商知晓客户的所在位置,并计算出达到机场所需的时间,于是马上推送一个通知给客户,并帮助预订下一航班。 大数据技术在大量数据中发现规律的能力,使得那些拥有大数据项目的企业能以一种全新的方式向消费者销售旅游产品。,数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。 数据存取:关系数据库、NOSQL、SQL等。 基础架构:云存储、分布式文件存储等。 数据处理:自然语言处理,也是人工智能(AI, Arti
4、ficial Intelligence)的核心课题之一。 统计分析:数据挖掘:分类 (Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化、Description and Visualization)、复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等) 模型预测:预测模型、机器学习、建模仿真。 结果呈现:云计算、标签云、关系图等。,百度旅游预测,百度涉及旅游的大数据一般可分为三个方面: 1、旅游者属性数据(游客来源结构、性别结构、年龄结构等属性信息); 2、旅游者行为数据(游客的意愿、抵达交通、停留、消费等旅游行为信息); 3、旅游者信息获取行为数据(游客在游前游中游后与外界的信息交互数据)。,