1、创建时间:2013-12-6 14:47:00 内容来自:Java 私塾Java 私塾:初始 Hive 深入浅出学 Hive目录:初始 HiveHive 安装与配置Hive 内建操作符与函数开发Hive JDBChive 参数Hive 高级编程Hive QLHive Shell 基本操作hive 优化Hive 体系结构Hive 的原理配套视频课程第一部分:Hive 简介什么是 HiveHive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL 查询功能。本质是将 SQL 转换为 MapReduce 程序第二部分:为什么使用 Hive面临的问题人
2、员学习成本太高项目周期要求太短我只是需要一个简单的环境MapReduce 如何搞定复杂查询好难Join 如何实现为什么要使用 Hive操作接口采用类 SQL 语法,提供快速开发的能力避免了去写 MapReduce,减少开发人员的学习成本扩展功能很方便Hive 的特点可扩展Hive 可以自由的扩展集群的规模,一般情况下不需要重启服务创建时间:2013-12-6 14:47:00 内容来自:Java 私塾延展性Hive 支持用户自定义函数,用户可以根据自己的需求来实现自己的函数容错良好的容错性,节点出现问题 SQL 仍可完成执行第三部分:Hive 与 Hadoop 的关系第四部分:Hive 与传统
3、数据库对比Hive RDBMS查询语言 HQL SQL数据存储 HDFS Raw Device or Local FS执行 MapReduce Excutor执行延迟 高 低处理数据规模 大 小索引 0.8 版本后加入位图索引 有复杂的索引第五部分:Hive 的历史由 FaceBook 实现并开源2011 年 3 月,0.7.0 版本 发布,此版本为重大升级版本,增加了简单索引,HAING 等众多高级特性2011 年 06 月,0.7.1 版本发布,修复了一些 BUG,如在 Windows 上使用 JDBC 的的问题 2011 年 12 月,0.8.0 版本发布,此版本为重大升级版本,增加了 insert into 、HA 等众多高级特性2012 年 2 月 5 日,0.8.1 版本发布,修复了一些 BUG,如 使 Hive 可以同时运行在 Hadoop0.20.x 与 0.23.02012 年 4 月 30 日,0.9.0 版本发布,重大改进版本,增加了对 Hadoop 1.0.0 的支持、实现BETWEEN 等特性创建时间:2013-12-6 14:47:00 内容来自:Java 私塾第六部分:Hive 的未来发展 增加更多类似传统数据库的功能,如存储过程提高转换成的 MapReduce 性能拥有真正的数据仓库的能力UI 部分加强