1、 云计算分布式大数据 Hadoop 入门经典培训一:课程简介:Hadoop 天生是解决大数据高并发问题的, 是一个能够对海量数据进行分布式处理的软件框架。互联网企业、金融机构、政府组织和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,作为云计算实现规范和实施标准的 Hadoop 应运而生。使用 Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且 Hadoop 的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来 PB 级别的数据,
2、是分布式大数据处理的存储的理想选择。“云计算分布式大数据 Hadoop 入门经典”基于实务经验萃取而成,从零起步,Hadoop 开发环境的搭建到到图片服务器、WordCount 实现、HBase 微博系统、话单查询与统计课程以 MapReduce、HBase 为主轴,带你遨游于云计算的梦幻世界。二:课程特色1, 案例驱动教学,全程项目实战训练;2, 从零起步,循序渐进,细致剖析每一个知识;3, 萃取出实际开发中最常用、最实用的内容并以深入浅出的方式把难点化于无形之中【主办单位】中国电子标准协会【协办单位】深圳市威硕企业管理咨询有限公司三:适合对象:软件工程师;数据库开发人员;网络后台开发人员;
3、运维人员;四:基础要求了解 Linux 系统;了解网络;了解 Java;五:培训内容时间 内容 备注第一天 第 1 个 主 题 : Hadoop 思 考1.Hadoop 的设计目标和适用场景2.Hadoop 架构解析3.MapReduce 工作原理和案例说明第 2 个 主 题 : Hadoop 安 装 和 配 置 实 战1. 安装和配置单机版 Hadoop 实战2. 安装和配置伪分布式 Hadoop 实战3安装和配置分布式 Hadoop 集群实战第 3 个 主 题 : HDFS1. HDFS 命令行操作实战2. HDFS 的配置管理3. NameNode 的工作机制第 4 个 主 题 : HD
4、FS 案 例 实 战1. HDFS 案例的分析和设计2. 环境搭建3.使用 Hadoop Java API 实现对 HDFS 写入、读取、删除文件等操作第 5 个 主 题 : MapReduce 剖 析1. MapReduce 的原理和运行过程2. 构建 MapReduce 的开发环境第 6 个 主 题 : MapReduce 案 例 实 战1. 使用 MapReduce 的 Java 接口实现经典的 WordCount2. wordcount 运行过程解析3. MapReduce 实现数据去重操作4. MapReduce 实现数据排序5. MapReduce 实现数据平均数据的计算时间 内容
5、 备注第 1 个 主 题 : HBase 架 构 设 计 和 实 现 剖 析1. HBase 架构设计2. HBase 中的表结构等3. HBase:Master、Region、Region Server第 2 个 主 题 : HBase 案 例 实 战 1-使 用 HBase 实 现 微 博 系统1. 项目架构和设计2. 开发环境搭建第二天3. 实现用户登录和注销4.“关注”功能的设计和实现5.“发微博”功能的设计和实现6.发布和运行整个基于 HBase 的微博系统第 3 个 主 题 : HBase 与 MapReduce1. HBase 与 MapReduce 的关系2. HBase 如何使用 MapReduce第 4 个 主 题 : HBase 案 例 实 战 2-话 单 查 询 与 统 计1. 项目架构设计2. 开发环境搭建3. 话单入库和查询的设计与实现4.统计功能的设计与实现