
hadoop面试小结.docx
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
最后一页预览完了!喜欢就下载吧,查找使用更方便
10 文币 0人已下载
下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- hadoop面试小结.docx
- 资源描述:
-
1、hadoop 面试小结 入门:知道 MapReduce 大致流程,map, shuffle, reduce知道 combiner, partition 作用,设置 compression搭建 hadoop 集群,master/slave 都运行那些服务HDFS,replica 如何定位版本 0.20.2-0.20.203-0.20.205, 0.21, 0.23, 1.0. 1新旧 API 不同1、hadoop 运行的原理 ?2、mapreduce 的原理?3、HDFS 存储的机制?4、举一个简单的例子说明 mapreduce 是怎么来运行的 ?5、面试的人给你出一些问题,让你用 mapred
2、uce 来实现?比如:现在有 10 个文件夹,每个文件夹都有 1000000 个 url.现在让你找出top1000000url。6、hadoop 中 Combiner 的作用?进阶:. Hadoop 参数调优,cluster level: JVM, map/reduce slots, job level: reducer #,memory, use combiner? use compression?pig latin, Hive 简单语法HBase, zookeeper 搭建最新:关注 cloudera, hortonworks blognext generation MR2 框架高可靠性
