1.文件大小默认为64M,改为128M有啥影响?
2.RPC的原理?
3.NameNode与SecondaryNameNode的区别与联系?
4.介绍MadpReduce整个过程,比如把WordCount的例子的细节将清楚(重点讲解Shuffle)?
5.MapReduce出现单点负载多大,怎么负载平衡?
6.MapReduce怎么实现Top10?
7.hadoop底层存储设计
8.zookeeper有什么优点,用在什么场合
9.Hbase中的metastore用来做什么的?
10.HBase在进行模型设计时重点在什么地方?一张表中国定义多少个Column Family最合适?为什么?
11.如何提高HBase客户端的读写性能?请举例说明。
12.在hadoop开发过程中使用过哪些算法?其应用场景是什么?
13.MapReduce程序如何发布?如果MapReduce中涉及到了第三方的jar 包,该如何处理?
14.在实际工作中使用过哪些集群的运维工具,请分别阐述其作用。
本博客文章除特别声明,全部都是原创!原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【Hadoop面试题系列(4/11)】(https://www.iteblog.com/archives/1759.html)