总时长30分钟左右
1.自我介绍
2.Hadoop、Hive、HBase的区别
3.Hive除了Mapreduce计算,还有哪些
4.Spark应用领域,在项目中怎么用的
5.RDD
6.算子的种类,说一些算子,
7.窄依赖、宽依赖
8.Spark任务并行,什么情况任务不会并行?
9.项目的一些问题
10.论文发了没有?其他项目?
11.Java的threadLocal,以及它的内存泄露问题。
12.Spark用的是Java还是Scala?他们的区别特点
最后是一道算法题,10min内
取一个整数a的从右端的开始4-7位(从1开始)
应该还有一些其他的问题漏了,不过总体而言并不难,面试官挺和气的
全部评论
(4) 回帖