前几天投的简历,然后今天去面试。因为知识点还没好好的捋一捋,其实犹豫要不要去面试的。emmmm,确实,很die,面试过程很尴尬,感觉一直是大眼瞪小眼,哈哈哈哈哈,凉凉了,就分享一下部分记得的面试题
1、RDD的特点,怎么存储数据?
2、spark的rdd和partition的联系。
3、RDD的算子了解吗?讲讲foreach算子
4、shuffle操作的理解?(应该是问那些算子会触发shuffle操作之类吧)
5、spark 和 mapreduce 区别
6、HDFS的架构,它们分别具备什么功能?
7、namenode存数据吗?
8、HDFS的默认数据块大小是多少?(128M)为什莫是128M?
(数据块过小:从寻址和磁盘两个方面回答)
。。。。。。
最后面试官:有什么问题问他吗?
没问,觉得面试不过,就觉得没必要问
全部评论
(3) 回帖