阿里巴巴淘系大数据研发二面面经 2020.08.14 32分钟
1.介绍项目流程
2.spark sql 的执行流程
3.sparkstreaming的实现原理,它与flink的区别是什么
4.hadoop与spark的区别
5.mysql的事务原理
6.es倒排索引以及ES的分片,节点之间的关系
7.hashmap的实现原理
8.spark的调优参数讲讲用到过的
9.G1垃圾回收器讲一讲
10.spark shuffle机制以及如何划分shuffle
11.spark用的时候你遇到过的痛点有哪些
12.把你认为其他有价值的点再讲讲?基于kafka 巴拉巴拉讲了几分钟
面试体验很好,都是基于项目展开,比较注重项目和实际经验。
全部评论
(3) 回帖