一面:
1、一些Java基础知识。
2、倒排索引。
3、讲讲redis里面的哈希表?
4、happen-before的规则?
5、volatile修饰符,synchronize锁。
6、java单例模式的实现?
7、进程与线程的区别,多进程和多线程的区别?
8、HashMap原理,为什么用红黑树,红黑树的特点?
9、快排时间空间复杂度,最好最坏的情况,优化方案?
10、TCP的拥塞控制,具体过程是怎么样的?UDP有拥塞控制吗?如何解决?
11、讲讲了解的垃圾回收算法和回收器,什么时候执行STOP THE WORLD?
12、了解Go语言吗?
13、问项目相关的东西:负责哪个模块?有没有碰到什么问题?怎么解决的?
二面:
1、Kylin的项目架构。
2、Paxos和ZAB协议。
3、CAP理论,分区容错性的意义。
4、大表Join小表优化,如何处理数据倾斜?
5、讲一下最大堆和最小堆。
6、HDFS的读取、写入,容错处理。(源码)
7、MapReduce的过程。(第一版和第二版的)
8、MR shuffle,Spark shuffle。
9、namenode HA,脑裂,Yarn的调度机制。
10、Hive的内部表和外部表区别、数仓建模模型、数仓分层、雪花模型和星型模型。
11、了解ClickHouse吗?它与Kylin的区别?
三面:
1、LRU算法实现。(伪代码)
2、链表倒数第K个数。(讲思路)
3、一堆螺丝和螺母用最短时间匹配。(代码实现)
4、求每天浏览页面的新用户。(Hive QL实现)
5、求抖音小视频每日点击量最高的10个。(Hash + 最小堆)
全部评论
(13) 回帖