7.26 时长一小时
1.自我介绍
2.详细介绍下京东实习经历
3.spark整个执行流程
4.为什么要划分stage
5.广播变量是什么,底层怎么实现的
6.spark小文件问题,有没有遇到过oom
7.flume使用的是什么channel,如何去保证可靠性
8.kafka如何保证高吞吐量,会不会出现丢数据
9.什么是零拷贝,什么是顺序读写,为什么比随机读写快
10. hdfs的写流程,如果写的过程中一个节点挂了怎么办
11.hashmap hashtable对比
12.hashmap put过程(这几个老八股真记不清了)
13.hashmap怎么变成线程安全
14.什么是虚拟内存,如何根据虚拟内存查找内存地址。用户态内核态是什么,为什么要进行划分
15.TCP/IP模型解释,tcp,udp区别
18.算法题 已经知道rand 返回1-max 求rand(m,n) 这题没写出来,后来网上也没找到答案
19.第二题 10G数据20M内存,怎么排序。口述即可
7.27 一小时
1.自我介绍
2.sql的底层逻辑,CBO和RBO的优化
3.如何监控系统的性能,状态。
4.cap理论
5.都是基于实习项目问的,没有写代码。
7.27 HR面
1.自我介绍
2.实习为什么离职
3.三个优点,三个缺点
4.如果和同事发生争执,怎么解决
5.目前投了多少公司,薪资要求。
HR说后续还有一轮技术面试
全部评论
(8) 回帖