9.23 40min 小米大数据一面
mapreduce和spark区别
spark算子
数据倾斜是什么,导致什么问题,怎么解决
groupbykey、reducebykey
SQL join,union
sparksql、dataframe、dataset
编程:时间复杂度o(n) 空间复杂度O(1) 对不重复不降序数组找出要求的和的数据对
因为超出30min面试官要去面下一个人了,连反问环节都跳过了,过了两天收到二面通知
9.28二面:
spark架构、shuffle过程
计算机网相关(拥塞处理,tcp/udp区别,tcp建立连接过程,tcp四层协议栈)
spark瓶颈,数据倾斜
算法题:
1、一个数组中,如果相邻两个数相差1,或者只有1个数,就定义为一个可用数组,求最长的可用数组长度
2、输出窗口最大值
反问
两场面试的面试官人都很好,面试体验很棒,许愿oc!!!
Drop here!
全部评论
(7) 回帖