1面6.17 只记得几个-
问项目
spark join 和reducebykey一定有shffer嘛?
task job stage 分区 他们之间关系,为什么有stage?
几个聚类算法原理,流程和优缺点
手写冒泡 估计看我跨专业吧
数据倾斜
2面6.21 只记得几个
work可以有几个executor task数量设置多少比较好
数据库隔离级别
spark提交参数含义
spark执行页面关注什么
也问了几个聚类算法流程,优缺点
问了几个排序时间复杂度
rdd df ds 区别,怎么知道数据类型,类型推断时候是哪个分区进行类型推断,推断时候有null会有什么影响
数组中求出现最多的前两个数
hr面6.25
介绍项目 怎么学习
hr面完一小时发了书面offer
全部评论
(3) 回帖