阿里巴巴数据研发工程师校招一面面经 2020.08.11 40分钟
1.讲项目
2.mysql中的数据同步到redis的过程中是增量同步还是全量同步
如果mysql数据量是亿万级别,你怎么对这个过程优化?
3.spark的RDD讲一讲
4.ES的检索过程
5.spark常用算子
6.spark的两个重分区算子的区别
7.场景:flume中采集到了近一个小时的所有用户对某些电影的打分流,你如何进行设计,使得找到与A用户在同一地域的看过的同一部电影的其他用户,推荐给A
8.讲讲你认为你项目里最优价值的一些点?基于kafka 巴拉巴拉讲了几分钟
面试体验很好,都是基于项目的扩展
全部评论
(2) 回帖