有点久远了,大概是8.10号左右完成的HR面试,前段时间发了意向书,现在补下面经
一面:
没写算法题,太久了有些问题忘记了,大概说一下自己还记得的一些问题吧
1.100亿数据全排序,怎么排?
思路就是外部排序吧,笨点的方法分成一个个的有序数组,然后对有序数组两两归并,但是这样每个数据经历的磁盘IO太多了,不好;优化一下就是采用多路归并,比如有K路,然后K又不能太大,否则每次都需要排序压力也比较大;再一种思路就是尽可能的增大每一个排好序的数组的长度,可以使用堆的数据结构。整个思路网上应该有,大家说的时候注意结合上面试官提供的内存限制来说,用数据说话,最常用的要记住10亿个字节=1GB
2.机架感应技术是什么(当时我只知道这个词,只知道hdfs的副本同步机制用到了,具体是什么还真不知道。。。)
二面:
问项目,问布隆过滤器
问spark和flink的一些问题
HR面:
正常聊天
全部评论
(7) 回帖