基本情况:
base:北京,岗位:大数据开发,已发意向书
8.21一面50min:
问了些啥忘了大半了,感觉一个月的面试经历来看,翻来覆去就是那么几个问题,基本上就是计算机操作系统+计算机网络+数据库+大数据框架+Java
问题都不难,我大概回忆一下吧
1.hdfs架构你讲一下
2.MapReduce流程讲一下
3.HBASE和hive对比
4.kudu用过吗?impala呢?kylin呢?(这几个我只用过impala,其他两个只是了解,网易好像主推kylin,但是据我所知这个东西作为olap并不好用,我们主要使用clickhouse)
5.kafka了解多少,说一下
6.spark和flink对比
7.数仓分层
8.多线程怎么创建?
9.hashmap底层原理
10.Java三大特性说一下
11.设计模式了解多少?(我只知道单例)
12.手写一个单例(一般写DCL)
13.volatile原理
14.Java web了解吗?Tomcat 呢?(不了解)
15.flink仅一次语义怎么保证的?
16.flink有几种时间语义?
17.flink窗口函数有哪些?
18.flink反压怎么看,怎么处理反压?
反问阶段:
我说没有什么问题,然后面试官就开始自己说。。。和我说看的出来你很是很不错的,无论是与人沟通还是问题的一些回答,都有自己的一定理解,广度深度都还不错,我们这个部门是干啥的,主要做什么的,偏离线一点,实时用flink比较多,后面会会二面通知
8.23 1.3h
应该是leader面吧,大网易周日还面试,真敬业
基本上基础没怎么问了,就是问项目,然后问具体的业务场景
1.你们数据规模多大
2.说一个你做的好的项目
3.去重场景做过吗?有哪些使用场景?(这个公司很长遇见,无非就是1.使用spark或者flink内部状态算子;2.利用中间件比如redis中的布隆过滤器和hypeloglog;3.由于使用Redis或有io的开销,可以在spark或者flink内部自己实现一个布隆过滤器或者hyperloglog,我自己实现过,还是比较有意思的,有同学想了解源码的话可以交流一下哈)
4.布隆过滤器原理是啥?1M能有计算存多少用户
5.数据结构这块了解吧?linkedList和arrayList的区别?linkedList在什么场景下使用?(这个我在生产中还真没用过,一般就是用array吧,顶多刷题的时候用到了,比如实现LRU)
6.手写一个单链表反转并且运行(好烦,得自己实现像LeetCode一样的输入输出,其实就是手写一个arr2ListNode和listNode2arr方法)
7.手写一个sparkStreaming计算uv,需要滑动窗口,10min一个步长,1h一个窗口长度(有点为难人了哈,虽然写过但是秋招一直复习都忘光了,这种东西捡起来看一下就行了,突然让写还真写不出来,瞎比写了一下)
8.手写一个归并排序,给你10分钟(。。这种东西大家应该很熟练吧,几十秒就写完了)
如果通过了问我能来实现吗?就是工作前来实习三个月左右。。
然后说应该是通过了,问我可以接受的薪水是什么?我说啊?现在就说嘛?他说是的,现在就得谈。。我说和大厂的薪水差不多就行。
然后反问阶段:
我:没什么问题
面试官:介绍他们部门。。
事后加了我微信,和我说看我没问什么问题,如果有问题随时交流。
全部评论
(4) 回帖