字节、蘑菇街和网易的大数据实习面经

字节面经：已凉
1、直接上来说一下项目
2、说一下宽依赖和窄依赖
3、介绍一下spark shuffle
4、spark Streaming和Flink的区别
5、说一下kafka的架构
6、spark的容错机制
7、处理spark数据倾斜的方法
8、最后做一个题目，涉及归并排序和插入排序

蘑菇街面经：已凉
一面：
一来就直接说面的大部分是java基础知识
1、自我介绍
2、StringBuilder和StringBuffer的区别
3、StringBuffer又是怎么实现线程安全的呢
4、集合框架讲一下，（List Set Map这几个）
5、ArrayList和LinkedList的区别
6、HashMap和TreeMap的区别、HashSet是怎么实现的
7、讲一下深复制和浅复制
8、线程和进程的区别
9、线程的实现方式，说完再说一下Runnable和Callable有什么不同
10、队列的poll和remove的区别
11、说一下有哪几种垃圾收集器
12、说一下年轻代的垃圾回收过程
13、JVM的参数有哪些，说完让我说查看GC次数的命令
14、Linux知道的命令有哪些，介绍一下用途
15、说一下DFS和BFS
16、写一个建表的sql语句
17、Spark Stream和Flink Strom的区别
18、Spark的窄依赖和宽依赖
19、为什么要Spark shuffle
20、MapReduce为什么比Spark要慢
21、Spark的数据存在哪里
22、将一下Kafka的作用
23、你在项目中的角色是什么、你是怎么和其他开发人员沟通的
24、你有什么要问我的吗

二面、
22min
1、自我介绍
2、介绍一下项目
3、用Flink时有遇到什么bug吗
4、Saprk Sql和Hive Sql的区别
5、Spark Sql的劣势
6、HDFS 的高可用
7、介绍一下kafka
8、如何保证消息有序的消费，同时限制每个topic有多个分区
9、Redis的过期策略
9、介绍一下HashMap，这里绕了很久，有的听不懂面试官的意思
10、介绍一下Flink的watermark
11、怎么处理迟到的事件
12、触发器，实现每4s触发一次
13、介绍一下redis的内存淘汰机制
14、介绍一下JVM内存分配
15、介绍一下垃圾收集器
16、介绍一下CMS收集器
17、CMS收集器哪一个阶段会中断程序
18、项目里用的是什么垃圾收集器
19、对java的周边框架有了解吗，如Spring
20、有什么想问我的吗

网易面经：还在面试中
一面：总共20多分钟，遇到最快的一次
1、自我介绍
2、说一下spark RDD和mapreduce的区别
3、map算子和flatMap算子的区别
3、做一个题目：https://blog.nowcoder.net/n/9a069c0b616d4ef39b96e8657f13c55e
4、说一下乐观锁
5、说一说多线程下进行 i++，有哪些方法保证安全
6、在实际中有遇到数据倾斜吗，如何解决的。回答了之后让我说说用spark的方式怎么解决
7、说一说Flink的CheckPoint
8、你解释一下Exactly-once
9、Flink是如何保证一致性的

10、提问阶段

许愿拿到一个实习offer吧

已采纳

采纳

精彩回帖

精彩

全部评论

(5) 回帖

加载中...

话题同步到我的动态回帖

字节、蘑菇街和网易的大数据实习面经

更多模拟面试

已采纳

精彩回帖

全部评论

推荐话题

近期热帖

近期精华帖

热门推荐

字节、蘑菇街和网易的大数据实习面经

更多模拟面试

已采纳

精彩回帖

全部评论

推荐话题

相关热帖

近期热帖

近期精华帖

热门推荐