首页 > 字节跳动大数据-Data面经
头像
明天201805100112751
编辑于 2020-08-14 11:24
+ 关注

字节跳动大数据-Data面经

忘得差不多了,说下我记得的
1面:
ConcurrentHashmap底层是怎样的,怎么保证线程安全
synchronize底层原理
了解哪些GC算法
CAP原则
Zookeeper的一致性协议
了解哪些其它的一致性协议
算法题:大数组求中位数

2面:
项目
了解哪些blockingQueue,分别有什么特点
算法题:利用blockingQueue设计一个生产者消费者模式,如果是nonBlockingQueue应该怎么修改
了解mysql吗,mysql有哪些索引,知道覆盖索引吗(好像是这个,反正我答的不知道)
spark宽窄依赖

3面:
自我介绍+项目(貌似他不感兴趣,说一半打断我了)
算法题:两个字符串的最大公共子串
使用spark写一个wordcount
从这个spark程序打包提交到spark集群之后,分别发生了什么
spark宽窄依赖,程序中有几个stage
程序中的rdd有几个partition
如果要增加并发应该使用什么参数,executor和core的比例怎么设置(这里我答错了,太久没用都记不清了)
如果发生数据倾斜怎么处理
如果某些task很慢应该怎么处理
一个volatile修饰的变量x,100个线程执行x++,最终结果是多少。
了解哪些java的锁

大概就这么多,3面逮着spark调优一直问。

更多模拟面试

全部评论

(8) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐