首页 > 有赞大数据开发四面(已OC)
头像
啦都法系
编辑于 2020-09-22 13:26
+ 关注

有赞大数据开发四面(已OC)

赞下有赞,一下午走完流程,效率很赞!

8.29 有赞一面(40 min)基础为主

1、自我介绍

2、平常哪种变成语言?java/python

场景问题:用 ArrayList 和 LinkedList 存储相同的元素个数,哪个使用的空间更大?kafka 是如何解决大数据量的问题(高吞吐的原因)?如果不在允许增加分区的情况下,kafka 是如何解决生产者生产大大数量的,怎样防止数据的堆积?(没回答到点上,今天刚看过,其实可以从kafka 的特性上来说)
3、hive 的数据倾斜问题?数据倾斜有哪些现象,怎样判断?(二面时问,可能都是哪些问题造成的数据倾斜)分组时数据倾斜该如何解决,join 时该如何解决?(大表和大表join 的情况没说清楚)
sql :场景问题:两个表,字段为 uid,还有time(时间),如何拿出每个用户按时间 排序的前三条信息,具体怎么实现?说一下窗口函数底层是怎么实现的?说一下 哪些场景下使用窗口函数?
4、zookeeper 对于 kafka 的作用?
5、jvm:
1.说一下 java 的内存区域吧
2.GC 的收集算法发展史
3.多线程了解吗?说下线程如何实现?说下对线程池的理解
4、说一下 hashmap,为什么底层用红黑树,为什么在节点数目为 8 时链表才转化为红黑树,不从一开始就用红黑树存储呢?

有赞二面(项目为主)(45 min)
1、自我介绍
2、问项目
3、说一下你对推荐系统和广告系统的理解?二者有什么差别?大数据的应用层面来说,还有哪些应用?
4、spark 中三个表进行 join ,会有几个 stage?共有几种情况(大小表的情况是不相同的)
5、Hive 的数据倾斜问题?起因,各种情境下该如何解决?
6、系统性的工程项目做过没?想问有没有一些平台研发的经验(比如搭环境)
7、近期有没有做什么规划,平常是如何学习的?6、算法:判断链表有环存在

有赞三面(项目为主 )(40 min)
1.自我介绍
2.用户标签提取的 LDA模型讲一下?
3.你认为你这几个项目中做的最有成就感的是哪件?我说了实习的项目,q:其他人没有人想到吗?你是怎么想起来这样做的?实习中最兴奋的事情?
4.kafka 的高吞吐是如何实现的?
5.你用 hive/mysql/kafka/es  这些做过哪些事?

反问:业务场景和技术栈
面试官说了很多,推荐系统和广告系统都在做,主要是服务于商家的,大概记不清了 
有赞四面(45 min)
聊的挺开心,都是常规问题。

更多模拟面试

全部评论

(6) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐