农行一面:(线上面试,10min)
自我介绍
项目介绍+挖研究点
系统中用HIve的版本,用的是什么引擎?进入系统后,提示什么?
命令行连接进入hive是什么命令?
hive在实际应用中会出现什么问题?有什么可以优化的?如何优化?
数据倾斜问题出现的原因?如何解决?为什么?
建外部表语句是create table +()什么东西?为什么?
kafka是怎么消费数据的?
kafka的time-wait 参数默认是开启的还是关闭的?
sql和RDD的区别?
dataset和rdd的区别?
sparkstreaming代码是怎么拉取数据并实现实时统计的?
能够引起shuffle的算子有哪些?
给你一张大表、一张小表,如何连接?
农行二面:(线上面试,8min)
自我介绍
介绍项目+挖研究点
项目一中,承担了什么工作?用的框架是什么?
前端用的是什么语言?控件如何实现?接口如何连接?
kafka到hive的持久化保存怎么实现的?
spark发生故障如何容错?
hr:你更倾向于做管理还是做技术?
希望大家都能拿到满意的offer 攒人品~ 攒人品~攒人品~好运快来~
全部评论
(6) 回帖