一面:
- 自我介绍
- 数仓定义、MR过程
- 数仓分层好处,每层功能(数仓必问)
- 实习业务问题
- 场景题,数据倾斜排查思路,一步一步的问的,根据你的回答变化场景
- --表:friends
--字段:requester_id:请求者的id,accepter_id:接受者id
--数据形式
-- request_id accepter_id accept_date
-- 1 2 2016-06-03
-- 1 3 2016-06-08
-- 2 3 2016-06-08
-- 3 4 2016-06-09
写一个查询语句,求出谁拥有最多的好友和他拥有的好友数目。对于上面的样例数据,结果为:
id num
3 3
- 自我介绍
- 数仓相关八股文
- 实习期间比较满意的项目
- 问了我实习公司的使用的平台集群配置相关的问题,后来才知道面试官也是从我实习公司出去的
- 一道简单的sql题
- 反问:国家现在出政策,对游戏有所限制,字节如何应对?为什么还要投资游戏行业?
- 整体二面比较轻松,回答得也还可以
三面:
- 自我介绍
- 游戏业务,问了我MMOG是啥,第一次接触这个词汇(这里是自我介绍给自己挖坑了,因为是面游戏业务部,提了自己在了解字节游戏)
- 问了平时玩什么游戏
- 问了HBase架构、Hive如何从SQL到结果输出过程是怎样的?
- Hive与Yarn是如何交互的
- 实习项目
- 如何量化评判一个数仓是好的数仓
- HDFS的架构,HA是如何实现
- HDFS块大小,不同版本大小不一样,为什么不一样?为什么要改进变大?
- 两个联合主键表关联,性能越优越好
全部评论
(3) 回帖