首页 > bilibili/哔哩哔哩/B站-大数据-面经(已意向书)
头像
Supra-
编辑于 2020-08-14 11:46
+ 关注

bilibili/哔哩哔哩/B站-大数据-面经(已意向书)

时间线

7.21(简历)->8.6(一面) ->8.11(二面)-> 8.13(意向书)

一面(33min)

  1. 自我介绍
  2. 数仓与关系数据库区别?
  3. 数仓为什么需要分层?优缺点?
  4. 怎么定位任务需要优化?
  5. 如何优化任务?
  6. Hive表数据底层存储在哪?
  7. 元数据存储在哪?
  8. Hive与HDFS之间的关系?
  9. Hive sort by 和order by 的区别?
  10. over() 说下?
  11. Hive执行过程?
  12. 数仓链路很长怎么保证任务有序执行?
  13. 表之间依赖是怎么触发的?(时间触发、版本触发)
  14. 哔哩哔哩up主投稿,对于看稿件这一行为怎么去建模?
  15. 维度建模的方法?优缺点?

二面(27min)

  1. 数仓的作用?除了信息集成,分析决策?

  2. Join有几种运行机制?

  3. MR流程?

  4. 数据倾斜一般有哪些情况?怎么解决?

  5. Map端倾斜原因是?怎么解决?

  6. 事实表、维度表怎么建立?

  7. 建模过程中逻辑模型和物理模型的区别?

  8. combiner的作用?

  9. join的执行计划?

  10. SQL:订单表,金额累积求和

  11. 为什么想到上海来发展?

  12. 最近在看什么书?

  13. 反问

总结

  1. 整体偏向于大数据框架原理和数仓概念,计算机基础考察不多。内容都基于简历。
  2. 一面体验不错,还问了B站等级。
  3. 二面压力面,会反问:确定吗?还有吗?一度以为凉凉。

更多模拟面试

全部评论

(20) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐