首页 > 京东大数据开发面经(已offer)
头像
Supra-
编辑于 2020-09-08 08:25
+ 关注

京东大数据开发面经(已offer)

岗位

  • 大数据开发工程师
  • 京东数科-数字共享平台

时间线

简历(7.09) -> 一面(7.14) -> 二面(7.16) -> HR面(7.23) -> offer(7.31)

一面(7.14-50min)

面试官1

  1. 自我介绍
  2. 实习主要工作内容
  3. 数据仓库是怎么分层的?
  4. Hadoop生态圈的了解?
  5. 数据任务的执行引擎用的哪些?
  6. 什么情况下数据任务需要优化?
  7. 数据任务是怎么优化的?(数据倾斜,参数相关调节)
  8. 详细说下数据倾斜怎么解决?
  9. 介绍下MR过程?
  10. 什么是小文件?很多小文件会有什么问题?很多小文件怎么解决?
  11. 实习中遇到哪些困难(技术方面的)?
  12. Sqoop的工作原理?

面试官2

  1. Hive的优化策略有哪些(列裁剪、谓词下推)?
  2. 一般会采用什么文件存储格式(orc)?为什么?说下orc特点(从列式存储到RCFile,再到ORC。说了相关优缺点)?
  3. 文件压缩算法有了解吗?
  4. Hive的原理?
  5. Spark有哪些了解?(说了下RDD,宽窄依赖,stage划分,运行机制相关)
  6. MR和Spark的区别有哪些?
  7. 说下Sparkshuffle过程?

面试官3

  1. Java有哪些了解?
  2. HashMap、HashTable、ConcurrentHashMap原理?
  3. 用过哪些设计模式?
  4. 说下观察者模式?
  5. 手撕归并排序(写了5分钟,说了下思路)
  6. 反问

二面(7.16-32min)

  1. 自我介绍
  2. 实习具体工作内容?
  3. 说下MR过程
  4. 数据任务优化工作主要对MR哪个阶段进行优化?
  5. Sparkshuffle于MRshuffle有啥区别?
  6. Spark运行机制?
  7. Hive优化参数
  8. 实习工作遇到什么问题(说了一下由orc文件格式引起的错误)?
  9. 说下orc文件格式
  10. 说下parquet?
  11. 说下压缩算法?
  12. 说下数据治理?
  13. 聊天
  14. 反问

HR面(7.23-33min)

  1. 自我介绍
  2. 实习工作介绍
  3. 公司导师对我的评价怎么样?
  4. 有什么缺点?
  5. 职业规划是?
  6. 只想做大数据吗?还投了别的岗位吗?
  7. 投了哪些公司?
  8. 理想去哪三家?为什么?
  9. 哪些维度考虑公司?
  10. 京东的了解?
  11. 期望薪资?
  12. 反问

总结

  • 整体感觉比较基础,没有涉及很难的场景设计和算法。
  • 一面二面基本是自己准备过的,面试官也算是手下留情了。
  • 运气比较好,只是薪资感觉一般(虽然跟我HR面说的期望薪资一样),offer考虑时间比较短,只有3天。
  • 继续努力吧。

更多模拟面试

全部评论

(7) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

近期热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐