岗位
- 大数据开发工程师
- 京东数科-数字共享平台
时间线
简历(7.09) -> 一面(7.14) -> 二面(7.16) -> HR面(7.23) -> offer(7.31)
一面(7.14-50min)
面试官1
- 自我介绍
- 实习主要工作内容
- 数据仓库是怎么分层的?
- Hadoop生态圈的了解?
- 数据任务的执行引擎用的哪些?
- 什么情况下数据任务需要优化?
- 数据任务是怎么优化的?(数据倾斜,参数相关调节)
- 详细说下数据倾斜怎么解决?
- 介绍下MR过程?
- 什么是小文件?很多小文件会有什么问题?很多小文件怎么解决?
- 实习中遇到哪些困难(技术方面的)?
- Sqoop的工作原理?
面试官2
- Hive的优化策略有哪些(列裁剪、谓词下推)?
- 一般会采用什么文件存储格式(orc)?为什么?说下orc特点(从列式存储到RCFile,再到ORC。说了相关优缺点)?
- 文件压缩算法有了解吗?
- Hive的原理?
- Spark有哪些了解?(说了下RDD,宽窄依赖,stage划分,运行机制相关)
- MR和Spark的区别有哪些?
- 说下Sparkshuffle过程?
面试官3
- Java有哪些了解?
- HashMap、HashTable、ConcurrentHashMap原理?
- 用过哪些设计模式?
- 说下观察者模式?
- 手撕归并排序(写了5分钟,说了下思路)
- 反问
二面(7.16-32min)
- 自我介绍
- 实习具体工作内容?
- 说下MR过程
- 数据任务优化工作主要对MR哪个阶段进行优化?
- Sparkshuffle于MRshuffle有啥区别?
- Spark运行机制?
- Hive优化参数
- 实习工作遇到什么问题(说了一下由orc文件格式引起的错误)?
- 说下orc文件格式
- 说下parquet?
- 说下压缩算法?
- 说下数据治理?
- 聊天
- 反问
HR面(7.23-33min)
- 自我介绍
- 实习工作介绍
- 公司导师对我的评价怎么样?
- 有什么缺点?
- 职业规划是?
- 只想做大数据吗?还投了别的岗位吗?
- 投了哪些公司?
- 理想去哪三家?为什么?
- 哪些维度考虑公司?
- 京东的了解?
- 期望薪资?
- 反问
总结
- 整体感觉比较基础,没有涉及很难的场景设计和算法。
- 一面二面基本是自己准备过的,面试官也算是手下留情了。
- 运气比较好,只是薪资感觉一般(虽然跟我HR面说的期望薪资一样),offer考虑时间比较短,只有3天。
- 继续努力吧。
全部评论
(7) 回帖