50min
1. 自我介绍
2. 实习经历
描述了在滴滴的实习经历
3. 大数据方面,职业规划
4. 对数据仓库有什么了解?
讲了写与传统关系型数据库的区别
以及其他的一些我所知道的
5. 你认为什么样的数据仓库是比较好的数据仓库?
6. 能讲讲hdfs么
主要讲了下hdfs写文件的过程
7. mapreduce 能讲讲么?具体的过程又是怎么样的?
8. 实习提到经常用spark ,因此问了dag(有向无环图) 生成过程?
9. 遇到过数据倾斜么?怎么样解决呢?
10. hadoop 除了mapreduce 还有其他什么组件?
11.两道sql
给定用户id,文章id,阅读时间
1⃣️ 前五个 阅读量最高的文章
2⃣️ 每个用户 最多连续阅读的天数
感觉问题基本在射程范围内
全部评论
(10) 回帖