8.25一面,60分钟
1 自我介绍
2 暑期实习,技术难点,非结构化数据处理,正则表达式,数据倾斜,小文件处理
3 scala与java,hashmap底层源码,final关键字修饰
4 MapReduce工作流程,map的个数是什么来控制的
5 数据库三范式,维度建模相关,星型模型,雪花模型,三种join区别
6 多线程相关,线程3种创建方式,linux相关指令,kafka相关原理
7 SQL题目
1)每个学生课程的平均分数大于95的学生
2)三列数据转换多列数据,case when的使用
3)差集,如何取A-B与B-A的记录
4)累加计算:https://blog.csdn.net/chige0690/article/details/100600612
8 算法题目
1)判断表达式是否是数学表达式,正则表达式+栈+字典
2)奇数与偶数链表,如何取中间的,快慢子针
9 反问环节
8.26二面 60分钟
1 美团实习中遇到的难题,解决的问题。(嵌套的json处理,数据倾斜等等)
2 Hive 实表与维度表,星星模型与雪花模型的优缺点,UDF,UDAF,UDTF分别是什么,sorted by 与order by(全局排序)区别,row_number,case when,union与union all等函数
3 MR过程,默认排序是什么,SQL执行计划,ORC与其他存储的区别,ORC存储格式的缺点,Spark宽窄依赖等等
4 数据库索引,B+树与hashmap的优缺点,B+树的时间复杂度
5 ES倒排索引,ES相关配置,ES的相识度算法
6 快速排序与归并排序原理,时间空间复杂度,优缺点
7 java GC常见算法,常见垃圾回收器,G1垃圾回收器,java锁相关,CAS相关,JVM常见的调优参数
8 linux shell指令pop free
9 还有一些题目我忘记了。。。
8.27三面 80分钟
1 自我介绍
2 项目介绍(实验室项目EEG的疲劳驾驶项目)
3 研究课题,论文相关,为什么选择大数据开发岗位,算法比赛相关
4 美团做的项目,从四个方面来介绍1项目背景 2所属角色 3遇到问题如何解决 4项目产出
5 数仓分层相关概念,hive UDF相关,正则表达式相关问题,特征工程相关,大部分的数仓建设
6 美团、阿里、京东数仓分层区别,美团的相关业务
7 学习工作是否一帆风顺,如何进行学习的,后面就是生活聊天了
8 在校学习的东西应用到工作中没有,学习的最难得课程是什么
9 下周HR面
8.25一面
8.26二面
8.27三面
8.28 性格测评
9.1 HR电话OC
9.2 意向书邮件
全部评论
(2) 回帖