从今年二月份,就一直看数开的各种大神面经,想回馈一下牛客。
起初市喜欢从大量数据中发现有价值的信息,对我而言是非常有成就感的一件事,所以选择了hc相对较少的数开,奈何我太菜,大神太多。
我投的是阿里-CFO数据产品技术部(主要负责阿里财务的数据团队)
4.8 笔试 两道编程题
4.11(一面 )35min
1、海量数据处理成结构化数据 技术难点
2、mapreduce 的热点问题
3、flume 介绍
4、kafka 介绍
5、flume+kafka 为什么是经典组合
6、窗口函数 有哪些 有什么功能
7、reduce 任务过长 shuffle过长 如何解决
8、storm和spark最大的区别
4.12 (二面 代码面)1h
1.销售表sales_dtl有城市(city),销售经理(cbm),客户(customer),销售金额(sale_amt)三列字段,请用sql取出每个城市中销售金额为本城市前10名的销售经理的信息。
2、从一段字符串中,把所有大于5的回文子串打印出来,回文子串指正向反向读都一样(例如ABA,1221)。
3、实现一个回形矩阵,输入n,输出为n*n的回形矩阵。
1 2 3 4
12 13 14 5
11 16 15 6
10 9 8 7
附加题:
1、Hie 中列出两种以上长尾问题,长尾原因以及解决方法。
2、Hadoop生态系统中,Hve数据库与Hbase数据库的区别,以及分别适用场景。
4.13(三面 )25min
1、HDFS数据一致性靠什么保证
2、HDFS读写流程
3、MYISAM和InnoDB比较 很有可能继续往下问B+树
4、平衡二叉树算法时间复杂度
5、NP问题 P问题
6、Hadoop 用的什么发行版型
7、HA配置中节点信息同步靠什么
4.15(四面)40min
1、自我介绍 简述获得奖项的经历 数学建模 互联网+等比赛
2、介绍项目 主要做的工作 用到了哪些技术栈
3、数据如何进行处理的 特别涉及用户隐私 userid字段如何处理
4、spark 与 hadoop区别
5、介绍一下storm
6、推荐算法 分类算法 聚类算法 回归算法
7、CNN和RNN的区别
8、以后的工作方向 实习时间
然后就没然后了 ,昨晚实在忍不住了,给内推人发消息了,得到如下回复。
希望有经验的大佬们给我一些意见,是继续等待还是换部门,毕竟春招要结束了。
另外阿里给我的感受就是做大数据这个方向,整个hadoop生态圈的所有组件基本都要会,然后再学精一两个。
项目很重要,基本每轮面试都会有,项目不好,那面试就是海阔天空问你了,项目好了,聊上半个小时项目,面试结束哈哈哈。
发帖还有一个原因,想寻找一些同是计算机专业的同学,有意年底考选调生或公务员,愿意与之交流。
最后的最后,都说发帖子许愿灵,看在我码字这么长时间,许愿早日被捞起吧。
全部评论
(12) 回帖