首页 > 阿里数据研发四面凉经 (备胎中...)
头像
我胖着玩玩
编辑于 2020-04-24 20:52
+ 关注

阿里数据研发四面凉经 (备胎中...)



从今年二月份,就一直看数开的各种大神面经,想回馈一下牛客。
起初市喜欢从大量数据中发现有价值的信息,对我而言是非常有成就感的一件事,所以选择了hc相对较少的数开,奈何我太菜,大神太多。
我投的是阿里-CFO数据产品技术部(主要负责阿里财务的数据团队)
4.8 笔试 两道编程题
4.11(一面 )35min
1、海量数据处理成结构化数据 技术难点
2、mapreduce 的热点问题
3、flume 介绍
4、kafka 介绍
5、flume+kafka 为什么是经典组合
6、窗口函数 有哪些 有什么功能
7、reduce 任务过长 shuffle过长 如何解决
8、storm和spark最大的区别

4.12 (二面 代码面)1h
1.销售表sales_dtl有城市(city),销售经理(cbm),客户(customer),销售金额(sale_amt)三列字段,请用sql取出每个城市中销售金额为本城市前10名的销售经理的信息。
2、从一段字符串中,把所有大于5的回文子串打印出来,回文子串指正向反向读都一样(例如ABA,1221)。
3、实现一个回形矩阵,输入n,输出为n*n的回形矩阵。
1    2    3   4
12 13 14   5
11 16  15  6
10  9    8   7
附加题:
1、Hie 中列出两种以上长尾问题,长尾原因以及解决方法。
2、Hadoop生态系统中,Hve数据库与Hbase数据库的区别,以及分别适用场景。

4.13(三面 )25min

1、HDFS数据一致性靠什么保证
2、HDFS读写流程
3、MYISAM和InnoDB比较 很有可能继续往下问B+树
4、平衡二叉树算法时间复杂度
5、NP问题 P问题
6、Hadoop 用的什么发行版型
7、HA配置中节点信息同步靠什么

4.15(四面)40min

1、自我介绍  简述获得奖项的经历 数学建模 互联网+等比赛
2、介绍项目 主要做的工作 用到了哪些技术栈
3、数据如何进行处理的 特别涉及用户隐私 userid字段如何处理
4、spark 与 hadoop区别
5、介绍一下storm
6、推荐算法 分类算法 聚类算法 回归算法
7、CNN和RNN的区别
8、以后的工作方向 实习时间


然后就没然后了 ,昨晚实在忍不住了,给内推人发消息了,得到如下回复。
希望有经验的大佬们给我一些意见,是继续等待还是换部门,毕竟春招要结束了。

另外阿里给我的感受就是做大数据这个方向,整个hadoop生态圈的所有组件基本都要会,然后再学精一两个。
项目很重要,基本每轮面试都会有,项目不好,那面试就是海阔天空问你了,项目好了,聊上半个小时项目,面试结束哈哈哈。

发帖还有一个原因,想寻找一些同是计算机专业的同学,有意年底考选调生或公务员,愿意与之交流。


最后的最后,都说发帖子许愿灵,看在我码字这么长时间,许愿早日被捞起吧。



更多模拟面试

全部评论

(12) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐