我胖着玩玩

编辑于 2020-04-24 20:52

+ 关注

阿里数据研发四面凉经（备胎中...）

从今年二月份，就一直看数开的各种大神面经，想回馈一下牛客。

起初市喜欢从大量数据中发现有价值的信息，对我而言是非常有成就感的一件事，所以选择了hc相对较少的数开，奈何我太菜，大神太多。

我投的是阿里-CFO数据产品技术部（主要负责阿里财务的数据团队）

4.8 笔试两道编程题

4.11（一面）35min

1、海量数据处理成结构化数据技术难点

2、mapreduce 的热点问题

3、flume 介绍

4、kafka 介绍

5、flume+kafka 为什么是经典组合

6、窗口函数有哪些有什么功能

7、reduce 任务过长 shuffle过长如何解决

8、storm和spark最大的区别

4.12 （二面代码面）1h

1.销售表sales_dtl有城市(city)，销售经理(cbm)，客户(customer)，销售金额(sale_amt)三列字段，请用sql取出每个城市中销售金额为本城市前10名的销售经理的信息。

2、从一段字符串中，把所有大于5的回文子串打印出来，回文子串指正向反向读都一样（例如ABA，1221）。

3、实现一个回形矩阵，输入n，输出为n*n的回形矩阵。

1 2 3 4

12 13 14 5

11 16 15 6

10 9 8 7

附加题：

1、Hie 中列出两种以上长尾问题，长尾原因以及解决方法。

2、Hadoop生态系统中，Hve数据库与Hbase数据库的区别，以及分别适用场景。

4.13（三面）25min

1、HDFS数据一致性靠什么保证

2、HDFS读写流程

3、MYISAM和InnoDB比较很有可能继续往下问B+树

4、平衡二叉树算法时间复杂度

5、NP问题 P问题

6、Hadoop 用的什么发行版型

7、HA配置中节点信息同步靠什么

4.15（四面）40min

1、自我介绍简述获得奖项的经历数学建模互联网+等比赛

2、介绍项目主要做的工作用到了哪些技术栈

3、数据如何进行处理的特别涉及用户隐私 userid字段如何处理

4、spark 与 hadoop区别

5、介绍一下storm

6、推荐算法分类算法聚类算法回归算法

7、CNN和RNN的区别

8、以后的工作方向实习时间

然后就没然后了，昨晚实在忍不住了，给内推人发消息了，得到如下回复。

希望有经验的大佬们给我一些意见，是继续等待还是换部门，毕竟春招要结束了。

另外阿里给我的感受就是做大数据这个方向，整个hadoop生态圈的所有组件基本都要会，然后再学精一两个。

项目很重要，基本每轮面试都会有，项目不好，那面试就是海阔天空问你了，项目好了，聊上半个小时项目，面试结束哈哈哈。

发帖还有一个原因，想寻找一些同是计算机专业的同学，有意年底考选调生或公务员，愿意与之交流。

最后的最后，都说发帖子许愿灵，看在我码字这么长时间，许愿早日被捞起吧。

已采纳

采纳

精彩回帖

精彩

全部评论

(12) 回帖

加载中...

话题同步到我的动态回帖

阿里数据研发四面凉经（备胎中...）

更多模拟面试

已采纳

精彩回帖

全部评论

推荐话题

近期热帖

近期精华帖

热门推荐

阿里数据研发四面凉经 （备胎中...）

更多模拟面试

已采纳

精彩回帖

全部评论

推荐话题

相关热帖

近期热帖

近期精华帖

热门推荐

阿里数据研发四面凉经（备胎中...）