首页 > 数据开发(数据研发)秋招总结
头像
牛客916304435号
编辑于 2022-05-13 18:05
+ 关注

数据开发(数据研发)秋招总结

已更新

1.个人情况
本硕统计
算是从数据分析转到数据开发
去年读研前暑假看了点计算机编程相关,之前基本不会这些,只会excel/spss点点点。
有过一段小公司的实习,算是数据开发相关的,面试时候会有聊到。

2.投递情况
投递:40余家 基本都全是互联网企业 岗位基本都是数据开发
笔试:有赞、美团、京东、兴业数金、盛趣游戏、小米、杭州端点网络、爱奇艺、keep、网易游戏、网易、去哪儿(未做)、腾讯(下周)
面试:快手、美团、京东、正保教育、茄子科技(拒)、兴业数金(拒)、网易、keep(拒)、携程
结果:快手(已offer)、京东(已offer)、美团(已offer)、网易(hr面挂)、正保教育(已意向)、携程(已offer)

3.相关技能及看法
3.1 计算机基础
本人非计算机科班,秋招也没背那些八股文,操作系统和计算机网络差不多算是一无所知,很多基础课打算尽快补
数据库、数据结构算法自学,力扣刷的算上重复的题大概在300+左右。

3.2 java/python/scala/shell
读研刚入学的时候,python用的比较多,主要也是pandas/numpy做数据分析。
java自己学了javese、多线程、绘图、集合类这些,AQS、集合类很多源码都看过,自己写起来一般吧;JVM是听课学的,基本面试的题应该能答上,没有jvm调优的经验。
scala是学spark时候学,数据处理神器,很好写,我个人也非常喜欢scala这个语言。
shell看着笔记 算是会写吧

3.3 数据库
本科上过数据库的课,但现在忘得差不多了,只会写写sql。
个人主要学了mysql,包括事务、锁这些,对mongo和redis有了解。
sql题每轮基本都会做,基本都是秒。

3.4 其他大数据框架
我个人对spark和kafka了解稍微多一些,其他一些框架学了蛮多,大概简单介绍下吧。
spark全流程源码基本看下来了,是用scala写的,反复地前进后退看(ctrl+alt+<-/->),看完后理解了也不太会忘,这里强推b站星哥spark,讲的非常深入,给我带来了很多帮助,比如我面试时候回答spark算子相关都是直接撕源码的。
kafka看了生产者端的源码,是用java写的,看完之后对kafka高吞吐有了新的理解,里面涵盖了各种数据结构、java多线程的知识,写的非常牛逼,很清晰。
hive这块是自己搭了简单地搭了一个数仓,学了下数仓维度建模的基本理论,然后自己写写sql。
azkaban、flume、sqoop、hbase这些可能只会用或者是只是了解过。
flink 最近在学,会wordcount了,很多大厂都会用到kafka+flink这个,所以flink还是挺重要的。(再次强推B站星哥flink 和spark视频一样的精彩)

3.5 看法
我之前看了好多帖子,都说大数据组件确实在精不在多,面完感觉其实确实是这样。
面试可能不会直接让你调api,所以建议能对少数几个框架多了解一些。
java基础的话有的公司很看重,有的也还好,我没怎么被追问java的问题。
sql建议多做吧,窗口函数要用的熟透为止,面试时候尽量秒。
八股文我自己是基本没有背,可能个人学习习惯的原因吧,这些东西不理解让我硬背可能我不太能接受。

本人挺菜的,也就写这么多了。祝大家秋招顺利,去到心仪的地方。

全部评论

(11) 回帖
加载中...
话题 回帖

近期热帖

热门推荐