首页 > 2020春季数据分析实习面试回忆
头像
今天也是元气满满
编辑于 2020-06-25 16:09
+ 关注

2020春季数据分析实习面试回忆

1、弯路
前期看到带“数据”的就投了,其实大数据、数据开发/研发和我掌握的数据分析技能是不一样的,他们注重Hadoop、Spark、Java、数仓等技术。我投过的:
  • 字节跳动-大数据实习生(一面挂)
1、k-means算法,常用的距离函数,我说我只会欧式距离和余弦距离,除了距离聚类还有什么聚类,我说密度聚类,但是也不太会。
2、sql题:date字段(20200318这种格式),商品ID,每天的销量,求每个商品每个月的销售总额。
  • 美团-数据开发工程师
灵魂发问:既然你想转数据开发,有为这个想法做过什么努力吗?问了一圈Hadoop,spark都不懂。

2、非常短的面试

  • 网易互娱-数据分析工程师
怎么评估一次活动的收益。
  • 中邮消费金融-数据分析:信用风险模型怎么筛选变量,连续值怎么分箱(卡方分箱,人工判断),为什么收入、消费的信息量不大?
这两个都只面了10分钟,人家都开奖了我也没消息。

3、偏业务型的

  • 网易严选-数据分析
类似于京东plus会员,为什么定价为149元?(我还想问为什么你们网易严选会员定价和京东会员一样呢)
商品页面的点击来源有各个渠道,怎么去分析渠道来源转化。
  • 腾讯PCG-日常-数据分析(已通过)
你认为好的推送内容是什么?
在一个内容被推送前,有没有什么先验指标去评估?
判断一个内容的浏览量,怎么样算异常。(我:假设服从正态分布,均值加减方差划线)样本量很小不能用正态分布呢?(T分布?)面试官没反应。(实在不行就非参检验吧。。。)面试官依然冷漠脸。
app冷启动阶段怎么推送内容?怎么判断推送的内容用户是否感兴趣?(我:点击率,停留时长?)再具体一点?(不会了。。。)

4、算法+业务

  • 阿里-数据分析(二面挂)
简历面-一面-二面,每一轮对简历的提问都不相同,似乎是参考了上一轮的。
简历面:解释相关系数为什么能度量变量的相关性;
一面:模型/项目大家都是这么做的,你什么地方处理的比其他人好?
二面:训练模型的时候准确率达到多少为止?为什么是这个准确率?训练集上表现好,但是实际投放效果差怎么办?有没有一个保底措施?(这个保底准确率应该是根据业务要求的,比如说要获得3000个新增用户,那你预测出的可能这个客户群体,至少要有3000个是真实的目标用户;当然也可以扩大投放范围以获得保底3000个新增,但是会有负面作用)。
二面被怼的很惨,训练模型的时候准确率没想那么多,反问环节问面试官对我的建议:对公司业务流程不熟悉,因为模型准确率是和业务部门息息相关的。他说的确实有道理,我之前实习的时候只关注自己做的事情,很少在意其他部门。大概等了三四天,官网已回绝。
  • 亚马逊-proserve数据科学实习生(三面挂)
亚马逊的面试体验很好,每轮都会打电话提前约时间,而且反馈结果很快。
除了一面面试官问的比较多,大概40分钟,二三面下午连着的,各预订了一小时,但是主要是面试官让我讲,由于习惯了互联网讲几句面试官问几句,导致差不多20分钟结束,他们中间没怎么发问,也不知道是不是他们对我的经历不感兴趣。
如果遇到不喜欢发问的面试官,要自己准备比较长的项目介绍。
  • 腾讯-PCG-数据分析(二面挂)
某天微信登陆人数突然增多,请分析原因。
一轮20分钟一轮15分钟,没什么印象深的,反正就挂了。
  • 腾讯csig-数据分析(已oc)
可能到后期了,一二面每次面试都半小时,而且没有自我介绍环节。
一面:线程和进程的区别,深拷贝和浅拷贝的区别,python中,在函数内修改函数外定义的字典,字典会发生变化吗?
二面:数据不均衡怎么办?(我的回答是,1直接在模型里调参:xgb和lgb都有相应的参数;2训练之前调整正负样本数量);城市机场每2分钟起降一架飞机,估算此时城市上空有多少架飞机。
三面:面试官迟到了几分钟,全程高冷,只让我开了摄像头,非常常规的问题:介绍决策树、xgboost、过拟合的原因、怎么解决;前一段实习经历,有没有对业务、对技术的优化?
前两面都半小时,第三面就20分钟不到,凉凉预定。。。全程也是让我自己介绍那种,之前亚马逊面试的教训还不够,没水够半小时呀。
HR面试:自我介绍,最有成就感的事情,最失落的事情,兴趣爱好,对云计算的理解,老家比较远介意来深圳实习吗?
7分钟不到就结束了,她说时间很赶,也没反问环节,可能她还要面别人。

春招血泪史,记了这么多大部分都杳无音讯了,还是感谢那些发了感谢信的公司让我明明白白。。。


更多模拟面试

全部评论

(8) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

热门推荐