首页 > 23届数据赛道秋招面试记录(以及一些经验教训)
头像
你们数理基础也太扎实了吧
编辑于 2022-12-13 21:20 江苏
+ 关注

23届数据赛道秋招面试记录(以及一些经验教训)

12-11更新

美团开的太低 拒了,滴滴泡死,10月底回归0offer转战国企二度秋招,整个11月都焦虑的睡不好觉,12月之后陆续来offer了。

现在手上的offer:

农总信用卡数据策略

银联数据建模工程师

上银总数据分析

亿联银行风控策略

吉利产品经理(已拒)

平安产险数据管培(已拒)

京东数据分析(已拒)

还有一些中小银行

流程中的:

上汽大众信息系统 终面完

北京银行数字化转型 终面完

民生上分数据策略 终面完

另外 之前最想去的度小满中间确实把我捞起来了,大老板面没把握好 挂了

国企、银行的面经没什么好写的,都是很简单的技术题+半结构,主要还是看简历吧,像农总、北银、民生一面都是伪群面,对你的经历感兴趣就会一直问,这种一般有戏,也遇到过少数几个人一次都没被问到。

秋招现在可以结束了,打算在前面4个里选一个

再说一下整个秋招过程中自己作死的地方吧,美团的oc其实拿的很早,9月10号之后就没怎么参加面试了,拒了几个中小互联网的笔面,算是all in团子,结果10月中旬开出侮辱价的时候整个人是奔溃的。。。这时候再开始投简历很多好的公司早就截止了,之前拒的那几家也舔不回来了,所以不管前期拿到多好的offer在没开奖或者没签三方之前一定不要轻易拒绝面试和放弃投简历。。。。

-----------------------------------

10-12更新

找了一份快手的实习

快手-数分实习 一面

1、简历

2、三道SQL,hard,用到很多冷门函数,concat_ws,lateral view explode,split,from_unixtime,percentile

3、短视频有两个优化方向,清晰度和卡顿率,如何找出每一个方向的敏感用户?如何分配资源能使ROI最大?

4、卡顿率上升如何分析?

5、如果刚才你提到的所有维度都上升了,怎么分析?

6、卡顿率到多少的时候要预警?如何确定这个阈值

7、AB相关

8、如何评估美颜功能对消费指标的影响(这里是个坑,前面问了这么多AB就是想让我跳AB)

快手二面

  1. 挖项目挖得太深了
  2. 怎么搭建系统优化指标体系
  3. 体系还能补充吗,要想一想我们做优化的目的是什么

-----------------------------------------------------------------------------------------------

bg211统计,三段数据实习,求职方向数分/数挖/风控。一共收到3个of:美团、anker、携程,滴滴还在排序,头部三家颗粒无收,不过今年的大环境拿到团子已经很满意了。回馈牛客写几个还记得的面经.

经纬恒润 数据分析一面 40min

1、简历中的项目

2、机器学习相关:

决策树三种算法哪些是二叉树;什么情况下要用信息熵增益率;特征是连续的情况下怎么划分子节点;rf随机在哪;rf怎么得出的特征重要性;rf调优的时候调的参数

bootstrap没被采到的样本量的极限值

smote处理

特征工程

3、SQL + python

SQL去重的方法,说五种

有两个列表,如果a列表中的某两个元素加起来等于b中某个元素,则记录下这个元素并统计相加频次,不能用遍历。

4、期望工资

问的都是数据挖掘方面的东西,面的还可以但无后续,应该是我报价报高了

猿辅导数分 一面45min

  1. 挖简历
  2. ABtest样本量、怎么保证实验组和对照组变量都控制住了、HASH算法分桶怎么做
  3. 逻辑回归建模过程、调优过程
  4. 调优的时候每个参数只能得出一个TPR和FPR,那么ROC曲线为什么会有这么多点(以前还真没注意到这个问题,基础不牢。。)
  5. 时间序列乘法预测怎么做
  6. 评估线下广告投放是否有效
  7. 怎么保证样本没有区别,看什么指标
  8. 假如不对广告做ABtest怎么评估(我说的合成控制,面试官好像不满意)
  9. 评估一个学生上课的效果

泡池子之后被捞,有了美团就拒了

字节一面-Data 数据分析 50min

1、挖简历

2、介绍喜欢的APP--B站(这里就是给自己挖坑了,明明这道题准备很充分,但是为了表现出对字节旗下产品的认知,随口说了一句抖音和b的视频时长不一样,下面就被抓着问了。造孽啊)

3、如何判定长视频和短视频对用户打开APP频率和使用时长的影响?

4、AB怎么做,如何保证用户只看到长视频?

5、B站关注对于UP哪些指标有影响?怎么验证?

6、AB怎么做,怎么保证分到实验组的都会关注?又如何保证用户是因为粘性高才使用的关注这个功能,而不是因为关注了才粘性高?怎么排除这种影响?

--matching

7、B站为什么要做电商?

8、B站首页上了广告引流到电商除了对B站的营收有影响外还会有哪些利弊?怎么验证?

9、一增一减怎么权衡

10、反问:

--负责国际化电商业务

字节是特别重视产品sense的公司,全程怼业务case,346都是为了引导我说出有混淆变量造成的自我选择偏差,所以没法做AB,问到第六个问题才反应过来要用matching。。。总的来说字节的面试官都很好,会不停的引导,奈何自己太菜了,确实不配进字节。。。。

美团一面 -网约车风控 70min

  1. 挖简历。我们在一个指标搭建的问题上出现了一些矛盾,我坚持自己是没问题的,在接下去半小时里我们一直在讨论这个问题。。。最后实在不想和他扯了,说了句恩恩是的,确实是我错了。。
  2. 如何通过数据识别作弊用户
  3. 两道概率题。第一个题目忘了,硬币抛来抛去;第二个是一条绳子随机砍两刀,能组成三角形的概率。

这是我面过最长的一场了,主要是光battle就花掉了40多分钟,不光争我还和他辩了,面完觉得自己铁定凉,招聘公众号都取关了。然后四天后发来了二面通知。。。可能是觉得我有辩证思维,还很敢说??

美团二面45min

  1. 挖简历,挖的挺浅的,但是每一段都挖了
  2. 网约车作弊的场景有哪些?
  3. 司机刷单造成的后果,除了钱?
  4. 这些场景怎么识别作弊用户?怎么从数据佐证?
  5. 反欺诈检测可以用哪些算法模型?样本不平衡怎么办?
  6. 刷单量上升怎么分析?
  7. 风控指标体系如何搭建?

8、了解过黑产吗?

9、职业规划

反问:

1、疫情对网约车风控规则制定的影响?

2、团队组织架构

HR面30min

压力面,最慌的一场面试,给我吓出冷汗

  1. 挖简历,(现在的hrbp都懂点业务,所以最后一面简历相关还是要准备下)
  2. 你的优点,说一半给我打断了,你真的有好好审视自己吗
  3. 领导对你有偏见怎么办
  4. 上一段实习的收获?还有呢,还有呢
  5. 为什么做冬奥志愿者?花了8个月在冬奥会怎么衡量你的时间成本?

隔天收到OC

快手 一面60min

最无语的一场面试,明明投的是数分岗,结果分到一个做战略的面试官,全程问的都是宏观问题,给我感觉像是在面商业分析

  1. 挖实习
  2. 为什么滴滴觉得自己能做社区团购?
  3. 预估一下滴滴的份额
  4. 滴滴社区团购为什么会失败?一直问还有呢
  5. 为什么其他公司社区团购还在做?除了有钱呢?
  6. 怎么看待快手还在亏损?
  7. 两道SQL,一个是求75分位数,一个是求留存率

反问

我看他这么懂战略我就说快手做中心化分发在热点打造上会落后于抖音,为什么算法上还要坚持中心化?结果这面试官反将我一军让我说我的看法……

快手算是DA/DS人的dream company了,但是寄的很彻底,看了其他同岗位的面经,都是很正常的业务数分,气死……方向是内容安全,网传hc=1但是已经看到不下五个人面完三面了,池子之大瞬间觉得一面挂了也没啥可惜的

Anker 数字化营销 一面40min

  1. 挖简历
  2. L1正则为什么可以降维,从损失函数和求解路径回答?
  3. ABtest怎么保证样本平衡
  4. 哑变量one-hot怎么做
  5. 分别线下和线上投放广告,怎么衡量效果?
  6. 多平台的电商,用户会出现A平台浏览B平台下单的情况,这种怎么衡量每个平台的转化?怎么跟踪?
  7. DA和DS区别
  8. 最近看了什么书
  9. 职业规划

anker 二面 30min

都是行为面问题

HR面三天后OC

携程 商业数据分析一面30min

  1. 挖简历
  2. 业务方的需求是怎么沟通的
  3. 项目里的ABtest场景是什么
  4. 门票收入下降怎么分析

携程二面30min

ld面,没问什么业务,知道我是ENFP之后他花了10多分钟来解读,说话风格也很搞笑,非常轻松的一场面试

HR面一周后OC,面试官介绍具体业务的时候给我的感觉有点dirty,考虑了下还是拒了,给更需要的人吧

贝壳 一面30min

  1. 挖简历
  2. 逻辑回归和随即森林原理
  3. AAtest的目的
  4. 分布式计算了解过吗,给你一个50g的文本文件,统计词频的mapreduce怎么写,讲一下思路
  5. 一道SQL
  6. 职业规划

反问:

我问了句有没有人说过你不管声音还是长相都和李诞一摸一样,哈哈哈哈哈

贝壳 二面30min

ld面,也是一些行为问题,问了对房地产市场的看法,对互联网寒冬的看法,自己的沟通方法,数据分析师要具备的特征,职业规划。

贝壳 三面 10min

大boss面,说是前两轮的面试官和他同步过我的表现了,所以基本没什么需要问的。。。。双方各问了两个问题意思意思,10分钟结束。

贝壳还挺刺激的,这轮通过会5分钟之内告诉你,让你继续等下一轮,一下午面完所有轮次

排序挂,emo好几天

滴滴 产运(保险方向)一面 30m

  1. 简历
  2. 8月和9月哪个月理赔的人更多,为什么?
  3. 估计北京共享单车数量
  4. 既然从需求端考虑的话你还要考虑一个因素,再想想

(想了一下是共享单车停车点的可容纳数量要大于需求数量)

  1. 从供给端考虑呢
  2. 如何科学的计算这些单车里小桔单车的比例
  3. 一道箱子和球的概率题,一道计算连续登陆的SQL
  4. 喜欢什么样的领导和工作氛围

滴滴二面

  1. 简历
  2. 数据分析最重要的几个素质
  3. 保险如何定价,建模考虑哪些因素
  4. 对互联网保险的看法

后面就交流了一下DA和运营的gap以及发展前景,面试官也说了说自己对互联网金融的看法

还在等滴滴结果,也不想再面试了,比这几家好的基本都挂完了,比这几家差的笔试都懒得做了,国庆后准备开躺。。。。。然后碎碎念一下,特别想拿的of其实是微众和度小满的风控策略,但是给我笔试挂了,度小满甚至一二志愿笔试全挂,他真的我哭死……这两家笔试选择题基本全都在考数理统计,简答题也是数据挖掘和场景case或者算法,难度略大。

更多模拟面试

全部评论

(8) 回帖
加载中...
话题 回帖