首页 > 字节跳动 抖音数据分析 3+1加面的硬核凉经
头像
西瓜不够
编辑于 2020-10-14 14:25
+ 关注

字节跳动 抖音数据分析 3+1加面的硬核凉经

直接从公众号截取辽主要部分过来,排版好像不太好看,so完整的4面凉经整理可以戳:https://mp.weixin.qq.com/s/Hdmw_yJ_Tyr2wXK85AJcDA


安排好了国庆出游的详细计划,以为面试进程走到9月30日能一路过关斩将地等到oc。却略意外地 在去修理杂毛💇🏻‍♀️的路上收到感谢信。很遗憾,本想连夜赶出"国庆前一天收到抖音oc是什么体验" 的推文,delay到现在变成"国庆前一天收到抖音感谢信是什么体验"

一面   Date:9.10

被hr捞起时告知,需要进行至少三轮技术面,而且每一面都要coding,实在没想到竟然是真的...

1. 实习经历较多,策略、内容等的数据分析,更想做哪一块?

跟业务比较贴近的数据分析,从业务里发现有价值的研究方向,给出数据结论,和产品运营一起推动方案落地,形成闭环

2. 介绍实习经历里最系统性的一个分析case

3. sql 20min
  • 连续登陆两天及以上的uid
  • 连续登陆10天及以上的uid

很经典的数分面试sql题了,当年面yy也碰到辽。太久没写以致于手生,花的时间有点久…

4. 龟兔赛跑:25只乌龟,选出跑得最快的3只。每次只能5只一起赛跑,至少需要比赛几次一定能选出3只? 15min

算是比较经典的智力问题了,年初找实习的时候看过。不过面试时没有一点印象,从最基础的思路开始凑,用了15min才解出面试官想要的答案orz

赛马经典问题:5+1+1 = 7次

5. 一个圆上选3个点构成三角形,分别是直角、锐角、钝角的概率是多少? 15min

被问懵辽,本来以为是个几何概率问题,列了一堆方程差点以为自己在做高中解析几何,后面查了知乎大佬们竟然是用微积分来解,还有用几何原本和测度论解的,突然想给我本科的老师们道歉 🙇🏻‍♀️

答案:锐角三角形1/4,钝角三角形3/4,直角三角形0. 有兴趣的朋友自行知乎哈~

6. 反问:
  • 数据分析具体负责哪块业务? 提升用户体验、减少页面卡顿
  • 抖音/火山整个app还是某个细分频道? 整个

二面  Date:9.18

1. 实习中最有价值的case 11min
如果让你重新做一遍,不考虑时间和人力成本,你觉得有哪些可以优化迭代的地方?

2. 用到的数据表一般是hive还是mysql?用hive执行任务时有哪些优化的空间?

3. 解释一下:ab test、假设检验、P值、T检验
4. sql:
  • sort by和order by的差异
  • distinct和group by的原理,什么时候可以替换?
5. 指标构建题用得最多的短视频或者长视频软件?选用5个最核心指标衡量这款app整体发展状况说明理由,以及没选的指标的理由
芒果TV
  • 月活、用户日均停留时长、MAU/DAU(聚合指标 反映用户粘性)、会员数、总收入
  • 没有选取其他指标的原因:完播率、弹幕使用情况、top综艺里是否会员观看的占比
6. 然后接着草草问辽几个问题:学过什么编程语言?数据清洗 etl了解吗?数据结构学过吗?
我:看过网课
面试官:那算了…
哈哈哈哈哈所以网课的质量真的这么辣鸡嘛 不 是我学得辣鸡✊🏻
7. 数据治理可以从哪些方面做?
没怎么了解过,就先顺着问回去:您所说的数据治理具体指什么?
面试官:这是我想问你的呢,“提高公司的数据质量”
然后就让我按自己理解的讲一下:
  • 流程:监控:数据从上游表产出,报警机制及时监控数据是否及时产生、描述统计监控数据值是否异常
  • 如何提升数据质量:上线前多方交叉校验(弱相关)、黑盒化的数据结果不能直接使用,需要策略进行兜底
  • 算法:异常值、异常点的排查

💡后面查资料了解到:

从目的来讲,数据治理就是要对数据的获取、处理、使用进行监管(监管就是我们在执行层面对信息系统的负反馈),而监管的职能主要通过以下五个方面的执行力来保证——发现、监督、控制、沟通、整合。

8. 反问:
  • 数据治理:主要方向比较多比较虚,实践后会更了解
  • 指标构建题有什么更好的思路:开放性问题,言之有理即可 面试官提到视频app一般会关注DAU而不是MAU,我表示芒果做综艺比较多,而综艺大多数是周更,日活的波动可能会比较大
  • 对于短视频来说,核心指标会有什么不一样? 我理解完播率对短视频来说是很重要的,面试官表示重要但排不到前5,具体是哪些指标,等我有机会来抖音工作就知道了 😑
  • 具体业务:体验中台


三面  Date:9.18

二面完等了十分钟就三面,主要围绕我的实习经历展开,面试官一直在diss我实习case的价值和可行性,以及方案后期的结果校验。说不上压力面,但确实没有前两面轻松。最后问了1个sql题+1个智力题,字节真的太喜欢问智力题了orz

1. sql:

选出每个video_tag下观看人数最多的3个视频(一个视频对应多个标签)

表:user_video_view_log

字段:uid  vid  timestamp  video_tag

2. 100层楼,2个皮球,n层以上会摔破,最少需要多少次检验出n

答案:14

答案直接转大佬的帖子:https://www.nowcoder.com/discuss/510567


四面  Date:9.23

听说抖音没有hr面,然而在三面完的周日晚上,接到hr电话表示要加面。orz 最后挂在加面

1. 你觉得数据分析需要具备哪些能力?
  • 软实力:数据敏感度、数据可视化、保持学习的态度、总结回顾和复盘、抗压能力(探索性分析工作没有固定方向)
  • 硬实力:逻辑清晰、常用模型的掌握、理解业务、经验积累;工具:sql、python、r、matlab、可视化(tableau、各司的分析工具)

2. 最近遇到的很困难的事情?怎么解决的?

职业规划的迷茫
  • 先尝试:不一定知道自己想做什么,但一定可以知道自己不想做什么
  • 提升自己的实力:在选择的时候不是我能做什么,而是我想做什么
  • 选择:“更不会后悔”的那一个
3. 从字节去腾讯的原因?
  • 日常实习和暑期实习的差异
  • 6个月才能答辩,不确定性更强
  • 鹅的转正offer+2段实习经历,竞争力更大

4. 两家公司怎么选择?

都是top级公司,应该基于具体部门比较

5. 你发现的业务问题,但不是你职责内的工作,你会怎么做?怎么推动事情落地? 8min

上个问题提到相近的工作会overlap,而字节对所谓的工作边界是弱化的。所以这个问题还问了挺久的,面试官很在意推动事情落地的细节

6. 实习case展开 14min

7. 用python计算两个变量的皮尔森系数

8. 设计抽奖的奖盘概率:每次抽奖花费10金币,下面是所有奖品对应的金币。如何设计奖盘 让前3次抽奖的roi=0.6 16min

我实在没get到这个问题在考啥,我觉得3次抽奖的roi=0.6 和1次抽奖的roi=0.6 没啥区别,大佬有想法欢迎交流 🙆🏻‍♀️


9. 反问环节,没有问到什么有价值的信息,工作方向是抖音直播的算法策略(送礼、抽奖)


经过国庆长假的调整,回头整理恍如隔世。不知是秋招的难度本身比实习大,还是更多来自团队的差异,再看一遍这些问题仍然没觉得有变轻松。
和抖音无缘辽,也把4面凉经share给大家,复盘整理 越挫越勇 冲冲冲~

更多模拟面试

全部评论

(8) 回帖
加载中...
话题 回帖

相关热帖

近期热帖

近期精华帖

热门推荐