首页 > 字节数据产品面经
头像
liweipace
发布于 2021-07-15 23:56
+ 关注

字节数据产品面经

字节数据产品日常实习面经

面试时间:2020-08-19
当时编辑了面经,但是忘记发出来了。刚好今年转正之后部门仍然需要招日常实习,于是来捞人,顺便分享面经

实习以及校招内推链接

数据产品日常实习链接(工作内容参考链接内容):https://people.bytedance.net/hire/referral/position?job_post_id=6781271108449470733
校招研发提前批也可以点这个~私信可以随时跟踪进度~https://jobs.bytedance.com/campus/position?referral_code=5A4NTH3

面经

一面

一面面试官刚好后来变成了mentor

  1. 自我介绍和项目介绍

    • 上一个实习公司和当前的数据产品差距比较大,所以问的很少,我自己blabla讲了5分钟
  2. 之前做数分,为什么选择做产品

  3. 如果浏览量下降的时候应该怎么分析

  4. 提到了维度和指标,这两个词是什么意思,你的理解,简单叙述

  5. 你对数据产品的理解,什么是数据产品,简单叙述

  6. 你对互联网产品的理解,我完全懵,就聊了两句

  7. 用过superset吗?没有

  8. 如何设计一个广告产品的预警系统:完全懵

    • 我给了一个反作弊的方案,比如监控一定时间段内高频点击或者相同ip的重复点击,但是面试官关注的似乎不是这个维度。她想要的是一个系统性的预警体系。看我方向不对,就没有继续追问下去了。
  9. 问了时间序列的了解,有没有用过ARMA和ARIMA。

    • 之前有用过ARIMA一次,所以简单介绍了之前的思路和ARIMA的逻辑。
  10. 考了一道sql简单的两张表连接group by加order by,然后提了另一种思路,就是用window function rownumber()去取得相应的数据。追问说rownumber这种方式和直接order by谁的效率高,我认为还是order by快啊,没有相同排名的时候没必要引入多余的计算。

  11. 讨论简历里关于kmeans分类的问题

    • 为什么不用linear regression,我是认为多元线性模型在没有现实理论基础的情形下是没有可靠性的,可以尝试,但是kmeans在这类问题中会更加适用
    • 结论部分是不是有些小问题,经过讨论,确实是写的不够严谨,有点仓促了。

    总体感受:还是关注简历多一点,简历不相关的不会管,其他问题都是大概的问一下了解程度,然后引导着谈一谈思路,完全不了解的也不会逼问,总体体验很好。小姐姐很nice也很专业。

二面

leader面

  1. 自我介绍
  2. 项目介绍
  3. 简历情况梳理
  4. 简历项目的负责情况
  5. 如果搭建一个数据产品,怎么设计
    • 我按照tableu的思路讲了一下
    • 追问了一下最终的dashboard要设计成什么样子
  6. 简历的可视化项目挖掘,对一切都感兴趣,应该是比较关注细节,聊了很久,但是毕竟自己做的东西还是比较熟悉

三面

大组老板面

问题与数据分析的面经比较类似,问的问题都是比较典型的字节题,时长只有25分钟,也是最短的一面。

  1. 自我介绍

  2. pyecharts的数据产品是怎么完成了,为什么这么做,你在这个东西中做了什么

  3. 平时使用的app:抖音,b站

  4. 以b站为例,如果上线新功能做测试,如果选取500万做测试提升10%但是最终上线1亿用户只能提升1%为什么?

    辛普森悖论,用户选取的偏差导致了分布不均匀,效果不理想。500*10%+9500*0.5%得到的效果确实不是特别好。

    • 那么如何解决这种选取偏差

      可以通过定义用户画像来对用户做分类

    • 分类之后如何判断这个分类是合理的?

      对每个类别选取5%的用户组成500万这样一个群体,然后对我们的指标做计算,比如我们关心用户单次观看时长,那么就要保证这500万的平均时长和总平均时长一致。

  5. 如果DAU下降怎么分析?

    • 数据准确性
    • 数据季节性下降趋势
    • 不同群体的类别分析,是否是特定用户群产生了这样一个问题,从年龄地区等角度
    • 技术上有没有新功能和bug,运营上有没有新的活动

三面之后过了一周就发了offer

全部评论

(2) 回帖
加载中...
话题 回帖

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐