自己水硕一枚,不知道二面挂了没有,如果没挂有幸进三面再来update~
一面
时长 30min左右
- 两题SQL
- 第一题用到聚合group by和count 比较单纯
- 第二题用case when 行列转换(没写出来)
自己大学太久没写SQL,所以SQL真的菜,面试官人好好,一直给Hint。题目都是单表,没有用到JOIN。
- 自我介绍
不小心巴拉巴拉说太久,项目那一块自己讲太细了。这位面试官prefer简单的介绍3-5min能完成的。 - 针对自我介绍提问
- 项目
问了自己做的一个关于商品co-purchasing prediction的- Imbalance 如何处理(类别)
- 回答:上取样,下取样,加大分错少类别的惩罚权重
- Imbalance 上下取样哪个比较好
- 这个项目特征工程如何做的
- 用了哪些模型去做预测
- 那Decision Tree,RF和XGBoost区别
- Imbalance 如何处理(类别)
- 项目
- 统计及场景应用相关问题
感觉很A/B test呀- 了解A/B test吗?(自己对A/B test 真的无知呀,看到岗位要求会A/Btest最好,就面试前,去知乎瞄了几眼)
- 回答:听过,但是没有具体做过,看到它的做法和原理比较依赖基础的统计学,而基础的统计学原理自己都有涉及。
- 用A/B test如何说明产品上线后有效或者比较好
- 用t or Z test 看p value是否能说明问题显著性
- 如何确定A/B test的样本数量?
- 回答,蒙了,开始瞎猜sample越多越好,借鉴前case经验。面试官又一次太nice,给hint,从统计学原理上想想。自己想到了Z检定的公式有个N,就去用这个猜了,好像真猜对了部分~
- 中央极限定理是什么
- 了解A/B test吗?(自己对A/B test 真的无知呀,看到岗位要求会A/Btest最好,就面试前,去知乎瞄了几眼)
———————————————————————————————————————
二面
时长 30min左右
- 说说和应聘岗位相关的经历及个人介绍
- xxx开始大概介绍
- 说到项目的时候开始提问
- 先说了一个做的语音分离相关的project(面试官想听细节,因为preprocessing 同学做的,所以重点放在介绍模型的建立上面)
- 面试官问有没有其他和数据分析相关的项目
- 特征工程怎么做的
- LR 和 K-means区别(首先一个是分类一个分群,说了说分类和分群的区别,再分别说LR算法和K-means算法怎么实现的)
- 对于你这个项目是特征工程比较重要还是预测模型比较重要,为什么(这个就按照做的实际情况说)
- 线上写题
- 一题SQL(依然单表,但是挺多条件限制,有个条件限制不会写)
- 一题简单的python OR R 题 查找数量题
- 思维题
两面不同重的硬币,如何公平投掷 - 场景应用题
- 做根据打的文字出现做微信下载的表情包的推荐?(分析了一通表情包本身的资讯,用户的资讯,聊天内容上下文的资讯,聊天对方的资讯,纯属瞎猜XDDD)
- 用什么指标衡量新的推荐产品有效(猜了点击下载量呈现显著性)
- 最后面试官问我还有什么问题
———————————————————————————————————————
End 结束面试官说再见还挥了挥手,感觉又一个很好的面试官~ 虽然自己菜很多答不上来。
PS:腾讯的面试官人都好NICE,最后两个面试官都给了自己很中肯的建议(过不过都想感谢两个面试官),不过还是真心求来个三面ya~
OS: 自己一紧张不小心把说话速度飙到2-3倍了,哭了,事后才反应过来,希望面试官不要介意
SQL是真的菜呀,考一次,总要倒点什么~
全部评论
(7) 回帖