不标题党,面过的岗:
ieg基础研究、pcg后台开发、pcg数据产品、ieg应用研究、pcg数据分析、wxg应用研究、ieg产品运营(已上岸)
直接从公众号截取了一部分过来,排版好像不太好看,so完整的面经整理➕准备路线➕潦草总结的面试方法论可以戳:https://mp.weixin.qq.com/s/abm2wW4VfdTeHU6cFKGqSw
按时间顺序梳理7个岗的面经,以及准备路线,其实就是认清自己的代码能力太菜,逐渐找到更适合自己的岗,幸运赶上提前批上岸吧。
这篇专门讲讲腾讯被捞的7次经历(第一次面到三面,其他全一面挂),字节的两次被捞(已拿游戏数据分析日常offer)、阿里(三面完不知挂没)的面经,之后再整理啦
1.0 ieg基础研究
一面 2020.02.24 30min
1. 每个项目和实习挨着问
当时简历很烂,还有本科记不清做了什么的项目,答得也不熟,复盘整理不详细
2. 你现在实习也不长,为什么要重新找实习?
3. 你可以来实习的时间,感觉你这个实习做的时间并不长
4. 你还有投其他公司吗?具体是什么部门?
5. 你平常玩游戏吗?玩得多吗?我们这边主要是做游戏的,你感兴趣吗
6. 那这三家公司你最想去哪一个?
看具体做什么吧 (害现在觉得应该答肯定是腾讯啊!!)
项目和实习都没有深挖,但简历上有的东西都有被问到。
二面 2020.02.25 35min
1. 工作地点和时间
2. 简历都是数据分析相关,对数据分析的理解
3. 项目经历深挖
4. 实习经历深挖
具体工作
Spark、hadoop分布式了解吗?
指标构建是根据产品提的具体需求做还是有自己的思考?
5. 机器学习算法
随机森林的原理
随机森林是否可以做回归
支持向量机的原理
高维映射除了核函数还有什么
6. 支持向量和逻辑回归哪个对异常点更敏感?为什么?
7. 数据挖掘算法实例
我真没有机器学习项目,把全世界国家菜系的分类大作业拿来讲了 重点介绍了一下支持向量机多分类问题
8. 平常玩游戏吗?玩儿得多吗?段位?还有其他的游戏吗?
9. 碰到过哪些演员?
10. 针对这些演员,数据角度怎么验证他们是演员?(后面面字节的时候也被问到了类似的问题)
击杀、补兵、mvp评分、胜率、队伍完整度
监测队伍聊天数据
11. 是只想做数据分析吗?
因为我觉得自己机器学习算法这一part掌握得不是很好,用的时候调包比较多,小哥说我们主要知道怎么去用,熟悉常见算法的优劣势就行了
12. 提问:
具体工作内容:IEG光子工作室各种游戏的数据分析、机器学习等
如何提升自己:整体来说,简历没突出优点,看得出来你比较细心,简历内容比较全面,但数据挖掘、机器学习建模这一部分不够突出;做数据分析,也需要特别了解算法,机器学习的功底还是有的,缺少实践经验。
三面 2020.02.27 30+20min
惨不忍睹的一次面试,面试官先加了微信约时间。我没想到还有笔试,两道题半小时。一个寒假过去我只会写sql了,第一道直接放弃。第二道瞎编凑了几行推荐系统的基础算法思路。
1.
面试环节
1. 什么语言比较熟悉?
matlab,然后面试官又问了一遍,我还说matlab,面试官说:我不知道问什么了
2. 特征值、特征向量是什么?讲一下SVD
我说我没学SVD,他:不可能吧。。
3. 熟悉的机器学习算法
我准备讲svm,他直接打断我问:知道smo算法吗?为什么要用smo?
天啊我看svm的时候,看见一篇博客里有个smo的链接,幸好我还点进去看了一眼,不过继续追问,我就答不上来了
面完一会官网流程就灰了。害 挫败感太强烈了,不过心态调整很关键呀,当时丧了两三天吧,重整旗鼓,开始恶补数据结构与算法,以及leecode刷题
第二天接到pcg面试官的电话,准备捞我后台开发,我一脸懵逼啊,是我昨天被羞辱得还不够吗?!!我委婉表示自己代码能力不行,昨天也被挂得很惨。面试官:你为什么不再给自己一次机会呢?我。。
2.0 pcg后台开发
一面 2020.03.01 16min
1. 自我介绍
2. 聊简历
然后面试官发现确实不太合适,我简历上:使用Spark、Hive等分布式计算平台,对关键数据日常监控及分析,然而我只是写spark sql啊2333
面试官一直跟我道歉说不好意思,害 挺可爱一面试官
3.0 pcg数据产品
一面 2020.03.05 30min
1. 自我介绍
2. 实习深挖
3. 业务题:腾讯视频首页的广告轮播位,新上广告,怎么分析让效益最大化?(大概是这个意思记得不太清了,我当时连轮播位是什么都不知道。。)
4. 提问: 如何改进:具体的项目经历相对比较少,业务理解不够
这次面试也就抱着试一试的心态,以及想认真准备第二天的数据岗面试,所以比较佛,记录整理不详细。
4.0 ieg应用研究
一面 2020.03.06 53min
1. 项目介绍,搭建的平台可交互性体现在哪些方面?
2. 为什么转数学,又转统计?
3. IT和金融怎么选,为什么?
4. 数据倾斜 和 优化(这个问题被问到多次)
5. python:
用到哪些库
python 中对dict进行查找的几种方式,哪种效率最高( o(1)复杂度)
如何导数据(csv)
6. 大数定律是什么,有什么意义?有哪些假设检验方法,检验的目的?( 被问多次)
7. 学过哪些课程?贝叶斯?
8. 实习时间
9. 分类算法和回归算法总体框架
10. 业务场景问题:一个新游戏,只有三天的充值数据,怎么预测未来180天以及365天的ltv?
这面其实自己觉得还行,流程一直没变,应该是被备胎了,最后拖了一周被挂。
5.0 pcg数据分析
一面 2020.03.11 1hour
1. 自我介绍、实习经历、ccf项目
2. 机器学习算法了解吗?讲一下回归和分类,随机森林和决策树的区别,gbdt和随机森林的区别
3. 特征工程是什么
4. 特征值和特征向量
5. svd矩阵分解
6. pca原理
7. 推荐系统、深度学习
8. 聚类算法了解吗,讲一下
9. 常用的距离 实变泛函忘得差不多了,就提了一下距离的三条性质
10. 概率论与数理统计:点估计,区间估计有哪些,t检验的适用场合?卡方检验?因子分析?
11. 撕代码:圆桌问题 谁能想到面到一半撕代码?!而且是上学期C++的期末原题。。
12. 条件概率题:可以把概率论与数理统计的书翻出来看看,课后题类似
13. 业务题:分析用户行为一般看重首充和留存数据,如果某一天充值比值上涨2-3倍,怎么分析?
14. 提问:
具体工作:pcg 数据研发:信息流、微视之类业务,推荐算法、内容分发;实习生:报表开发、业务指标波动、专项分析报告、固定报表有成熟的分析自动化平台、前端的展示
如何改进:特点是没有明显缺点,比较平均
面试官最后说觉得我还可以,然而转手就把我挂了。推荐系统、svd、深度学习被问到的时候我直接说不会,后来想想什么都不会不挂我挂谁啊。
这个时候接到字节的游戏数分面试,字节的数分都划在产品和运营下,加之数据结构真的太难了,我就开始更多地关注业务相关的知识。然而为了准备突如其来的wxg数分面试,我凌晨两三点爬起来看《推荐系统实战》,天亮的时候勉强看完,太难辽
6.0 wxg应用研究
一面 2020.3.15 40+40min
1. 自我介绍、实习经历、ccf项目
2. 机器学习算法 svm
3. 计算广告、推荐系统、nlp方面的了解,谈了推荐系统(谈得很浅)
4. 两个算法题
找出距离最小的k个
随机抽样:给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。您可以假设给定的数字一定存在于数组中。注意:数组大小可能非常大。使用太多额外空间的解决方案将不会通过测试。
这两个题比较简单,勉强做出来了,不过时间花得挺久的。害 被挂免疫了。
第7次是ieg的产品运营上岸,之前有在牛客发过面经,大家可以直接戳:https://www.nowcoder.com/discuss/391944
有朋友问我数据分析转产品运营会不会有心理偏差or落差,其实腾讯的数分是偏技术型的,我一个本科只会一点matlab的人代码能力还是太菜了。加上自己比较想从事偏业务的数据分析,结合之前向学姐了解到的工作内容,觉得算是现阶段能够得着的一个很好选择啦
潦草总结的面试方法论
结合自己面了二十几场的经验,潦草粗糙地总结一下
1. 岗位契合度
被挂不是代表你不够优秀,只是不够匹配。加之数分本就是万精油专业,如果不目标清晰一点,很容易变成“特点是没有明显缺点”。就像我前半个月,试图花几周时间从数据结构0基础补到能进大厂的水平,太不切实际惹。
所以我们需要根据各大厂数分岗位侧重点,进行选择和取舍。
2. 简历迭代
每次面完试都可以根据被问到的问题,去思考如何修改自己的简历和自我介绍。“先减后加”,保证简历上的每句话都有它存在的必要性,如果没有,删掉。很水的经历不如不写,我第一次面字节就挂在本科一个毫无印象的项目上。
如果你觉得删了之后简历看起来很少,那你更应该思考的是如何增加一些值得写上去的东西。
我前前后后也改了十几遍,字斟句酌,然而能写的东西确实不多。毕竟只有一段一个月左右的远程实习经历,主要工作内容还是“打杂”。但更重要的是,在加深对业务的理解后反复思考、总结提炼、适度美化自己的产出。
e.g:你的实习工作具体是做什么?讲一个case
1.0:根据产品、运营提的需求,写sql,做报表。之前产品让我做了一款app的ltv的报表,包括周报、日报...
2.0:根据产品、运营提的业务需求,写sql,对于周期性任务,形成固定的调度任务,绘制报表导出到BI系统。之前帮助产品同学做了一款app的ltv报表...
...
n.0:技术方面,主要是基于公司的云计算平台,根据产品、运营同学提的业务需求,使用Hql、Spark sql对数据进行处理,把周期性任务编写成固定的调度任务,绘制成报表输出到BI系统。还会处理一些出错的监控任务:重新梳理取数逻辑。
业务方面,对关键数据绘制报表,监控及分析产品存在的问题;分析用户的行为数据,为进一步选取指标衡量产品运作的健康情况,提供数据支撑。
case:(STAR法则展开)
S:这款app发行时间不到两个月,Q1目标是ROI归正和提升新用户留存。如何为产品迭代方向提供数据?在此之前我对于互联网产品的运转模式知之甚少。(会被问到怎么学习,这时候还可以上实例体现自己的学习能力强)
A:通过查阅相关资料、书籍,快速明确了一款产品的生命周期概念。经过进一步和产品、运营同学的沟通交流,我们决定在产品初期就引入LTV(生命周期价值)指标,对现有用户数据分析产品的盈利能力。
T:由于当时sql和云计算平台的使用不太熟悉,用了将近两周时间才绘制出分版本、分渠道的新用户LTV周报表和日报表。从3个月的数据,纵向对比发现...,横向对比发现...。再进一步从不同渠道、不同版本去拆分数据...
R:这个报表为业务的发展方向起到了一定的决策作用。在进行两次版本迭代后,产品同学综合产品定位和竞品分析等多方面考虑,放弃了这款app,但数据指标体系被保留下来,迁移到我们组的另一款app上了。
第7次被捞时,二面有被问到竞品的数据,然而在后端开发组远程办公的我,当时根本没有去了解过竞品的数据,在准备三面时疯狂补课。
所以
一定要为你说出的每一句话负责呀
面试真的会让你更清楚地发现自身优化迭代的方向
如果你清楚业务的逻辑,可以多写一点相关的工作内容上去,但要保证足够清楚“为什么、怎么做、怎么优化”
3. 复盘
每次面完试一定要认真复盘,深挖自己的问题。可以录音,后面整理。多和小伙伴沟通讨论面试遇到的题,拓宽思路。
其实面经看多了就会发现,无非四类问题:
(1)统计学:置信区间、假设检验(a b test)、贝叶斯公式;
(2)机器学习:常用算法原理、优劣对比、适用问题;
(3)业务题:指标拆解题居多,或者结合分类回归的业务场景题;
(4)sql、python:sql的排名函数、python常用库。
4. 信息获取
信息不对称会在不知不觉中丧失掉很多机会,包括直接or间接丧失。多留意各种内推群、官网、牛客的招聘信息,不错过或放弃任何一个机会(比如后台开发??)。
当然更要认真对待每一场面试。如果你以“现在没有准备好”放弃面试,那你可能永远都准备不好。毕竟,实践真的太重要啦!
最好找到靠谱的内推人,会一直跟进你的面试进度。
5. 心态
心态很重要呀,坚信我们每一次被挂都有离目标更近一步!anyway,学习方向更加明确,总会上岸滴。毕竟我被挂6次不也爬上来了嘛。
涉世不深,鹅厂一直是我最喜欢的地儿,可能也是一点执念吧。相爱相杀7次,是真爱啦💕
不管最后去哪里,这段经历都弥足珍贵,珍贵到愿意让我花八千字写推文的那种hhhh
害 腾讯的面试就是,你永远不知道下一秒会被什么bg什么产品捞起来,fighting!!
全部评论
(10) 回帖