收到好多朋友私信问面经,然后我就整理了一下。
线下面试:base广州,2020.10.19
在去的路上搜了一下牛客的面经。我挺少面数挖的,因为没有大型数据库的实践经验、对深度学习也是只知道皮毛,所以看到面经很多LGB问题的时候有点慌,太久没看了,三脚猫功夫基本忘得七七八八了。然后到达现场的时候没等几分钟,就轮到我面试了,慌都没时间慌。
(虽然有预约时间,但是基本是按现场的签到顺序进行面试安排,所以大概率需要等待10分钟左右。)
一面(10:45-11:15,约30~40min,1v1)
1.自我介绍
2.会什么软件
~~~~~数据库相关~~~
3.Hive(不会,只会MySQL)
4.左右连接,大小表一般怎么放,为什么
5.怎么样提高查询速度
6.数据倾斜了不了解(不了解。。。。。,让我了解一下,也可以提升查询速度)
~~~~~~~~~~~~~~
7.描述一下数据建模的过程
8.数据预处理各步骤的方法(异常值、缺失值、样本不平衡)
9.特征重要性怎么衡量(基于模型的衡量,IV)
10.IV和PSI都可用于衡量变量的重要性,说一下PSI的原理
11.深度学习了不了解(只会皮毛,就简单说了一下知道的算法)
12.xgboost的参数(正则项系数、树深、最小叶子权重和)
13.正则项系数怎么设定,作用
14.树深参数的作用是什么
15.除了这些参数,还有没有其他防止过拟合的方法(列采样、行采样)
~~~~涉及简历~~~~~~
16.KS和基尼系数的原理
17.训练集、测试集的时间周期一般怎么选择
Q:
1.数挖业务场景
2.数挖和数分是分开的吗
面完一面,工作人员让我在门口等一下,我以为是当场宣布结果,结果两三分钟后,工作人员又把我带进会议室开始二面。
(一面的面试官很帅,哈哈哈哈)
二面(约25min,1v1)
1.自我介绍(要求:基本情况、在校学习情况、项目情况)
2.为什么选择中信银行信用卡中心
3.就岗位而言,你觉得你的优势在哪
4.讲一下用过xgboost的一些实战项目
5.实习项目成果是怎么衡量的
然后问了问家里的情况、个人兴趣
二面应该是主管面,一开始我还以为是HR面,直到等待完,工作人员又把我带进会议室开始三面
(二面面试官是个很可爱的大叔,哈哈哈哈,说20年前去过我家那边。面试过程中,会一直有眼神交流,应该是观察应变能力)
三面(约25min,1v1)
1.自我介绍(要求:基本情况、在校学习情况、项目情况)
2.怎么体现你的抗压能力
3.怎么看待竞争
4.实习中遇到的最大的困难是什么
5.实习项目是团队还是个人主导
6.你觉得你的项目成果对于整个业务贡献占比多少?缺少的那部分主要原因是什么?
7.在和同事交流过程中有没有遇到困难
8.如果在一个项目当中,同事给你的数据有误,导致了最终项目的失败,领导认为你负全责,你怎么看?
记得的大概就这么多,昨天笔面连轴转,脑子有点不够用。
工作人员说面试结果这两周会出,Good Luck!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2020.12.24 谈薪
全部评论
(17) 回帖