首页 > 信也科技——数据挖掘面经
头像
Forzaljl
编辑于 2020-10-19 09:43
+ 关注

信也科技——数据挖掘面经

2020.9.15投递
2020.9.18笔试  七道主观题  3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目
————————————————————————————————————————————
2020.9.25 一面有些记不太清除了
自我介绍

挖实习经历:风控相关:解释一些WOE值是怎么计算的,IV值是怎么计算的

还有就是一些风控建模细节

大数定律

线性回归的拟合优度$R^2$是怎么计算的

解释一下P值的概念

对信也了解吗?以前的拍拍贷

如果客户一直对你的模型不满意怎么办

解释一下过拟合(有好多家笔试都考到了的)

撸了一道sql题 两表连接+筛选条件 比较简单

整体体验蛮好的

反问:平时的主要业务和工作是什么?
————————————————————————————————————
2020.9.30 二面

没有自我介绍,面试官上来就吐槽我的简历太简洁(要不是一面的面试官问了很多问题都不知道我做了这么多工作),尴尬。。。  投递的有些匆忙,用的是最开始的简历

挖实习经历

中心极限定理(我忘记了,说我对大数定律比较了解,然后讲了大数定律)
**大数定律、中心极限定理真的很重要,研究生复试问到了,找工作也还是逃不掉啊**

树模型、gbdt的实现过程  不要原理,要实现过程  我讲了一堆boosting的原理,还有gbdt和adaboost的区别与联系  但是面试官还是说我说的是原理  引导问:决策树是怎么生成的,我就简单讲了下基于信息熵、信息增益、基尼指数、平方损失等,选择分裂节点,然后对于子树进行递归操作

xgboost是怎么分裂的?  没答上来

boosting和bagging的差异? 信手拈来

lightgbm和xgb的区别?xgboost是预排序  lightgbm是基于直方图,无论存储还是计算都要快很多

xgb,lightgbm的调参? 贪心算法,优先调重要的,然后调次要的

怎么降低过拟合 调整顺序  优先调什么?

建模时xgboost的损失函数是什么样的?(没答上来,忘记了。。。应该是回答auc吧)  追问了解mae和mse吗? 解释一下两者的差异?

面试官看我用过catboost,让我讲一下(我只是用过,没有太深入的进行了解,就讲了一下处理类别变量的优势)

评分卡模型了解吗?讲一下步骤

评分卡模型得到的分数在某一个分数段上比较集中该怎么处理?

有多少家公司正在面?

你有想去的地方吗?你的计划是留在一线城市嘛?

反问:数据挖掘岗平时的主要工作是干什么呢?(好像问了和一面一模一样的反问,不过两个面试官给出的角度还是不太一样的,不过确实是我想做的风控建模的工作)

国庆后给通知么?(是的) 本来复试想推倒国庆后,国庆好好准备一下的,不过hr说,复试的流程要在国庆前结束。

二面的整体感觉也是很棒的,感觉面试官问的很技术,问到了各种算法的细节。我也还需要继续努力学习其中的细节。

————————————————————————————

希望可以帮助一些想要从事风控的同学们

————————————————————————————

2020.10.15 已oc  感谢帮助过我的小伙伴们

更多模拟面试

全部评论

(3) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

热门推荐