分享面经,希望能够收获offer!小伙伴们也一起加油吧!
捷成一面(偏算法)
1.自我介绍
2.美赛深挖,决策树使用的模型,树分裂的原则(信息增益率,怎么计算的)
CART的基尼指数与信息增益率的优缺点,树的深度太大会怎么样(过拟合)
过拟合怎么办。权重怎么调整?样本比例怎么调整?建模过程中设置了那些参数?
3.讲讲自己还会的数据分析算法,讲解一下Logistic回归,包括函数分布什么的
(梯度下降与拟牛顿法的优缺点?最大似然估计是什么)(误挖坑!!!准备算法的时候可以少,但是一定要精)
4.一个sql,(要认真完成,不要马马虎虎,不注意细节)
5.反问
1.自我介绍
2.美赛深挖,决策树使用的模型,树分裂的原则(信息增益率,怎么计算的)
CART的基尼指数与信息增益率的优缺点,树的深度太大会怎么样(过拟合)
过拟合怎么办。权重怎么调整?样本比例怎么调整?建模过程中设置了那些参数?
3.讲讲自己还会的数据分析算法,讲解一下Logistic回归,包括函数分布什么的
(梯度下降与拟牛顿法的优缺点?最大似然估计是什么)(误挖坑!!!准备算法的时候可以少,但是一定要精)
4.一个sql,(要认真完成,不要马马虎虎,不注意细节)
5.反问
二面:(面试官比较忙??二十多分钟解决战斗)
1.自我介绍
2.说一个项目经历(美赛),以及自己做的比较好的地方(分析可视化的决策树)
问我:如何处理异常数据的(哪些是异常数据),如何填充缺失数据(哪些情况需要填充,如何填充)
决策树过拟合怎么办?什么情况会过拟合?
决策树怎么剪枝?
训练集比测试集的预测好,除了过拟合还可能的原因?
训练集和测试集怎么样才能随机划分呢?
3.数据分析指标的阈值怎么确定?如果少数数据表达的是对的,那么使用统计意义的平均值之类的数就不对,这时候该怎么办?
4.有什么想问的?
2.说一个项目经历(美赛),以及自己做的比较好的地方(分析可视化的决策树)
问我:如何处理异常数据的(哪些是异常数据),如何填充缺失数据(哪些情况需要填充,如何填充)
决策树过拟合怎么办?什么情况会过拟合?
决策树怎么剪枝?
训练集比测试集的预测好,除了过拟合还可能的原因?
训练集和测试集怎么样才能随机划分呢?
3.数据分析指标的阈值怎么确定?如果少数数据表达的是对的,那么使用统计意义的平均值之类的数就不对,这时候该怎么办?
4.有什么想问的?
(总体来说,一面较难,二面自我感觉较好,表达比较自信,面试官就没问太多了,大家一定要自信的表达!)
全部评论
(2) 回帖