现场面,白纸撕代码。面试官人很nice,最后指出凉点并给出讲项目的顺序建议
1面
- 项目
- 讲述文本预训练方法(word2vec/elmo/bert)
- cbow分层softmax如何实现?为什么用分层softmax?原来的softmax有啥不好?
- skip-gram负采样如何实现?为什么用负采样?
- 实际中如何解决梯度消失,梯度爆炸?
- BN对每一层都加还是只对一层加?
- 实际业务中LR和SVM如何选择?
- 写下lr损失函数,怎么推出来的?
- GBDT的梯度体现在哪里?
- LGB相比XGB做了哪些改进?
- 场景题: 小视频下的长评论提取摘要如何实现?
- Leetcode 109:有序链表转换二叉搜索树
2面
- 项目
- 余弦相似度和欧氏距离在高维下的对比?
- L2 距离在维度很大的情况下会怎样?
- PGD对抗训练加扰动,为什么维度很大时范数球会有意义?根据什么调整这个球的半径?
- 为什么用数据增强可以缓解过拟合?
- 二分类有什么比acc更好的指标?排序用什么指标?
- auc如何计算?roc两个坐标是什么?
- roc曲线y=x有何意义?
- roc曲线y=x以下说明什么?
- 实现auc
全部评论
(10) 回帖