一面
算法题:1. 非递归的二叉树中序遍历;2. 指定概率列表,写一个随机采样算法
- 介绍竞赛
- 召回的多样性
- 数据规模
- ANN使用的什么工具
- 点击率预估为什么选择 lgb
- 排序为什么不使用基于 pair wise 的模型
- 了解 LambdaMart 算法吗
- lightgbm 相较于 xgboost 的优势
- 了解的其他点击率预估算法
- 对特征交叉方面的个人理解
- wide & deep 模型 wide 部分和 deep 部分分别侧重学习什么信息
- deepfm 一定优于 wide & deep 吗
- 如何解决稀疏问题(回答的 hash embedding,不知道对不对)
- 在模型侧如何打压热门商品
二面
- 介绍比赛背景
- 怎么分工的,你负责的部分
- 为什么使用 w2v,有试过其他 embedding 工具吗
- w2v 的参数怎么调节的
- w2v 的 min_count 设置的多大,从什么方面考虑的
- 介绍 NN 的结构
- 怎么调参的
- 了解哪些正则化方法(layernorm,batchnorm)
- 上面两者有什么区别
- 有没有遇到过梯度消失,梯度爆炸,怎么解决的
- 多任务模型结构了解吗
- 知道哪些点击率预估模型
- 点击率预估任务中负样本过多怎么办
- 下采样后,训练样本和线上 server 样本分布不一样怎么办(纠偏公式)
- 冷启动该怎么做
- 开放题:现在做一个搜索系统,你会考虑哪些东西,各方面都行
- 未来的职业规划
全部评论
(9) 回帖