首页 > 滴滴网约车算法暑期实习面经
头像
KarenOu
编辑于 2021-05-25 17:48
+ 关注

滴滴网约车算法暑期实习面经

面试官在的组主要做网约车动态定价补贴策略和算法。
Timeline:一面5/13, 二面5/18,offer call 5/25。

一面 (5/13, 1h)
1. 自我介绍
2. 简历上每个项目逐个深挖(好的是,没让做算法题)
i)点击率预估项目
- 自己先简单介绍一下这个项目背景、过程、结果
- 邮件文本词向量编码,怎么作为特征输入,直接对词向量做average pooling,一些重点语义词的权重不会被降低吗(可能用attention更好)
- 有对构造的特征做进一步筛选吗(说了用随机森林的特征重要性),举例说说哪些特征更重要
- 为什么要用DeepFM模型,有考虑过用DCN吗
说了DCN如果cross部分用更高阶,模型会更复杂,公司的GPU内存支持不了模型的训练,而DCN用低阶的话和FM的二阶交叉项作用类似。面试官觉得cross的次数可以进一步具体调参。
- 介绍DeepFM的结构,最后输出是怎么合成deep和wide两部分的
- 用户是否有点击邮件,这部分的数据是如何获取的
- 只是简单的二分类问题吗,对于label是怎么做数据预处理的,如何判断用户的点击行为是否合理,会根据用户点击后对邮件的浏览时长对label进行加权吗,把二分类问题转化为回归问题(面试官指出可能用户会有误点、点击多次、只浏览了很短时间等多种情况)
- 对类别不均衡的数据怎么处理
欠采样,以及在损失函数上给正类加大权重。但面试官指出深度学习模型和XGBoost不一样,损失函数里正负类的权重比例和反向传播中正负类样本的梯度的比例不一定一样,需要深入看网络在反向传播时正负类样本的梯度具体的大小和比例。
- 模型是离线训练还是在线训练的,需要考虑时效性的问题

ii)交叉销售推荐系统
- 简单介绍项目
- 如何做特征工程,举例说一下构造了哪些特征,哪些特征更重要

iii)用户流失率预估模型
- 简单介绍项目
- 为什么用生存分析和基于逻辑回归的多任务学习模型
- 为什么不用LSTM和RNN等有时序性的模型
提到说因为输出的label可能会和实际情况有出入,用户上个月流失了,之后的状态会一直处于流失状态。但面试官说这个是一种单调性约束,可以把函数加入模型中考虑,来解决这个问题
- 怎么用AUC评估指标

iv)文本情感倾向性分析
- 介绍项目
- 为什么不先用现成的corpus(eg: wiki等评论类数据)先pretrain word2vec model,再在项目的数据上进行fine-tune

3. 可实习时长
4. 反问
- 组具体工作的内容
为拼车定价构建模型(所有用户),包括转化率预测,看用户是否选择该品类;价格弹性模型,工具预测模型,帮助描述业务。
为特定用户制定策略,(eg:价格敏感的用户),给多少补贴,可以帮助拉新和促活。
- 技术栈
了解机器学习和深度学习框架,数据处理的工具(spark,hadoop,hive),有业务sense,知道哪些模型适用哪种业务场景。

二面 (5/18, 1h)
1. 自我介绍
2. 简历项目深挖
i)电商销量预测
为什么做,用了什么特征。LightGBM如何调参,调参num_tree与max_depth的先后顺序有什么影响

ii)交叉销售推荐系统
如何设计AB实验。为什么不先做AA实验看两组是否本身有区别。怎么判断是否有显著性差异。为什么要做4次实验。
用什么工具做特征工程,为什么要把数据拉到本机训练,如何在线上验证模型表现

3. 之前的工作节奏怎么样,项目都是自己做的吗
4. 反问,介绍了组内的工作
- 核心是定价,探索用户在不同场景下对不同价格的敏感程度,对应不同的补贴和价格策略
- 乘客对拼车产品的接受程度,量化意愿的强烈程度
- 给用户预估的到达目的地的时间,对乘客行为的影响

过了一周面试官联系说通过了,介绍了一下实习入职之后可以做的项目。

更多模拟面试

全部评论

(3) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

近期热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

热门推荐