一面
算法题:leetcode 排序矩阵查找,leetcode 102 二叉树的层序遍历
- 介绍一个你认为做的最好的比赛
- ANN用的什么工具,介绍一下原理
- 为什么选择Annoy
- 还知道其他ANN算法吗?介绍了一下局部敏感hash
- 做用户商品交互特征的时候,你知道业界是怎么做的?扯了一下DIN模型的和目标商品的attention做法
- lightgbm和xgboost的区别
- 排序阶段你知道业界是怎么做的?说了一下点击率模型:deepfm,nfm,wide & deep,dcn,deepcrossing
- 介绍一下word2vec
- 介绍一下transformer
- bert的两种预训练方式
- 为什么要用mask?说了padding mask和sequence mask
- 为什么要sequence mask?防止信息穿越
二面
算法题:求从左上角到右下角的最小开销。给定一个二维数组arr[i][j],数组中每个点表示经过该点的开销,求从左上角为起点,右下角为终点的最小开销,在每个点时只能往右或者往下走,同时中途可能会有障碍,即有些点不能走,obs[i][j]=1时表示(i, j)不能走。dp和dp状态压缩。
- 介绍一个比赛
- ANN用的什么工具,介绍一下原理
- 如何提高冷门商品的推荐效果的
- 了不了解大数据框架
- 说一下你熟悉的linux命令
- 一个文件每行一个数字,用命令统计所有数的平均值和数字个数
- 逻辑回归损失函数和求导
- 介绍一下你了解的优化器和各自的优缺点
- Adam和Adagrad的区别
三面
算法题:有一个长度为n的数组,求一个数k,k的取值区间为[1, n-1],使得数组的前k个数和后n-k个数的方差和最小。
要求化简方差公式,达到计算子序列方差的时间复杂度为O(n)。化简后要求空间复杂度为常数级别。
- 写逻辑回归的logloss损失函数
- 逻辑回归损失函数可以用mse吗(从梯度角度)
算了mse的梯度,答了相较于logloss的梯度多了p(1-p),也就是sigmoid的梯度,所以会梯度消失。面试官提醒mse是凸函数吗,如何证明是不是凸函数。 - 逻辑回归建模,如果只有9个正样本,一个负样本,那么有一列特征,这个特征对于的权重是正还是负
没太理解,回答和特征值有关系 - 介绍认为做的最好的项目
- 项目中如何缓解曝光偏差的
- Embedding ANN召回用的什么工具
全部评论
(8) 回帖