首页 > 22届 算法岗秋招面试全纪录
头像
努力刷题的易易易易
编辑于 2022-07-02 20:48
+ 关注

22届 算法岗秋招面试全纪录

楼主本硕985,但接触算法相关只有一年左右(研究生开始),NLP方向,非科班,无好项目,无好实习,1篇ACL非一作,记录一下这灰飞烟灭的算法求职之路。

(2021.11.16)总结一下:字节排序挂了,最后签了bigo广州,薪资挺香的离家也比较近,春招再看看大厂机会吧

(2022.07.02)更新一下,春招面了腾讯cdg和字节推荐,都过了hr面,但是恰巧遇到大裁员,tx的口头offer没了,思来想去后还是没去字节去了bigo,昨天刚入职,氛围和工作时间感觉还是不错的,后续有同学需要内推的可以私聊我~
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
1.蔚来 NLP 上海 (这个之前发过一次)
一面  2021/7/17 16:00
40min
一、自我介绍
二、个人项目与实习经历
三、你在拿到一批文本数据时,会做什么? 答:分词、词频统计、词干提取、删除特殊符号等
四、word2vec,具体细节讲一遍
五、你了解bert吗?具体细节讲一遍。
六、你常用的优化算法?有什么特点?为什么?   答: 讲的SGD和ADAM
七、网络优化的方法有哪些?   我愣了一下,一下子没反应过来,想了想可能是和LayerNorm这些有关吧
八、随机森林讲一讲
九、代码题:判断一个链表是否是回文串,比较easy

二面 2021/7/17 17:00
30min 此次面试感觉面试官很偏向数理基础
一、自我介绍
二、讲了讲论文
三、Kmeans 和 EM算法?Kmeans和EM算法很相似,类比一下?  答:(不知道对不对)E步,类似于求各个类的中心 ;M步,将各个点归到距离最近的那一类,思想好像挺像的
四、如何得到正态分布的pdf? 答:逆分布函数,利用(0,1)均匀分布生成cdf再生成pdf; 或者利用中心极限定理从大样本获取
五、transformer?细节讲一讲
六、代码题:二叉树的中序遍历,递归板很快秒了,后来说写一下迭代版,说了一下Morris遍历的思路,但没实现出来
七、看你迭代版遍历没写出来,给你出一个题:
圆上任选一条弦,其长度大于圆内接正三角形边长的概率为?   这题比较阴,当时我在那偷笑,具体细节有兴趣的可以百度

三面 2021/7/17 18:00
50min
一、自我介绍
二、项目和论文
三、bert了解吗?那来问问你transformer的问题。self-attention的时间复杂度?答:O(T*T*d)为什么? 感觉答得不太好
四、为什么bert要用layer norm 而不是batch norm?
五、用batch norm,在测试时,遇到不是batch形式输入的数据怎么办?
六、word2vec手撕
七、过拟合问题?
八、validation set 和 test set的区别
九、SGD随机性的探讨,是好是坏?
十、代码题:(1)给你一枚均匀硬币,实现【0,2^k-1】的均匀随机数?   答:二进制  (2)实现【0,n】的均匀随机数? 答:二进制+拒绝抽样

意向书 2021/08/23 秋招第一封
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
2.海康研究员 NLP (启明星计划)
一面 技术面 电话面试 15min
我在实习上班的时候突然打来,聊了一下论文相关的,没了

二面 技术面 2021/08/11  30min
没有自我介绍,面试官看起来很急,可能要面试的人比较多。
一、介绍了一下论文
二、kmeans算法的改进,k值的选取(我回答了肘部法,需要通过人为判断),面试官说有一个能自动判定的算法,我不知。
三、kmeans++?只记得大概了,回来发现说错了
四、做题:给定一个数组,依次选定元素,每一次得分为该元素乘以左边元素乘以右边元素,然后把该元素剔除掉。求将所有得分相加的最大得分?(动态规划,但是我感觉这个数组是动态的,所以写不出转移方程,还是太菜了)
五、什么是最大熵模型?不了解,答了个马尔科夫最大熵模型MEMM,面试官没说什么。
没有反问环节
(这不是NLP岗吗,咋一个相关的都没问到。。。。)

目前还没结果,应该是挂了

挂了但没完全挂。。。

三面 HR面 2021/08/27 20min
一、自我介绍
二、你坚持的最久的一件事?
三、有什么收获?
四、为什么要去做它?
五、个人信息打探,base意向、薪资、岗位可否协调、offer情况
六、反问:hr面代表着前面的面试都过了吗?回答:要综合前面面试情况再判断。

四面 主管综合面 2021/09/03 20min
不懂这是啥,说是技术终面但是没咋问技术,全程聊天
一、自我介绍
二、为什么数学中很喜欢正态分布?(我答的是中心极限定律,正态分布很"自然",被追问为什么"自然")
三、个人项目,介绍一下就行了,不必说的太深
四、个人对企业的选择倾向?
五、你了解海康吗?(了解的不多,然后他给我讲了几分钟海康的文化和蓝图)
六、反问,忘记问了啥了,该问的都问过了

状态码变成(SPLY)审批录用了

9月18日,已oc
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.依图 AI研究员
一面 技术面 视频面试 2021/08/13  50min
上来自我介绍,然后提问
一、深入个人研究项目,为什么要transformer,为什么RNN,为什么CRF?
二、CRF输入输出是什么?(transition+emission score,输出为最佳路径,当时答得不好,扯了半天"特征")
三、Glove?你还知道哪些词向量?它们的不同之处在于?
四、Bert预训练任务?MLM和NSP。先执行哪个任务?同时执行,计算共同损失函数。
五、做题,第一题:岛屿数量:(leetcode medium) 第二题:增强版编辑距离(leetcode hard),要求把string2变为string1最少操作步骤的操作记录(具体操作),磨蹭了半天,最后只写出来最少操作记录数
反问:工作内容?(看最新论文,写模型)

二面 技术面 2021/08/23 60min
相隔太久,有点忘了具体内容了
无自我介绍
上来先做题,和为s的来连续区间集合,我做过原题但是忘了怎么做了,只记得前缀和,然后面试官很nice地引导了半天,耗了将近半小时,还没完全做出来(菜鸡捂脸)
一、项目介绍、提问、实习内容介绍
二、项目中用了bert吗,怎么用的?(作为句子向量,配置一个小学习率用于下游任务)
三、LSTM?经典三连(门控+激活函数+记忆流)
四、Bagging与Boosting?
五、你常用激活函数?

希望面试官能捞一手,许愿HR面~

三面 主管面 2021/08/23 35min
以聊人生为主,基本没问技术
一、自我介绍
二、粗略讲几个项目
三、你的工程能力强吗?写过网页相关的代码吗(无,解释是非科班,没经验)
四、你未来的规划?
五、你想做偏研究的还是偏业务的?(都可)
六、反问:岗位有哪些工作内容?(有的人研究模型,有的人研究工程)

HRBP面 2021/08/23 25min
连着主管面的
一、个人兴趣?做过最有意义的事?为什么?未来想去哪?为什么?
二、一家大厂(暗示BAT等)和一家中厂(暗示依图等)和一家创业型公司,你有什么倾向?
三、有哪些offer?
四、你希望未来的同事是怎样的?
五、反问:工作时间:10 9 5(周六不强制?)
六、最后给我介绍说,9月中下发意向书,10月下开奖

许愿意向~

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
4.字节 算法工程师(算是提前批)
一面 技术面 2021/08/17 80min
面试官开会去了,先推迟了半小时,然后上来介绍了下部门情况
一、自我介绍
二、实习?你现在在携程做了什么?爬虫用户怎么识别?什么规则?GMV预测怎么做的?LSTM输入输出?
三、项目挖掘(社交网络)。社区划分是什么?模块度?你这个项目的实际意义和应用场景是什么?Louvain和LPA的差别?
四、做题,最长无重复子串,(leetcode medium)用了dp+哈希表+空间优化,但是做得慢了一点,思路打在共享屏幕上了
五、继续问问题。KL散度和交叉熵的关系?异同? (虽然我昨天才看过,但是答得磕磕盼盼)
六、似然函数与交叉熵的关系?
七、EM算法?
八、你常用激活函数?(答了relu、sigmoid和tanh)为什么深度网络要用relu?(梯度消失问题,又被追问梯度消失和梯度爆炸怎么来的,链式求导推导)为什么lstm对候选记忆激活时要用tanh不用sigmoid?(不了解)
九、树模型。介绍ID3,C4.5,GINI。基尼系数分裂时比信息增益比好在哪?(不太清楚)随机森林讲一下?XGBOOST?LIGHTGBM?集成学习类型?
十、反问:工作内容

总结:太菜了,需要查缺补漏,我内推时主要想做NLP,可能被其它做数据挖掘的部门捞了,相关部分准备不充分。

一面居然过了,24日二面,希望顺利~

二面 技术面 2021/08/24 55min
一、自我介绍
二、transformer结构?为什么要LN?LN与BN的区别?
三、LSTM详细介绍一下?
四、你觉得LSTM与transformer有什么区别?
五、说一下你的项目+深挖
六、针对我的社交网络项目提问:你怎么评价社区划分的好坏?(答:模块度)又给出一个场景题:如果你有一部分"黑产"用户,你怎么去挖掘出更多的"黑产用户",你用什么指标来说服我它们就是黑产用户?(支支吾吾没说出来)
七、实习项目深挖。你基于什么规则去判定疑似爬虫?如果意思爬虫用户掌握了你的规则并会学习你的规则,你又该如何应对?(面试官搞黑产对抗的)
八、你对base有啥要求吗,有其他offer了吗?
九、做题:给定一个字符串,需要你划分出所有可能的ip地址(leetcode medium)

下午HR打电话来说挂了,面评说基础不错但是方向不匹配,转推荐至Data的算法工程师,重头再来,哭了

一面 技术面 算法工程师-Data 2021/08/31 60min
一、自我介绍
二、项目细挖,很细,问的我快打不上来了
三、做题,股票(只买卖一次,只买卖2次的最高收益)
项目问了40min,做题20min,算法知识没问了,顺利通过一面,

二面 技术面 2021/09/08 70min
一、上来,做题,最大子矩阵和,hard,没做过,说了下思路,磕磕绊绊写了半小时,面试官一言不发
二、自我介绍
三、神经网络权重初始华为0?
四、过拟合欠拟合?解决方案?
五、概率题:顺序统计量(一开始还写错了,经过提醒改过来了,汗颜)
六、再做一题,实现幂函数(二分法,写的磕磕绊绊,最后好歹是写出来了)
做了50min的题,问答10min,这是要被挂的节奏了吧,害
反问了一下,面试官做搜索推荐的

过了,谢天谢地

三面 技术面 2021/09/15 75min
一、自我介绍
二、项目、问得很很很细
三、讲一种词向量方法(我讲了w2v)?怎么训练?cbow输出怎么处理?为什么要avg?为什么不用sum?(感觉只是数值上会有差异)优化方法?为什么负采样会有效?负采样后会对预测做什么处理吗?
四、CNN,池化层梯度传播怎么传?
五、softmax求导?
六、sigmoid求导?梯度最大值?
七、我看看你前几轮写了啥题。ok,那你写一下x的平方根吧(惊了,easy题)你是不是写过?(我说是的)
八、最后一个问题哈,AUC值怎么理解(说了计算上的理解和概率上的理解)。怎么实现?(一、计算ROC曲线面积的方法 二、利用得分计算(正样本排在负样本之前的概率))
九、反问(岗位、内容?)火山引擎支持,搜广推相关。

结束后一小时就接到了四面预约电话,然后过了一会儿HR说不用四面了,估计是之前面评有争议吧,希望能顺利HR面~

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
5.招行卡中心 IT岗 数据分析方向
一面 技术面 2021/08/17 15min
面完字节马上面银行的,对比格外强烈
一、自我介绍
二、面试官说我们有数据仓库方向和数据挖掘方向,你更倾向哪个?(答了数据挖掘)
三、介绍一个个人项目。介绍完后,面试官简单问了几个问题
四、结束,没有写代码,等消息ing

我也不确定面试官是什么方向的,也不懂我的项目他听懂了多少。。面试体验很奇怪

这个也挂了,无语子
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
6.B站 NLP (商业技术)
一面 技术面 2021/08/18 50min 面完就挂
面试官迟到20分钟,且没有任何表示
一、自我介绍
二、实习内容、项目,抓细节
三、梯度爆炸、梯度消失是为什么?怎么判断梯度爆炸、消失?(1.tensorboard输出各层梯度分布 2.观察最上层的梯度变化)
四、lstm细节、结构讲一下
五、你用过bert吗?怎么用的?
六、你了解推荐吗?(我不是做推荐的,从图模型的角度粗略分析了一下)
七、做题:一个排序好的数组,在某一个位置发生了翻转,给你一个数,判断翻转后的数组是否存在这个数(leetcode上的,二分+二分)
反问:工作内容?广告算法。会自己设计模型吗:会。

不多说多余的话,态度比较冷漠,面完反手就挂,一脸懵逼。目前面试体验最差的一次。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
7.广联达 AI工程师
一面 技术面 2021/08/24 30min
一、自我介绍
二、项目深挖,为什么这样是有效果的?
三、RF和XGBOOST讲一下?
四、机器学习场景应用?
五、反问,平常研究内容?面试官答:会涉及到人机对话的一些操作
没有算法题,氛围比较自在

二面拒了,已经有保底offer了
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
8.友塔游戏 算法工程师
一面 技术面 2021/08/25 50min
我记错时间了,害面试官等了我半小时,惭愧
一、之前的笔试题复盘,要讲每一题的思路。(包括矩阵顺时针反转、n个圆、拼图还原)
二、linux?多线程?锁?。。。等等一套科班问题,问的我毫无招架之力
三、窗口函数?(sql)我答出来了,但面试官说你是不是投错岗了,这几天面试的人就没见过做算法的回答得出,你应该是去投数据分析的。
四、python写过开发吗?写过界面设计吗?(???)
五、你写过最长的项目代码是什么?模型不算。(我沉默了半天,想起来当时写的边缘检测的东西,还勉强不算"模型")
没在写代码了,被嫌弃非科班了,全程就问了一道机器学习相关的(RF)。

挂,岗位也不太匹配
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
9.科大讯飞 算法工程师(研究院)
一面 技术面 2021/08/26 40min
双面试官。先自我介绍,然后开始提问
一、项目,讲一个你觉得参与度最高的项目。为什么你这么项目要这么建模?准备投论文吗?前人是什么做的?你的创新点?
二、论文,和项目几乎相同的问法。
三、问几道关于框架的问题。平常用tf还是pytorch?(pytorch),dataloader函数与自己写有什么区别?(我答的是dataloader是一个生成器,又被追问如果你也写一个生成器呢,答不知道,但肯定dataloader快)dataloader如何指定线程数?
四、广播机制?改变向量维度?(permute还是view)你平常会用广播机制吗?(不会,不熟练)
五、你熟悉的激活函数?你知道哪个激活函数不是单调的吗?(一开始脑抽答了个tanh,然后又被问到tanh取值范围,发现自己答错了,想了一想发现是Gelu,然后大概描述了一下形状)
六、transformer的内部架构你熟悉吗?(熟悉+口述)
七、你在哪个实验室?导师是谁?(我感觉有个和我同校的面试官(师兄))
八、反问:工作内容,研究新模型等
没有考代码

一面过了,但是感觉进度好慢

二面 2021/09/16 25min
一、自我介绍
二、项目说了一下,也没问太细
三、聊人生:女朋友?实验室有多少人?base地?老家?期望薪资?
四、反问:上班时间?答:995

第二天反馈二面过了,等待HR面

三面 HR面 20分钟
base地选择,实验室情况,老家,本科研究生相关经历等

意向书,9月22日
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
10.盛趣游戏 算法工程师
一面 技术面 2021/08/27 45min
面试官一脸冷漠的样子,让人害怕,声音还很小
自我介绍
一、项目,深挖,问的很细
二、RF、XGBOOST介绍一下,差别是什么?
三、你这个社交网络分析的应用场景是什么?(可以是推荐)
四、LSTM结构介绍一下
五、sql会吧,pyspark用过吧,hive sql也了解吧,平常你实习的时候怎么用pyspark的?
反问:工作内容:为游戏提供相关技术,后期可能会转强化学习,然后又反过来问我你知道强化学习吗,(知道一点,Q-learning,MDP和A*那一块的学过一些)
没有考代码

二面 9月9号 30min
面试官很和善,彬彬有礼
一、自我介绍
二、实习、实习中遇到的困难
三、场景题一:游戏中怎么对评论文本情感分类?如何做缩略词?如何找新词?
四、你感觉实验室的项目与平常实习或者以后工作的项目会有什么差别?
五、场景二:从算法角度,关卡难度如何设计(针对不同难度玩家)?
六、场景三:从算法角度,如何自动识别未成年人利用长辈的账号进行游戏的行为?
七、反问,工作内容
没有写代码

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
11.莉莉丝游戏 算法工程师
一面 技术面 2021/08/27 50min
面试官笑嘻嘻的,为人亲和
先上来给我介绍了一下公司,然后自我介绍
一、项目深挖
二、场景题:如果按照玩家的消费能力依照规则去给他们推对应价位的礼包,你怎么去建立模型预估所有玩家的一个出售礼包收益?(没答出来)
三、L1范数和L2范数?
四、你知道哪些优化算法?(梯度下降、牛顿法和坐标轴下降)
五、如果你采用了LR+L1范数去做损失函数,在训练时突然报错了,你觉得是为什么?(不可导点)那如何解决呢?(近端梯度下降法,原理)那如果你不知道这个算法呢?(我觉得可以以一个概率返回某个常数,或者以一定概率将模型权重值回调到某个可导点)
六、继续场景:在一些工作中,我们需要通过用户窗口周期去预测用户未来的消费,假设我们有N个窗口周期,有M个需要预测的周期,那么可能会用到N*M个模型。你有什么办法简化吗?
七、coding思路考察,不要求写代码。一个大小为100亿的数组,如何求出top 10万个元素?(我答的是,分为10w个长度为10w的数组分别排序(从大到小),再按每个数组的头元素排序成一个矩阵(每一行、每一列都是递增的),然后再求top10w,leetcode上有一题好像是类似的)
八、反问:你们平常会用可解释性强的模型吗?不会。

面试体验还不错,希望能到二面,还是比较喜欢游戏公司的~

二面 技术面 2021/09/07 60min
面试官没开摄像头,于是我也没开~
一、自我介绍
二、项目挖掘
三、transformer详解,position embedding是怎么做的?为什么可以直接相加不拼接?相加与拼接的差异是什么?
四、CRF详细说一下?他与HMM的区别?Bi-LSTM可以接HMM吗?为什么?
五、(随机过程n连)什么是随机场?什么是时间序列严平稳?宽平稳?什么是马尔科夫性?什么是鞅?(汗颜,本科学过结果全还给老师了)
六、中心极限定理?
七、场景题:电梯调度问题?怎么设计评价指标?怎么设计baseline?(一脸懵逼)
没有coding,后来和面试官解释说研究生全是数据挖掘课,本科学的统计专业课忘得差不多了。
希望能有后续~
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
12.快手 机器学习算法工程师(深圳)
一面 技术面 2021/08/28 50min
一、自我介绍、项目深挖、实习项目
二、过拟合、BOOSTING、bagging等常规问题

二面 技术面 2021/09/04 50min
一、做题,冒泡排序,堆排序(堆排序我忘记是怎么写的了,希望换成快排,未果)
二、项目、实习
三、场景题:一个2亿的评论,量量计算Jaccard系数,怎么算(不懂)
四、聊了两句人生,结束了

挂,意料之中
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
13.BIGO likee推荐算法
一面 技术面 2021/08/30
一、自我介绍
二、简历
三、为什么想来做推荐不做nlp?
四、transformer?lstm?
五、GCN?与Graphsage的差别?你跑GCN有遇到什么问题?
六、deepwalk时间复杂度?
七、做题,二分查找相同元素的左右边界

二面 技术面 2021/09/06
一、自我介绍
二、让我挑项目讲,讲了两个+QA
三、transformer详解
四、如果有一系列电影以及相关特征,你怎么去生成8个推荐列表?(我参照生成模型的方案给的答复)
五、CRF?
六、做题,与第一轮一样的题目

二面过了

三面 技术面 2021/09/10 50min
一、简单自我介绍
二、项目
三、场景题(A,B两个点在一条直线上,但不知道相隔多远,也不知道谁在谁的左侧,你如何用算法给出它们之间的距离?时间复杂度?)
四、过拟合怎么判别?
五、pytorch写一下LSTM(我问面试官要重头实现吗,他说不用,直接调就行)
六、你会C++吗?(学过C但忘了),那你用python写一下字符串匹配吧(不需要写KMP,暴力即可)
七、反问

许愿HR面~

HR面 2021/09/17 20min
一、自我介绍一下
二、实习经历?与你现在做项目区别是啥?
三、你了解bigo吗?然后给我介绍了一下likee
四、职业规划?
五、能提前来实习吗?
六、base地?
七、有其他offer吗?你对这些offer有倾向吗?
八、反问:工作时间10 8 5

HR说国庆后才会出结果了,许愿OC~
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
14.Soul NLP&搜索
一面 2021/09/06 45min
一、自我介绍
二、做题,类似26进制,优化思路
三、个人项目
四、transformer?激活函数?过拟合欠拟合?如何处理过拟合?
五、场景题:实物推荐怎么做?与NLP的联系(搞不太懂,面试官说只有一个按钮,不能输入query)

场景题反问了回去,面试官似乎有点提不起兴趣,应该是挂了

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
15.阿里 盒马事业群 NLP算法工程师
一面 2021/09/08 55min
一、项目详细讲讲,各种QA,大约35min,其中会交流一下各自的看法和意见
二、如果我是一个新手,你怎么给我描述transformer?
三、transformer为什么要多头self-attention?为什么不要单头呢?
四、除了kmeans你还知道其他的聚类算法吗?(我说图上的聚类,类似于社区划分)
五、聊天,个人未来base的倾向,盒马的当前业务等

面试官小姐姐人很nice,她催促我尽快把笔试做了,希望能顺利第二面~

吃挂面了
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
16.美团 NLP工程师
一面 2021/09/10 60min
一、自我介绍
二、项目、应用场景、原理剖析
三、CRF?(项目里写到了,于是顺带问了,面试官笑着说你背的很熟嘛哈哈哈)
四、考一考你,狄利克雷分布的先验和beta分布的先验?(多项分布和二项分布)(我说不记得了,要是能给我密度函数的话可以现推。面试官说没事,不用的话不记得正常)
五、GCN?模块度?写一下公式。
六、写个题吧,实现一下pagerank?(图以字典的形式给出)
七、base地?然后给我介绍了一下部门平常工作内容。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
17.携程 算法工程师(NLP)
一面 2021/09/17 40min
一、自我介绍
二、项目,问得很细,直接问到各个前向传播的细节和计算式了
三、分词?(我不太熟,答了个前向和后向,最后取分词数最少的)
四、Attention的类型?
五、你之前在携程的部门没有NLP相关的岗位吗?
六、反问:工作内容。

老东家,希望能给个面子哈哈哈

全部评论

(11) 回帖
加载中...
话题 回帖

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

热门推荐