晚上八点开始,上来自我介绍,后续就:
1.先聊项目,聊的过程中有提到seq2seq, 就让详细介绍了一下它,扣的很细。
再之后面试官提问attention, 解释一下具体的原理。
2.紧接着问我知道transformer吗? 解释一下为什么会有transformer的提出,对比
seq2seq改善了什么,训练细节。
3.后面聊了第二个项目,详细介绍GPT2,损失函数怎么设计和计算,训练过程,
训练语料的组成,每一个sample怎样划分,长语句怎么处理。针对我处理长语句
的处理方法提出了疑问,然后让我现在想办法改进的话,有什么想法。
4.因为第二个项目中有提到解码策略,然后先介绍一下解码策略。后再针对解码策略问了
Top-k sampling, Nucleus Sampling, 然后问有什么别的方法可以有着相同效果吗?答:Temperature
再问为什么。
5.最后针对第二个项目面试官又提出缺点,然后他提出了一个解决方案问我是否合理
6.接下来半个小时开始聊论文了,因为在导师那的研究方向不是NLP,所以聊的挺久的,主要还是机器学习的东西。
7.最后手撸了一道代码题,大概相当于leetcode的中等难度,用回溯解决,应该细节上出了问题。
8.最后问我有什么想问的,就随便了些问题,最后问面试官我的表现怎么样,面试官说现在还不能说,让我等通知,
应该是凉了😥。
哎,自我感觉前面聊的挺好的,代码能力撸的不够好,希望能接到二面通知吧。
话说有没有知道阿里一二面之间一般间隔几天的,双非渣渣的我瑟瑟发抖。
全部评论
(1) 回帖