实习面经，分享一波

腾讯:
1.问之前做过的一个NER项目，数据量多大，怎么针对小数据量优化模型的？
2.为什么选择bert+Bilstm+CRF？
3.为什么选择bert的多个隐藏层做加权求和还有拼接，效果有提升吗，提升有多大？
4.问kaggle的一个推特文本提取的一个比赛，问的比较细节，模型的输出是什么样的，单个模型有多大？
5.HMM和CRF介绍一下？
6.代码题，旋转一个链表中间的一部分(从第i个结点到第j个结点)

滴滴：
1.问之前做过的一个NER项目，用了bert的几个隐藏层，怎么处理的，loss函数是什么，和传统的交叉熵有什么区别？
2.了解lstm的三个门函数吗？
3.说一下embedding，word2vec的两种模型，哪个收敛的更快？
4.lstm梯度消失怎么处理？
5.了解graph embedding吗？
6.谈一下embedding的发展过程？
7.CRF中的维特比算法
8.FM算法，deepFM算法
9.代码题：10亿长度的数组，有大量重复数据，怎么查找中位数

创奇新智:
2.手推SVM
3.代码题：一个二维数组，每一行是递增的，找出前k大个数

腾讯:
1.介绍一下bert？
2.RoBERTa和bert的区别？
3.RoBERTa为什么放弃了NSP任务？
4.lstm和gru的区别？
5.layer norm和batch norm的区别？
6.layer norm是怎么做的？
7.代码题:一个字符串，保证非字符符号的位置不变，字符倒序

平安科技:
1.谈一下word2vec？
2.Huffnman树怎么构造的？
3.说一下Bert，Bert的结构？
4.谈一下CRF

1.lstm公式 attention公式
2. 文本分类预处理过程？如何生成词向量？如何抽取特征？去除停用词？（分词-去停用词-文本向量化）
3. fasttext的过程

腾讯二面:
1.为什么用的是roberta？
2.roberta和bert的区别
3.如何处理噪音？
4.如何识别标题党？
5.优化器:SGD和Adam的区别？
6.为什么一般使用SGD而不用Adam
7.代码题：在N个数的list里得到任意N-1个数的乘积(两种方法,除法和不让用除法)，
8.在上一个问题的解中找一个最大的结果

滴滴:
1.介绍一下两个比赛
2.为什么用BiLSTM，是效果驱动的吗？
3.CRF和HMM的区别？
4.生成式模型和判别式模型的区别？
5.EM算法和MLE的区别？(有监督，无监督，隐状态)
6.Roberta和Bert的区别？
7.简单介绍了下SVM？
8.为什么SVM要转化成对偶问题求解？
9.SVM使用什么算法求解，大概介绍一下SMO算法？

头条：
1.链表快速排序
2.在一个已经排完序的列表里面找到一个数第一次出现的index
3.把字符串内多余空格去掉
4.两个队列实现栈
5.word2vec负采样
6.lstm和rnn关于梯度消失有什么不同
7.同样的代码不同的初始化结果怎么保证一致
8.tanh和sigmoid的劣势 relu的优势
9.relu失活的问题
10.batch norm
11.负采样之后，需不需要把分布恢复到之前的分布

已采纳

采纳

精彩回帖

精彩

全部评论

(0) 回帖

加载中...

话题同步到我的动态回帖

实习面经，分享一波

更多模拟面试

已采纳

精彩回帖

全部评论

推荐话题

近期热帖

近期精华帖

热门推荐

实习面经，分享一波

更多模拟面试

已采纳

精彩回帖

全部评论

推荐话题

相关热帖

近期热帖

近期精华帖

热门推荐