首页 > 实习面经,分享一波
头像
Sh1k17
编辑于 2020-06-21 20:58
+ 关注

实习面经,分享一波

腾讯:
1.问之前做过的一个NER项目,数据量多大,怎么针对小数据量优化模型的?
2.为什么选择bert+Bilstm+CRF?
3.为什么选择bert的多个隐藏层做加权求和还有拼接,效果有提升吗,提升有多大?
4.问kaggle的一个推特文本提取的一个比赛,问的比较细节,模型的输出是什么样的,单个模型有多大?
5.HMM和CRF介绍一下?
6.代码题,旋转一个链表中间的一部分(从第i个结点到第j个结点)

滴滴:
1.问之前做过的一个NER项目,用了bert的几个隐藏层,怎么处理的,loss函数是什么,和传统的交叉熵有什么区别?
2.了解lstm的三个门函数吗?
3.说一下embedding,word2vec的两种模型,哪个收敛的更快?
4.lstm梯度消失怎么处理?
5.了解graph embedding吗?
6.谈一下embedding的发展过程?
7.CRF中的维特比算法
8.FM算法,deepFM算法
9.代码题:10亿长度的数组,有大量重复数据,怎么查找中位数

创奇新智:
2.手推SVM
3.代码题:一个二维数组,每一行是递增的,找出前k大个数

腾讯:
1.介绍一下bert?
2.RoBERTa和bert的区别?
3.RoBERTa为什么放弃了NSP任务?
4.lstm和gru的区别?
5.layer norm和batch norm的区别?
6.layer norm是怎么做的?
7.代码题:一个字符串,保证非字符符号的位置不变,字符倒序

平安科技:
1.谈一下word2vec?
2.Huffnman树怎么构造的?
3.说一下Bert,Bert的结构?
4.谈一下CRF

1.lstm公式 attention公式
2. 文本分类预处理过程?如何生成词向量?如何抽取特征?去除停用词?(分词-去停用词-文本向量化)
3. fasttext的过程

腾讯二面:
1.为什么用的是roberta?
2.roberta和bert的区别
3.如何处理噪音?
4.如何识别标题党?
5.优化器:SGD和Adam的区别?
6.为什么一般使用SGD而不用Adam
7.代码题:在N个数的list里得到任意N-1个数的乘积(两种方法,除法和不让用除法),
8.在上一个问题的解中找一个最大的结果

滴滴:
1.介绍一下两个比赛
2.为什么用BiLSTM,是效果驱动的吗?
3.CRF和HMM的区别?
4.生成式模型和判别式模型的区别?
5.EM算法和MLE的区别?(有监督,无监督,隐状态)
6.Roberta和Bert的区别?
7.简单介绍了下SVM?
8.为什么SVM要转化成对偶问题求解?
9.SVM使用什么算法求解,大概介绍一下SMO算法?


头条:
1.链表快速排序
2.在一个已经排完序的列表里面找到一个数第一次出现的index
3.把字符串内多余空格去掉
4.两个队列实现栈
5.word2vec负采样
6.lstm和rnn关于梯度消失有什么不同
7.同样的代码不同的初始化结果怎么保证一致
8.tanh和sigmoid的劣势 relu的优势
9.relu失活的问题
10.batch norm
11.负采样之后,需不需要把分布恢复到之前的分布

更多模拟面试

全部评论

(0) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐