首页 > 星环科技nlp算法岗实习-凉经
头像
牛客371827340号
编辑于 2020-11-08 17:13
+ 关注

星环科技nlp算法岗实习-凉经

  1. 自我介绍

  2. 问项目和论文

    1. 怎么得到病人信息的embedding

    2. 病人就诊信息输入是怎么构造的

    3. 病人的就诊信息时序信息怎么体现的

    4. 得到的病人的embedding用在什么下游任务

    5. 合并症是同时对多个疾病预测吗

    6. 二分类的时候采用的评价指标(AUC、F1值)

    7. 为什么用AUC呢?

    8. ROC曲线的横纵坐标是什么,对于假正率过高会导致AUC会偏高(负例样本太多),怎么看?

    9. 随机森林、GBDT的区别。

    10. XGBoost相对于GBDT的优化有哪些

  3. 数据结构

    1. python里的gil锁

    2. python里的多线程、多进程

  4. 算法相关

    1. dropout在训练和预测的时候有什么区别?在训练的时候和预测的时候需要做什么处理。

    2. 类别不平衡问题有哪些解决方法,在不同的场景里。(除了上、下采样,改loss权重,还有别的方法吗)

    3. 正则表达式的底层实现的数据结构是什么

    4. 从海量数据集中匹配一段字符串,除了正则还有什么别的办法,从数据结构和算法方面思考。

    5. word2vec模型输出层参数优化方面做了哪些工作,loss_function优化。

    6. 了解transE或者DistMult吗

    7. transformer的提出是为了解决了问题,transformer里的时序性是怎么体现的

    8. 了解spark吗

  5. 算法题:给定数组list,返回任意一个出现次数最多的数。

更多模拟面试

全部评论

(2) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

近期热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐