7.15晚饭时间面试了工具链-大型模型训练方向见习研究员, 预备9月开始远程. 流程技术面*2 + HR面*1.
看了以前的面经, 很多ML基础理论, 还有手撕代码, 也很认真地预习了一下午ML理论细节.
但是发现真的不对口, 而且时间和地点上好像也不符合.
------
面试在牛客上, 允许本地IDE.
面试分为3部分: 项目介绍, 基础知识, coding.
* 个人情况
学习安排, 实习衔接, 到岗时间, 远程情况
通信原理等计科基础课学过吗? 答: 本科简单学过, 但现在数学课多一些.
* 项目介绍选了之前实习的NLP项目, 面试官补充提问数据量, cuda型号数量和bug (可能是想验证), 有没有cuda并行...还聊了一些别的.
项目中的角色: python算法, 主要是模型搭建与验证, 和岗位不对口.
* 基础知识
1. pytorch中dataloder里的并行参数的原理, 其实就是同时拿取数据的1/n...感觉太简单没敢说QAQ
2. 介绍一下GPU并行编程. 我诚实地表示只用过mpi4py, 每个进程模型是复制的, 最后梯度汇总到总进程上. 面试官表示emmm
3. 问了pytorch和fairscale ckpt activation的原理, 面试前和面试官交流准备过.
4. 针对ckpt activ的细节交流, 此时双方均已弃疗开始纯交流.
* coding部分:
螺旋矩阵. 原题且可以开本地IDE, 绝对很快就能把两种方法贴上来. 但是弃疗到懒得作弊, 结束面试后把代码发给面试官了.
------
现在已经看到面试官重新挂实习贴了, 凉.
虽然原本就是临时起意, 重在参与, 而且知道不对口, 但还是烦躁且忧桑.
兑现昨天的诺言, 希望能帮到有需要的人.
今天农历生日, 马上也要开始学位论文了, 前路茫茫.
全部评论
(2) 回帖