title: 数据科学家
base:上海
面试总时长20分钟,希望能通过。ZOOM面试,面试官全程不开摄像头,他说我也不用开不过我还是开了。
1.自我介绍
2.介绍一个项目,我讲了简历上一个项目,他挖了一点细节
模型怎么调参的?用交叉验证吗?
变量是binary的还是numeric的?
怎么改进线性模型的?
R语言输出线性模型会有哪些结果?
线性模型结果中的变量的方差是怎么算出来的?我背了公式。
线性模型结果中的p-value是怎么算出来的?我答 t 统计量。
t 检验和 z 检验的区别?
为什么要处理多重共线性?不处理会怎么样?
你刚刚提到因为多重共线性导致线性模型假设不满足的例子,另举一个建模中可能出现这种情况的例子?
举一个弱假设的模型?我答knn。
kNN距离一般用到哪些?我答我用过欧式距离和余弦距离。
距离的数学定义是什么?一共三个,我漏了一个三角形两边之和大于第三边...
3. 研究生阶段修了什么课?一般用什么软件?
你刚刚提到数据可视化的课,你们课上学什么?
会用Tableau吗?
4. sql中排序函数有哪些?rownumber,rank和denserank区别?(又是这个...醉了)
怎么分组排序?答用窗口函数。
窗口函数语法?
5. 问了什么时候回国,是不是上海本地人...
6. 反问
全部评论
(7) 回帖