一面 4.10
- 编程题快排法求数组第K大,并说出时间复杂度(O(n))。牛客链接
- 问其他熟悉的排序算法,并说出对应的时间复杂度。
- 随机森林和GBDT的最终决策区别,随机森林是平均加和,GBDT是加权加和。
- 设计一个推荐新闻的系统。面的时候主要从特征和模型角度阐述。
- 社交网络寻找所有的二度好友(好友的好友)及dfs和bfs的时间复杂度。
面完后,面试官叫去吃个饭,准备后面的面试。
二面 4.10
- sql题,找出去重后的某个字段。要求写出sql代码。楼主用了distinct,问还有别的方法吗,面试官说了group by,然而不记得group by的结果了。。。
- 第一题的列表版本和文件版本(即文件中的一行就是数据库表中的一行)。要求写出代码。
- 第一题的海量数据版本,一个大文件每一行都是一个query串和url串,要求得到所有不重复的url。答对url进行hash后模上1000分成1000个文件,再对每个文件进行统计。海量数据处理容易问到,面腾讯阿里的时候也被问到过。推荐博客十道海量数据处理面试题与十个方法大总结
- 用过hadoop吗?答没有
- 过拟合怎么解决?
- 低活、中活、高活用户分类,设计方案。如果数据不均衡怎么做,应该使用什么评价指标。
- AUC怎么算的,ROC曲线怎么画的。
- 第一类错误和第二类错误。这个没答上来。
面完后,反问面试官基础是不是不好,答基础挺扎实,可以把sql和机器学习的基础看看。然后叫楼主等三面。
三面 4.10
- 问每一个项目的每一处细节,会反复跟你确认。
- 问项目的意义。
- 问获奖经历,优缺点和看的书。
这一面很明显感受到压力,给自己一种表达能力很差的感觉,因为不断在重复解释概念和原理。最后反问,您觉得我表达能力还需要提高吗?面试官没有直接回答:任何时候都需要提高表达能力,工作了也是一样。这一面会从比较高的角度来讨论你的项目,比如项目的宏观意义是什么,能解决什么问题,需要你对项目有一个整体的认识。下来和师兄聊到这个话题,总结就是项目要能大能小,大是指能把握项目大的整体方向,小就是对所有细节都能了如指掌。
结语
祝愿大家都拿到自己的dream offer,还没拿到也不要着急,好好准备,虽迟但到~
全部评论
(11) 回帖