首页 > 百度410算法实习生凉经
头像
September•
编辑于 2021-05-10 22:26
+ 关注

百度410算法实习生凉经

本来寻思等oc后再发的,但是明天就第三批了,索性发出来,希望对大家有帮助!

一面 4.10

  1. 编程题快排法求数组第K大,并说出时间复杂度(O(n))。牛客链接
  2. 问其他熟悉的排序算法,并说出对应的时间复杂度。
  3. 随机森林和GBDT的最终决策区别,随机森林是平均加和,GBDT是加权加和。
  4. 设计一个推荐新闻的系统。面的时候主要从特征和模型角度阐述。
  5. 社交网络寻找所有的二度好友(好友的好友)及dfs和bfs的时间复杂度。
面完后,面试官叫去吃个饭,准备后面的面试。

二面 4.10

  1. sql题,找出去重后的某个字段。要求写出sql代码。楼主用了distinct,问还有别的方法吗,面试官说了group by,然而不记得group by的结果了。。。
  2. 第一题的列表版本和文件版本(即文件中的一行就是数据库表中的一行)。要求写出代码。
  3. 第一题的海量数据版本,一个大文件每一行都是一个query串和url串,要求得到所有不重复的url。答对url进行hash后模上1000分成1000个文件,再对每个文件进行统计。海量数据处理容易问到,面腾讯阿里的时候也被问到过。推荐博客十道海量数据处理面试题与十个方法大总结
  4. 用过hadoop吗?答没有
  5. 过拟合怎么解决?
  6. 低活、中活、高活用户分类,设计方案。如果数据不均衡怎么做,应该使用什么评价指标。
  7. AUC怎么算的,ROC曲线怎么画的。
  8. 第一类错误和第二类错误。这个没答上来。
面完后,反问面试官基础是不是不好,答基础挺扎实,可以把sql和机器学习的基础看看。然后叫楼主等三面。

三面 4.10

  1. 问每一个项目的每一处细节,会反复跟你确认。
  2. 问项目的意义。
  3. 问获奖经历,优缺点和看的书。
这一面很明显感受到压力,给自己一种表达能力很差的感觉,因为不断在重复解释概念和原理。最后反问,您觉得我表达能力还需要提高吗?面试官没有直接回答:任何时候都需要提高表达能力,工作了也是一样。这一面会从比较高的角度来讨论你的项目,比如项目的宏观意义是什么,能解决什么问题,需要你对项目有一个整体的认识。下来和师兄聊到这个话题,总结就是项目要能大能小,大是指能把握项目大的整体方向,小就是对所有细节都能了如指掌。

结语

祝愿大家都拿到自己的dream offer,还没拿到也不要着急,好好准备,虽迟但到~

更多模拟面试

全部评论

(11) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐