首页 > 热乎乎的百度面经(机器学习/数据挖掘/自然语言处理工程师)
头像
张麻子不是张牧之
编辑于 2021-04-20 14:41
+ 关注

热乎乎的百度面经(机器学习/数据挖掘/自然语言处理工程师)

28号从早上九点半开始面试,到十一点四十结束,趁热打铁,不妨整理下我的面经。首先说百度的面试体验是非常专业的,无论从流程安排还是面试官的水平,技术一面二面三面是连续的,如果哪一轮不幸挂掉了,那可能就需要秋招加油了。

一面

  1. 自我介绍
  2. 聊做过的项目,这里注意要按照逻辑顺序交代项目背景、遇到的跳招,手段和成果,让面试官更清晰地了解你做过的项目。
  3. 手撕代码:最大的字序和
    我一开始很蠢的用了O(n2)的递归去做,面试官无语的diss了一下,后续改成O(n)的,中间还是出现了一些小差错。
  4. 树模型:ID3和C4.5的区别;RF和GBDT的区别;GBDT是否适合于处理大规模的ID特征
  5. 知道哪些激活函数,都有什么特点,如何使用

问问题环节:我问了面试官做什么业务,面试官回答百度是统一面试,后续再具体分部门,所以如果没有内部关系,不知道自己会被安排到什么部门。

二面

  1. 聊做过的项目,和一面讲的是同一个项目。
  2. 项目中用过CNN:CNN有什么特点和优势;常用的pooling方法有哪些,那个更好?
  3. 手撕代码:学生成绩的第1000名
    一开始没问场景直接搞了最大堆,面试官中间暗示我可以问问具体场景。面试官说不要用堆,想想O(n)的方法,因为成绩是整数且有最大值,可以统计一遍信息然后二分查找,没写出来,面试官说OK了,思路有了就可以了。
  4. 开放问题,聊了聊项目模型和DSSM模型的区别;
  5. 开放问题,逻辑回归特征重复了一维会有什么影响。

三面

  1. 聊做过的项目,和一面讲的是同一个项目(所以对于菜鸡来说,有一两段能聊的项目经历太重要了)。
  2. 项目如何验证有效性,在业务中怎么用
  3. 聊聊项目中的一些bad case
  4. 训练时样本不平衡问题如何解决;小样本问题如何解决
  5. 给一个任务:垃圾邮件分类,分阶段和流程细致描述一下每一步应该怎么做,以及最终要优化的效果。

剩下聊了什么时候能来实习,可以实习多久。最后面试官介绍了一下自己部门的业务,通知两周之内会有hr联系。

更多模拟面试

全部评论

(14) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐