主要问了机器学习算法,场景题,数据结构,java,数据库,深度学习基本没问。。
下面我答略的是认为回答的没问题的,具体写的是感觉有问题或者面试官反馈不好的,大家可以帮忙看看应该怎么答更好,谢谢
1.简单自我介绍一下自己
2.我看你你论文(硕士小论文,发的sci)用到了knn,讲一下knn,讲完还反问我knn是用来分类的?面试官会装呆然后看你是不是确信
答:略
3.k-means和knn有什么关系,区别?讲讲
答:略
4.k-means聚类效果会不会因为初始选取点不同,聚类效果完全不一样?k-means聚类效果和k的大小有什么关系?
答:略
5.你做分类的时候如何评估好坏呢?追问比如:你分类总数为2,但是现在出现第3种类别,怎么办,例如做的分类是男女分类,现在有个中性的人,那你怎么办呢?如何应对这种情况?😅
答: 我说这种情况分类效果肯定不好,应该要在训练集里面加入有类似特征的样本,但是面试官感觉不满意,说你以前没遇过这种情况吗?
6.说说逻辑回归吧,适用于什么场景呢,和knn区别
答:区别我说lr先验是二项分布,knn没有先验,lr基于极大似然估计,knn基于欧式距离计算等
7.线性回归和逻辑回归关系,区别
答:略
8.决策树具体讲讲,原理,如何选取特征的,怎么进行分类预测的?
答:略
9.随机森林原理,和决策树有什么区别,追问投票是怎么投票的?
答:略
10.问问你数据结构,如何判断一棵树是另一棵树的子树?
答:略
11. 给你个数组,如何判断这是数组是不是一棵树的后序遍历
答:答的不好
12.后序遍历有什么特点
答:略
13.如何判断一棵树是不是平衡二叉树
答:记不清了。。。
14.场景题:如何从百万数据中找出最大的k个数
答:分治+堆排序
15.堆排序熟吗?
答:快排和并归更熟
16.一个很大的日志文件里面存了各个ip访问的信息,几百G,如何统计里面某个ip地址访问的次数
答:不一次性读取,分批读,缓存,然后分别统计,最后加起来
17.java hashmap底层,怎么存数据?
答:链表+数组,回答了比较hashcode,但是不满意,让我再说的细一些
18.数据库用过吗?
答:不熟
19.你的规划的做算法还是工程?
答:工程,追问但是我看你算法准备的更足一些,给我解释了一下 算法和工程的区别,我以为算法是纯研究型的那种
20.用java写过一些小项目吗?python更熟是吗?然后根据我简历里面链接看了我的项目,但是他说他那边github打不开,就看了看我csdn博客
21.有没有什么要问我的
答:问了面试官的他们部门做什么业务
大概这些,总共43分钟,问的很基础,但有些地方答的还是不好,还是怪自己太菜了,许愿有下一面
全部评论
(1) 回帖