花旗银行
基本上是每次面试先问一些非技术的问题,比如为啥离职之类的,之后就是开始问技术问题了。
一面
如何判别mapreduce过程有好的负载均衡?什么是负载均衡?
请举例说明mapreduce是如何工作的?在什么应用场景下工作的很好?云的安全问题有哪些?
(在内存满足的情况下)你认为是100个小的哈希表好还是一个大的哈希表,对于内在或者运行速度来说?对于数据库分析的评价?
为什么朴素贝叶斯差?你如何使用朴素贝叶斯来改进爬虫检验算法?
你处理过白名单吗?主要的规则?(在欺诈或者爬行检验的情况下)
什么是星型模型?什么是查询表?
二面
你可以使用excel建立逻辑回归模型吗?如何可以,说明一下建立过程?
在SQL, Perl, C++, Python等编程过程上,待为了提升速度优化过相关代码或者算法吗?如何及提升多少?
使用5天完成90%的精度的解决方案还是花10天完成100%的精度的解决方案?取决于什么内容?
定义:QA(质量保障)、六西格玛、实验设计。好的与坏的实验设计能否举个案例?
三面
普通线性回归模型的缺陷是什么?你知道的其它回归模型吗?
你认为叶数小于50的决策树是否比大的好?为什么?
保险精算是否是统计学的一个分支?如果不是,为何如何?
为什么说均方误差不是一个衡量模型的好指标?你建议用哪个指标替代?
全部评论
(3) 回帖