首页 > 拼多多数据分析工程师社招面经
头像
OutlawsOfLove0811
编辑于 2021-04-07 20:25
+ 关注

拼多多数据分析工程师社招面经

拼多多

1.问:贝叶斯公式复述并解释应用场景

2.问:如何写SQL求出中位数平均数和众数(除了用count之外的方法)

3.问:如何避免决策树过拟合

4.问:朴素贝叶斯的理解

5.问:SVM的优点

6.问:处理需求时的一般思路是什么,并举例

7.问:hadoop原理和mapreduce原理

8.问:现有一个数据库表Tourists,记录了某个景点7月份每天来访游客的数量如下:id date visits 1 2017-07-01 100 …… 非常巧,id字段刚好等于日期里面的几号。现在请筛选出连续三天都有大于100天的日期。上面例子的输出为:date 2017-07-01 ……

9.问:在一张工资表salary里面,发现2017-07这个月的性别字段男m和女f写反了,请用一个Updae语句修复数据。例如表格数据是:id name gender salary month 1 A m 1000 2017-06 2 B f 1010 2017-06

10.问:现有A表,有21个列,第一列id,剩余列为特征字段,列名从d1-d20,共10W条数据!另外一个表B称为模式表,和A表结构一样,共5W条数据 请找到A表中的特征符合B表中模式的数据,并记录下相对应的id。

11.问:我们把用户对商品的评分用稀疏向量表示,保存在数据库表t里面:t的字段有:uid,goods_id,star uid是用户id;goodsid是商品id;star是用户对该商品的评分,值为1-5。现在我们想要计算向量两两之间的内积,内积在这里的语义为:对于两个不同的用户,如果他们都对同样的一批商品打了分,那么对于这里面的每个人的分数乘起来,并对这些乘积求和。

更多模拟面试

全部评论

(3) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐