首页 > 拼多多数据分析提前批笔试面经(9.1)
头像
蛋皮蛋
编辑于 2020-09-02 15:54
+ 关注

拼多多数据分析提前批笔试面经(9.1)

题型10道单选加3道问答(2道sql,1道分析);和8月初的笔试题型一样。
单选:1.给均值和标准差,求落在两个标准差范围内的最大概率?
2.1-20,选择4个数,不允许出现两个相邻数字的情况。
3.关于标准误说法正确的是什么。
4.给一串数字,找规律。
5.神经元节点计算什么?
6.roc越接近哪一点,说明分类器分类的效果越好?
7.行测题;
还有3题不记得了,有好心人可以补充一下。。。。。。

问答题:
1.serv表包含session_id(咨询会话唯一标识),uid,star_time(咨询开始),end_time(咨询结束);
usr表包含uid, create_time(注册时间)
(1)最近7天/15天咨询的用户的情况

(2)2017,2018,2019注册的用户在今年7月的平均咨询次数,平均咨询时长(秒)
第二问写下我自己的答案:
2017: select count(s.session_id)/count(u.uid) as avg_serv, sum(datediff(second,star_time,end_time))/count(u.uid) as avg_time
From serv s right join usr u on s.uid=u.uid
Where year(create_time)=‘2017’ and month(star_time)=“07”
2018: select count(s.session_id)/count(u.uid) as avg_serv, sum(datediff(second,star_time,end_time))/count(u.uid) as avg_time
From serv s right join usr u on s.uid=u.uid
Where year(create_time)=‘2018’ and month(star_time)=“07”
2019: select count(s.session_id)/count(u.uid) as avg_serv, sum(datediff(second,star_time,end_time))/count(u.uid) as avg_time
From serv s right join usr u on s.uid=u.uid
Where year(create_time)=‘2019’ and month(star_time)=“07”
2.一个表
user_impr(uid, list_id(请求id), stat_time(商品曝光时间),idx(商品位置),goods_id(商品id),cate_id(品类id))
每次请求会同时曝光很多商品,可能出现相邻两个位置是相同品类的密集情况,求这种情况下的密集商品曝光量占比( 相邻位置是相同品类的pair只记一次密集曝光)
Select count(distinct a.idx||b.idx as pair_idx)/ ‘密集曝光数’
From(
Select a.idx,b.idx, a.cate_id, b.cate_id, count(a.idx||b.idx as pair_idx) as‘密集曝光数’
From user_impr a join user_impr b on a.lsit_id=b.list_id ) temp
Where temp.a.idx+1=temp.b.idx and a.cate_id=b.cate_id
sql自己写的都不确定,大家可以一起讨论一下。。。🤣

3:拼多多准备携手国际大牌,给予百亿补贴活动,是提高dau还是gmv(我不确定了......我怎么记得是gmv,但是我看到两个帖子都是dau,求好心人证实)


更多模拟面试

全部评论

(5) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐