一、单选(5*6)
1、Linux的vim命令表示保存并退出的是(wq)
2、ARPU指标含义(每名用户平均收入)
3、下列常用来解决二分类问题的是(PageRank/DBSCAN/K-means/LR)
4、SELECT null+1+2+5返回的结果
5、不属于Python内建数据类型的是(array)
6、满足线性相关性的变量XY之间:Y=a+bX,系数b(显著不为0)
二、多选(5*3,错选不得分,少选一半分)
1、数仓是一个什么样的系统……(相对稳定的、不断变化的、集成的、反映历史变化的、面向主题的、接近当前的)
2、属于Hadoop生态圈的有(oracle/python/sqoop/hive)
3、Hive表存储支持的文件格式(orcfile/textfile/hashfile/rcfile)
三、判断(5*3)
1、指标体系必须基于对业务的深刻理解
2、SELECT条件中a<>1不会对a的空值进行过滤
3、Linux删目录语句rmdir dir,若dir非空,则删除失败
四、SQL(10*3)
表order: id user_id city order_time
表user: user_id user_name
1、求2018年1月~3月各月份各用户的订单总数(月份格式:YYYYMM)
格式:Month user_name order_nums
2、求在深圳下过单但从未在北京下过单的用户
格式:User_id user_name
3、统计张三、李四、王五三人在各城市的订单量
五、问答题(10)
oppo内置浏览器日活比上周下降了51%,如何分析找到原因(从数据分析角度,不要从运营人员角度)
1、需要哪些数据
2、如何归因
3、可能得到什么结果
全部评论
(1) 回帖