四面一共两百分钟超详细!!HR面一定要过啊!!!(3.30更新 已收到oc)
一面(牛客55min)
自我介绍
SQL
一直不停地问我怎么去优化!!!问吐了
- 计算用户留存率
用户活跃表:dws_user_active_t
ds bigint comment '日期,分区,yyyymmdd',
device int comment '设备类型',
user_id bigint comment '用户id',
active_score double comment '活跃度'
计算留存率=(昨天活跃用户∩今天活跃用户)/昨天活跃用户 - 根据不同设备,用户活跃度得分排序,输出排名,20200515当天
- 除了distinct外还有什么方法去重
- partition by 和 group by 的区别
- rank和row_number区别
- hive, hadoop的原理
大数据和普通数据的区别,举个例子
介绍一个项目
怎么做假设检验
两个向量之间的相似性计算有什么方法?
逻辑回归
- 函数特点?还有呢?还有呢?
- 归一化吗?为什么归一化?
游戏DAU下降分析
二面 (牛客50min)
自我介绍
python题
- 根据value倒序输出字典
- list, tuple, set, defaultdict的区别
项目经历
问到的问题:
- 皮尔森相关系数以及如何解读,相关、独立、线性相关区别;
- 完整解释PCA, PCA缺点:高维数据能适用PCA吗?类别变量onehot能用PCA吗?
- 偏态分布怎么处理
- 特征工程怎么做的
- ensemble怎么做的,怎么提高ensemble的表现
- 模型评估指标的选择
- AUC怎么算
设计游戏综合表现指标、流量分配
- 指标:DAU、注册、分享、充值……,两个游戏指标有高有低,该给谁流量。
- 分享率:10个人1个分享,100个人10个分享,如何确定置信性。
- 开放题:还是上面几个指标,几万个游戏,如何设计一个综合指标/打个分
三面 (腾讯会议 43min)
自我介绍
项目介绍
以王者荣耀为例,怎么划分用户的生命周期?
怎么判断即将流失用户用户,怎么判断即将流失用户
抖音如何从数据分析的角度进行内容分发
常用数据分析的工具和套件有去了解过吗?
实时流方面了解过吗?hadoop了解过吗?
学校、地域等等
四面 (腾讯会议 45min)
内容大概就是让我吹吹我自己。
自我介绍
自己在项目中遇到困难是怎么解决的,举几个例子
就某个问题的分析思路讨论(争论)了很久
全部评论
(14) 回帖