首页 > 快手数据分析实习面经(已offer)
头像
PlutoZong
发布于 2020-09-10 14:04
+ 关注

快手数据分析实习面经(已offer)

快手的面试官真的非常温和...
所以大家面试的时候不用紧张,求职是一个双向选择的过程,面试官在考察你是否有胜任工作岗位的能力,而你也需要去看这份工作是否真的适合你,是你想要去做的方向。
以下是面经:
一面:(60mins) 
1.自我介绍
这里要介绍自己的实习经历,和曾经做过跟数据分析相关的项目
目的就是展示你会应用多少分析工具,并且使用到什么程度,得出什么样的成果。
一定不要过于夸张,要熟悉自己所使用的模型以及软件,精炼的总结下来,面试官会根据你的经历,对感兴趣的项目进行深挖。
ex:你的数据如何获取?如何筛选? 怎样选取的模型? 如何评判模型的好坏? 最后呈现的结果以什么形式?你有什么反思,还有什么可以提高的地方?

2.概率与统计学知识考察
这里主要是考察条件概率的题 
一共有5个抽屉,现在有一份文件有2/5的概率扔掉,3/5的概率放在抽屉里,在第一个抽屉没有文件的情况下,文件放在另外四个抽屉的概率是?

3.编程能力:sql (引擎sqlite3)
建议熟悉hive,这个是工作中使用的。
题目:日活用户留存率计算
table: 活跃用户表 active_user  字段 user_id, p_date
活跃用户的次日~7日的留存率

主要思路:
首先提取不同device下的首次登陆日期,利用datediff()函数去计算,差值为1,2,6...则为次日,三日,七日留存记录
根据group by 和count() 来计算不同天登陆的人数,有需要的话用 round()保留小数。
/*计算某日新增登录设备的次日、3日、7日、14日、30日、90日留存率*/
SELECT
    log_day '日期',
    count(user_id_d0) '新增数量',
    count(user_id_d1) / count(user_id_d0) '次日留存',
    count(user_id_d3) / count(user_id_d0) '3日留存',
    count(user_id_d7) / count(user_id_d0) '7日留存',
    count(user_id_d14) / count(user_id_d0) '14日留存',
    count(user_id_d30) / count(user_id_d0) '30日留存',
    count(user_id_d90) / count(user_id_d0) '90日留存'
FROM
    (
        SELECT DISTINCT
            log_day,
            a.user_id_d0,
            b.device_id AS user_id_d1,
            c.device_id AS user_id_d3,
            d.device_id AS user_id_d7,
            e.device_id AS user_id_d14,
            f.device_id AS user_id_d30,
            g.device_id AS user_id_d90
        FROM
            (
                SELECT DISTINCT
                    Date(event_time) AS log_day,
                    device_id AS user_id_d0
                FROM
                    role_login_back
                GROUP BY
                    device_id
                ORDER BY
                    log_day
            ) a
        LEFT JOIN role_login_back b ON DATEDIFF(DATE(b.event_time),a.log_day) = 1
        AND a.user_id_d0 = b.device_id
        LEFT JOIN role_login_back c ON DATEDIFF(DATE(c.event_time),a.log_day) = 2
        AND a.user_id_d0 = c.device_id
        LEFT JOIN role_login_back d ON DATEDIFF(DATE(d.event_time),a.log_day) = 6
        AND a.user_id_d0 = d.device_id
        LEFT JOIN role_login_back e ON DATEDIFF(DATE(e.event_time),a.log_day) = 13
        AND a.user_id_d0 = e.device_id
        LEFT JOIN role_login_back f ON DATEDIFF(DATE(f.event_time),a.log_day) = 29
        AND a.user_id_d0 = f.device_id
        LEFT JOIN role_login_back g ON DATEDIFF(DATE(g.event_time),a.log_day) = 89
        AND a.user_id_d0 = g.device_id
    ) AS temp
GROUP BY
log_day

3.业务题
(1)如何判断一个用户/创作者是否有价值,要考虑哪些因素?
答:
    首先,创作者分三种类型,可以区分来看:
  •  UGC:用户生产,是一般用户
  • PGC:专业用户,是拥有专业知识、拥有内容相关领域资质的、拥有一定权威的舆论领袖
  • OGC: OGC的内容,有两种主体,一类人是新媒体从业者、新闻背景工作者、传媒行业人员创作;二类人是某些行业的精英、特长、专业人士,与PGC一样
由于主体不一样所以衡量的侧重点也不一样,衡量创作者的价值,主要从内容质量和用户变现能力来衡量。
内容质量:
  • 观看者数量,观看者页面停留时长,视频内容完播率,点赞率, 在视频内容质量优质时 这些指标较高
  • 评论数,扩散数,代表了用户作品的传播能力,这表示视频较有感染力,传播性强,具有潜在商业变现价值
  • 用户转化率,观看视频后转化成粉丝的比例,用户粘性数据(重复活跃观看的用户数据),同样代表了该条视频内容受粉丝认同度高,且可具有连续产出高质量视频的品质
  • 用户流失数少
  • 同时,反向观察 观看用户和粉丝, 对观看用户进行分层和用户画像描述,如果观看用户质量较高,付费行为多,也能够说明创作者有很高的价值
变现能力:(商品窗口,广告植入等变现能力)
  • 活动参与人数(点击数)
  • 点击转化数(进行实际购买行为的)
  • 进行实际购买的价值量
  • 变现渠道的分析,如果某一个变现方式比较高效,并且优质变现渠道人数更多,那说明博主善于运营变现工具,带货能力强。
答的有点多就不具体分析了,hahahahahh...

(2)你用过快手么?你认为快手和抖音有什么区别?
(快手其实是面试前几天才下载的。。。😂所以可能不是那么的全面,但是不得不说,快手想做的东西真的很多,也很全面做了很多提升。)
功能设计:
  • 首页设计                                           
        抖音:大屏瀑布流式设计,在上下划动的同时,直接播放
        快手:多屏+点击播放  或  大屏自动播放
  • 评论功能
        抖音:右侧评论栏,点击后屏幕视频仍旧播放,沉浸式体验感有连续性, 评论引导词为:有爱评论,说点好听的。 具有情感引导
        快手:多屏下,下划查看评论,视频停止播放。大屏下,弹幕形式(我觉得这个弹幕还蛮有趣的吼吼吼。。。)快手:说点什么
  • 收藏
        快手的收藏是可以添加标签的这一点我认为还是优于抖音
  • 其他
      快手有说说功能,top视频热门分类展示
      抖音更新了视频功能
 其实在功能设计上,两个公司想做的东西真的不一样,还是挺有意思的。
记得分析的时候加上优劣分析对比,在这里懒得写了。

用户群体:
其实从公司的宣传标语就能区分, 抖音的标语是:记录美好生活,而快手是,每个人都值得被记录。
快手的兴起 也是基于草根文化,所以用户群体更趋平民化 从地域上来讲以北方人居多
抖音相比,更多为年轻人,喜欢引爆点高,传播性强的潮流形式,地域多为南方


二面:(60mins)
1.自我介绍
2.概率论:
甲、乙交替掷骰子,谁先扔到6⃣️谁赢, 甲先扔,请问:甲赢的概率是...
3. 编程题:
table: 活跃用户表 active_user  字段 user_id, date,active布尔型(1为当日活跃,0为当日不活跃)
可利用窗口函数(row_number())填充序列号+自连接

面试官有引导着做,真的可以说十分善良了。。。by the way 一定要熟悉窗口函数呀~!
4.业务题
某一天的日活用户大幅下降,请问如何分析,并且对应的解决方案是?
这个问题牛客网上很多回答啦~所以就不写了

that's all~
面试一定不要放弃,好好准备都会有好结果哒!

更多模拟面试

全部评论

(9) 回帖
加载中...
话题 回帖

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐