首页 > 猿辅导2022秋招数据分析笔试
头像
oso
编辑于 2021-07-31 21:22
+ 关注

猿辅导2022秋招数据分析笔试

第一次在牛客网发帖,分享经验也记录一下自己的秋招历程吧。

1. 笔试情况:

时间:2021.7.31,
时长:1.5h(19:00-20:30)
题目类型:选择题(大约60分,22题),填空题(24分,8题),简答题(80分,4题)
方式:必须分模块逐个进入,每个模块完成后不可返回修改。
考前搜了一下经验贴,据说概率题特别多,果不其然...选择题虽然也考了别的类型(图形判断、机器学习、sql)但基本只有一题,大部分还是概率计算。
我做题的顺序是选择、简答、填空(因为分值小),到后面时间紧所以填空题我没有怎么记。选择有些也漏掉了。

2. 选择题

  1. 一组5个数,第二组每个数都比第一组大5,两组的方差和离散系数的关系如何?
    • 考点是方差计算和离散系数。离散系数是标准差/平均数,因此第二组的会比较小。
  2. 下列哪个不是DDL语句:rename,create,grant,alter
    • 没有用过DDL,懵了
  3. ID3算法在分类属构建中,使用哪个度量来进行分类节点
    • 信息增益。查了下发现是牛客网的原题...看来真的很需要刷题
  4. 6个乒乓球,4新2旧。第一局随机拿了两个出来比赛,放回。问第二局随机拿两个出来全新的概率
    • 分情况考虑第一次拿球的新旧情况即可。
  5. 九宫格纸扔直径为1的硬币,要求硬币与线不相交的概率小于1%,求格长a的范围
    • 几何概率。首先a>1,然后分边都是4/(a-1)
  6. ABTest样本量依赖于哪个变量?有实验分组,实验时长,实验开始时间,置信水平。选了置信水平。
  7. 考了算法和应用场景是否正确。涉及到聚类和关联规则算法
    • 关联规则算法不太熟,要学一下
  8. 1000观众2个电影院,观众选电影院的概率相等,其中一个电影院需要设置多少个座位,才能保证观众因为没有座位离开的概率<1%?
    • 伯努利分布
  9. EXCEL两个有共同id的文档怎么做匹配。选了vlookup
  10. 4个不一样的球随机放进5个杯子,一个杯子中最多有3个球的概率是?
  11. 这题完全没看懂...酒鬼喝醉后回家的概率和鹦鹉喝醉后回窝的概率分别是多少。对你没看错...完全不懂要考什么。选项有1,1/2;1,1/3;1,1;0,0。
  12. 计算连续十年的天数,可能有哪些?
    • 可能出现2或3个闰年,且可能出现逢百不闰的情况,因此选了3651,3652,3653
  13. X和Y分别抽样,样本相关系数是0.75,说明什么。
    • 选项有四个里面三个相关;总体相关系数为正;选了如果做回归分析,回归系数为正。
  14. SQL里有where, group by, having, order by语句,执行顺序是
  15. x服从(1,5)的均匀分布,进行3次独立抽样,至少2次大于2的可能性是
  16. 数据预处理中不需要做归一化处理的是?决策树,主成分分析,逻辑回归,XGB
    • 知识盲区了,要好好补习机器学习!
  17. X~N(80, 20平方),抽样100,样本平均值和总体平均值差大于3的概率
    • 刚好复习了!样本均值的标准差(SE)是2,所以就是1.5个标准差包含多少样本。
    • 难道1.5也要背嘛...考完查了下是0.86638

3. 简答题

  1. 业务分析。猿辅导春季会出一系列低价导流课,目的是引流到高价正价课。其中一个导流课转化率降低了,分析原因。
    我把能想到的都写了些...感觉还不够系统化
    • 检测是否有数据异常
    • 检测课程是否特殊,这个低转化率是否是预期的、正常的。比如课程科目、这个课的新客渠道天然转化率低等等。
    • 如果没有就拆解。外部因素竞品、时间、(想写政策但觉得太嘲讽了)市场营销等;内部因素拆分课程质量(完成率、平均完成课时之类的量化指标)、人群构成等等。总之就是拆解再归因。
  2. 估计北京有多少个理发师
    啊这!要练一下sizing题
    我大概从需求的角度估计了一下。就类似北京2000万人,男女拆拆,每个人每年平均理发多少次;然后理发师每人每年能接待多少人次。
    因为完全没做过拆解题,不知道这个思路行不行;中间的过程数也基本靠编/脑补qwq
  3. 为冰淇淋品牌打工;夏天到了听说同行都涨价所以老板也想涨价,要评估一下涨价的效果。
    我假设了下这个是toB的业务,以及老板关心的核心指标是利润。
    • 感觉先要收集数据。了解一下业务方aka老板的涨价预期;还有打听同行的涨价范围
    • 供需关系而言,如果我们涨价的幅度(因为toB业务量大,我就写了价格比,如果toC小商品可能是价差吧)跟其他人差不多,就不用管,按之前的销量*新单品利润估算;如果差的比较多,可以基于我们的历史数据、市场上其他品类的数据,估计一个价格-销量达到函数,重新算一下销量,以及其后的利润。
      总感觉想的有点简单...但一时也没想到更多的了。
  4. 不记得了。。。

4. 填空题

  1. 假设检验分为哪两类?
    • 有点懵...总之写了参数非参数
  2. 射击4次,命中率稳定,每次都是独立事件。至少命中1次的概率是80/81,求命中率。
    • 写了2/3
  3. 一个商品如果卖500铁定买,每加价1元概率小1%,问最优定价是多少
    • 计算期望TT_TT 时间太紧算错了
  4. 100人抽球,盒子里2个黑球3个红球。抽到黑的,如果生于7月1日就说是,否则说否;抽到红的,如果是女的就说是,否则说否。最后35人说是,求女性比例。

5. Summary

基础不牢!太久没做概率题可以原谅,可是机器学习算法,常见分布计算都不够熟。
sizing题要加练。
In general第一次尝试笔试,结论就是多多刷题。多多多多多刷题

Wish me luck and good luck to everyone!

全部评论

(5) 回帖
加载中...
话题 回帖

推荐话题

相关热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐