lz 3-30下午面的,呜呜呜,之前意向部门投的是教育好像,或者是广告,竟然竟然没被捞,被其他部门捞起了,有点小失落。
总结:
1、形式
腾讯会议,一个面试官,未开摄像头
2、内容
简历:
详细讲讲你简历提到的遇到数据质量问题、或者口径不一致的处理
你刚才说的偏经验性发现问题,有没有是制定了完整的体系验证数据质量
讲了你提到的AB TEST
拆解异常指标的体系
统计学:
1、AB TEST 中用到的统计学的相关的方法你会吗,基于独立样本t 检验之类,说了我们之前在流量分层的、很多地方没有做的特别好吗,并且对于结果没有很好的定性的严谨的统计学评价,
···害,lz 这块因为实际工作当时真的不严谨,就解释了一下,瞎掰扯了自己学过什么,样本量确定之类的多余知识,也不知道能不能弥补
2、AA TEST 会吗,lz 直接 有点懵。这是个啥呀,现在想想 也是可以瞎猜出来的,实验变量就那么几个,如果不是AB ,AA的 话,那可以再控制的就是时间,换流量,好吧,好像查资料后我的理解并不对,附上解释和链接:
“
在大多数其他情况下,A / A测试是一种再次检查A / B测试软件的有效性和准确性的方法。您应该查看该软件是否报告控件和变量之间存在统计上的显着差异(统计上的显着性> 95%)。
如果该软件报告存在统计上的显着差异,则说明存在问题,您需要检查该软件是否已在您的网站或移动应用程序上正确实现。”
3、假设检验的两类错误
HIVE:
用的多吗
常用的函数,问了order by sort by 的区别
数据倾斜原因大概会是
数据倾斜的解决方案
如果场景出现在是join 的时候数据倾斜怎么解决
反问:
lz 是在是非专业的计算机渣 ,特别怕用算法,问了对实习生期待,比如会要求算法吗
面试官 讲了大概所在的部门在做的事情大概是,然后接下来的话震惊了,给lz 一顿上课,醍醐灌顶,算法也是我们支持数据分析的一个过程,你用什么什么 方法的时候 ,,,怎样怎样,但是可能用算法的时候,我们的feature很容易找到,,,,这块lz 其实大概已经听不太懂,
中心意思就是,不会也行,但是算法对业务帮助很大。
呜呜呜:
感受,渣渣表示之前寒假的时候,滴滴挂了4个,2一面,2二面,当时统计学是真的渣,建立内容也说不清,甚至两类错误都答不出来,更不用说hive ,数据倾斜听都没听过。不管这次被捞起或不捞吧,lz 觉得能答出来真的很感动了。
最后渣渣许愿许愿,祝看到的大家都成功上岸!
全部评论
(1) 回帖