一面过去挺久,记不清楚了。
刚二面记录一哈:
自我介绍
🤠:怎么找实习这么晚?
🤠:问我想做哪个方向?数仓?数据平台?数据分析?
😳:我其实都不懂,啥都行,面试官解释了一波上面的岗位都干啥的,因为简历上项目写的是关于数仓的,所以我说我喜欢数仓!🤣
🤠:OK,维度分析是啥?你项目是按什么来划分主题的?
😳:我不会。很难受,怎么问的和以前的面试不一样?不问MR吗?Shuffle?JVM?多线程?Linux,数仓基础么得,很难受😵 瞎说一通
🤠:这个你理解的可能有些偏差,下去可以看看这方面的东西。
😳:没问题
🤠:hive sql在你项目中的占比有多少?
😳:很懵,支支吾吾了一会儿,2/3吧
🤠:OK,来了一道场景题:统计用户的第一次访问时间,总访问次数
😳:巴拉巴拉。。。
🤠:数据量很大,这个查询会有什么问题?
😳:其实没get到面试官想考啥,最后他提示NameNode会出现啥情况?可能是想考高可用还是其他啥,我不知道,我就扯到HA上去了。
🤠:我们有一些直播间,想把一些fashion的直播间在首页退出,一些不太fashion的直播间就不在首页推出,你有什么策略吗?
😳:我以为要考我row_number(),排序,我就说给直播间打分,然后按分数高的排序,将高分的在首页推出。
🤠:那怎么打分呢?
😳:这就很萌了啊!我哪里知道啊,就说呗。可以按年龄或者其它属性,给直播间打分啥的,我也不会。
🤠:你这年龄歧视可不行啊!
😳:没有,没有,我就那么一说。
反问环节
哎,太难了!
全部评论
(0) 回帖