我面的岗位是PCG创新项目的大数据工程师,面试方式是远程面试,使用的腾讯面试的小程序。面了1个半小时。面试官倒是挺有耐心的(不给我过还在我身上花这么多时间,心情复杂)
首先问了我项目的一些事情,项目的实现,分工。
然后问了几个问题。
官:如果让你实现血缘管理,你要怎么实现?
我:实际上是一个全链路监控的问题,可以参照日志全链路监控。监控过程可分为两个层面:第一是数据层面,为数据加一个traceid字段,然后每个链路过程加上spanid,并记录时间;第二在作业批次层面,也为每个作业加上traceid和spanid的概念,并将作业过程记录到日志中,使用EFLK采集并解析日志,生成全链路的日志模型。
官:算法题
小Q在进行射击气球的游戏,如果小Q在连续T枪中打爆了所有颜色的气球,将得到一只QQ公仔作为奖励。(每种颜色的球至少被打爆一只)。 这个游戏中有m种不同颜色的气球,编号1到m。 小Q一共有n发子弹,然后连续开了n枪。 小Q想知道在这n枪中,打爆所有颜色的气球最少用了连续几枪? 输入格式 第一行包含两个整数n和m。 第二行包含n个整数,分别表示每一枪打中的气球的颜色,0表示没打中任何颜色的气球。 输出格式 一个整数表示小Q打爆所有颜色气球用的最少枪数。 如果小Q无法在这n枪打爆所有颜色的气球,则输出-1。 数据范围 1≤n≤1061≤n≤106, 1≤m≤20001≤m≤2000 输入样例: 12 5 2 5 3 1 3 2 4 1 0 5 4 3 输出样例: 6 样例解释 有五种颜色的气球,编号1到5。 游客从第二枪开始直到第七枪,这连续六枪打爆了5 3 1 3 2 4这几种颜色的气球,包含了从1到5的所有颜色,所以最少枪数为6。 思路:用两个指针,每次后指针往后移,移到符合颜色数时,前指针看看能不能在符合颜色数的前提下往后移一点。最后每次比较一下长度即可。我:(这一题我写出来了,但是是动态规划解,面试官并不满意,正确答案应该是窗口滑动的算法)
官:回到项目,你的spark作业最大跑的量是多少
我:1亿多
官:你分配用了几个核?
我:唔...32个
官:使用多少资源?
我:唔...没关注
官:跑了1亿多的数据你都不关注你的作业使用了多少资源?(被吊了)
我:唔
官:你大概算下
我:10几G吧(我用每条记录1k的占用算了一下,瞎答了一下。虽然后来验证了下占用的确差不多,但是面试官对我兴趣骤降,直接叫我等通知了。)
以上,总结下我的问题。
1 算法基础还不扎实,还要再多刷下leetcode。
2 我的性格弱点,喜欢创造却不喜欢维护,项目是我做的,但是一直对运维方面比较不重视,对运行时间和空间不关注,是病,要改。
3 面试技巧问题,被问到心虚的问题,用了【大概】,【没有关注】,【唔】这些禁忌词语,现在返回来想想,前面我面的都不错的,如果最后的问题我能够稍微用点技巧,应该还是有机会的。
所以,软硬实力都要再提升一下。
全部评论
(6) 回帖