一面 2020.07.12 60分钟
1.spark的组件有哪些
2.hadoop的架构
3.hadoop与spark区别
4.hadoop作业提交到yarn流程
5.sparkstreaming连接kafka的两种方式
6.项目中hdfs数据怎么写入hive中
7.项目中的难点,怎么解决的
8.mysql联合索引是什么
9.sparkstreaming直连kafka时,Kafka在某一时刻分区数增加了,下游的spark怎么知道的
10.kafka中消费者组是怎么回事?为什么kafka要设有消费者组?作用是什么
11.kafka中producer,broker,cousumer的关系
12.手撕代码:二叉树的序列化与反序列化
全部评论
(2) 回帖