从三月中开始陆陆续续开始了春招实习的面试,过程坎坷...菜鸡的我现在只拿了携程的offer,也看了很多牛客上面的面经,回馈牛客,许愿一波阿里的hr面+意向书,求求了
update 4.21:
update 4.16:
字节 二面挂
3.15 一面手撕 下一个permutation 紧张懵逼状态。。没写出来
没问项目和比赛
数据库的连接方式是 hash join? 如果是笛卡尔积呢?怎么做连接
Mysql的索引 B+树的特点?
操作系统 虚拟内存的作用 ? 为什么要有虚拟内存?缺页置换算法
CPU这一块的了解 (寄存器 运算逻辑单元 控制器)
大概说一下你对MapReduce的了解 为什么要有多个reducer 整个工作流程 为什么要有环形缓冲区? reduce去哪里获取数据? 拉取完之后怎么输入到reducer端作为输入 如果Key对应的value的很大,不能放内存,应该怎么处理? (应该从头说到尾)
代码:reduce操作 输入到reducer端的数据是怎么处理好的?手写处理过程
讲一下垃圾收集器G1,它的特点是啥 除了不区分 G1还有什么特点 可控时间内的响应停顿 怎么保证? 你说G1不区分新生代老年代,其他收集器区分不同年代吗?
能实习多久 ?
反问环境
3.17 二面
自我介绍
数据库比赛
线程池 几种 参数有哪些 拒绝策略讲讲
spark join的几种实现方式
Spark 作业提交流程
RDD stage划分的依据
spark计算 能否并行
算法题:
已知一天内用户登录登出的日志(数据量较大),求这一天用户在线的最大峰值和持续时间段
• 日志包含字段(userid, login_time, logout_time)
• 登录登出时间精确到秒
美团 一面挂
自己的问题:
- 基础不扎实,很多东西说的不全面 冒泡排序写了半天....***
- SQL还是不熟悉,很多东西不知道怎么实现
问数据库比赛
两道sql
抽象类和接口的区别
equals 和 ==的区别
List.isempty() list.size()==0有什么区别
sleep和wait的区别
进程和线程的区别
进程的通信方式:
死锁是什么?死锁的原因和必要条件
死锁是什么:是指多个进程在运行过程中因争夺资源而造成的一种僵局,当进程处于这种僵持状态时,若无外力作用,它们都将无法再向前推进。
必要条件:请求与保持、不可剥夺、互斥、环路等待四个条件
Union和Union All到底有什么区别
Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;
Http协议是哪一层
tcp udp在哪一层 区别是什么?
事务的四大特性
delete drop truncate 的差别
左连接和右连接的区别
数据仓库有了解吗?
数据倾斜是什么?怎么解决数据倾斜?
你的优势是什么?
携程 一面+二面+OC
一面 3.24
讲讲排序算法和复杂度
讲讲树结构
聊项目
聊对大数据的理解
实习时间
二面 3.29
对大数据开发的理解 存储 分析 计算
存储框架
- 使用HDFS作为存储
- Hive做离线数仓
- HBase做实时分析
计算引擎有哪些:
- MR
- Spark corre Spark Streaming
- flink
- strom
有开发过实时的项目吗? 没
Mapreduce 的流程
hive的存储格式
- TextFile
- SEQUENCEFILE
- Rcfile
- ORCfile
内部表和外部表的区别
外部表数据变动怎么和外部表建立联系
三种方式:
直接load
msck repair
上传数据之后添加分区
HIve里面自定义函数 UDF UDAF UDTF
讲讲数据库比赛
腾讯TEG 腾讯大数据 一面挂
聊比赛、项目
设计一个HashMap
多线程的原理 线程创建的方式
线程池的底层原理
阿里一面+二面+HR面
一面 4.1
问比赛、问项目
Hadoop MR 流程 shuffle过程
数据倾斜处理
职业规划,未来发展
反问:
业务
二面 4.10 总监面
实体模型设计
问比赛、问项目
闲聊:
全部评论
(5) 回帖