一面
- 自我介绍
- 爬虫相关,爬虫遇到那些反爬手段,如何解决
- 如果你做网站,如何处理爬虫
- http那些请求头
- https的通信过程
- python gcl锁
- 线程 进程 携程
- 如何创建守护进程 或者如何保证程序一直提供服务 nohup 信号量等
- contarb命令 如果ngixn打印好多502日志,如何统计日志数量
- 如何查询指定主机的ip联通及端口开放
- 百度实习项目
- 有什么问我的
二面
- 自我介绍
- 项目相关 爬虫项目
- redis异步队列底层
- 自己说一个实习或者实验室项目,包括难点 体会
- 说下舆情分析怎么做
- 算法题 字符串中最长不重复子串
- 有什么问我的
三面:爬虫项目各种场景由简单到复杂,海量数据的查找,使用倒排索引 一共四十分钟左右,就这两个题,逐渐深入
全部评论
(1) 回帖