首页 > 瑞尼尔 数据分析工程师 面经(社招)
头像
小李今天也在写作业
编辑于 2021-04-21 14:53
+ 关注

瑞尼尔 数据分析工程师 面经(社招)


  1. 你有使用过API接口的经验吗?什么样的API?是谷歌还是亚马逊还是软件即时服务?
  2. 什么时候自己编号代码比使用数据科学者开发好的软件包更好?
  3. 层次分析法AHP的含义,具体步骤。并举一个适合用层次分析法的案例。
  4. 淘宝上有一些小众但是品位高的店铺,怎么把他们筛选出来捏?
  5. 双十一的时候,商家会发优惠券,从商家和平台两个角度设计评价指标,并分析指标不同结果应该对应怎样的措施。
  6. 海量日志数据,提取出某日访问百度次数最多的那个IP。
  7. 搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。
  8. 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。
  9. 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。
  10. 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。
  11. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?


更多模拟面试

全部评论

(0) 回帖
加载中...
话题 回帖

相关热帖

近期热帖

历年真题 真题热练榜 24小时
技术(软件)/信息技术类
查看全部

近期精华帖

热门推荐