我们是阿里巴巴集团数据库事业部的OLAP 平台团队,我们专注于提供全球领先的全栈式大规模OLAP产品,目前在阿里集团、公共云、专有云提供了分析型数据库AnalyticDB、Data Lake Analytics、TSDB等多个产品,得到了大规模应用。每天数据写入记录数在万亿级,查询请求十亿级。
分布式计算引擎 : 打造支持异构数据源、结构化和非结构化数据的大规模高性能分布式分析引擎,支持hadoop、spark等开源生态。支持单集群千台规模,计算能力全球领先的开放计算能力引擎。
岗位职责:
负责OLAP分布式计算引擎,主要职责有:
1. 分布式计算引擎内核开发,包括查询引擎优化,执行计划调优等;
2. 依托开源社区,为业务提供先进的分布式计算能力和大数据解决方案;
3. 与开源社区保持良性互动,调研/吸收开源经验的同时,回馈社区。
职位描述
1. 分布式计算框架的开发、优化经验并在生产环境得到大规模应用;
2. 对Hadoop/Spark/Flink 以及类似分布式系统中的至少一个有深入研究;
3. 精通JAVA或者C/C++,有linux下丰富的应用性能诊断和优化经验; 至少会一种脚本语言
4. 有强烈的上进心和求知欲,善于学习新事物,对技术充满激情 ;
5. 具有较强的团队合作能力,勇于面对和解决挑战性问题。
加分项:
1. 数据库内核开发或机器学习平台开发背景;
2. 有开源社区贡献者优先,Hadoop/Hive/Hbase/Spark/Beam/Yarn 源码熟悉;
全部评论
(1) 回帖