AML(应用机器学习)是字节跳动的机器学习中台团队。很多人听到中台就觉得不太靠谱,不过AML很特殊。大家可能不知道,字节的不同产品,比如抖音/头条/西瓜,他们的推荐/广告系统,底层架构都是统一的。而提供这个底层架构的,就是AML团队。同时,这个团队不仅搞推荐广告,像什么CV/语音/NLP的底层训练和推理系统,也是通吃的。我们维护了大概几百万CPU核心,十几万GPU卡和几十PB的内存来给各个业务提供服务。同时,在系统之上,也有一层平台,来对系统做很好的封装,提供简单易用的开发环境。
同时,AML不仅有系统团队,还有算法团队。这个算法团队里的同学,主要目标就是研究一些通用的,创新的算法。比如设计一个在推荐/广告里都提升很大的召回算法,或者训练一个在搜索/审核里都work的多模态预训练模型。得益于字节跳动开放的环境,AML的算法同学可以自由的业务里发现问题,和业务同学讨论想法,设计模型,开AB,看结果,一条龙work。
此外,AML不仅给字节跳动服务,未来还致力于给其他企业服务。因此,我们也在提供面向外部客户的机器学习产品。
一些我们的特色项目
- 联邦学习和隐私计算
- 推荐广告大规模分布式训练系统(包括GPU训练系统)
- 推荐广告大规模GPU推理系统
- 融合多种硬件和训练框架的编译器研究(ByteIR)
- 自动推理性能优化(TVM, XPerf)
- 分布式训练系统中的通信模块(BytePS)
- 分布式机器学习调度系统
- 通用机器学习平台
- 推荐/广告/搜索的算法研究:更大的算力,更复杂的模型
- 大规模多模态预训练
- 图神经网络
- AutoML/NAS
- 分子动力学模拟和应用
全部评论
(1) 回帖