【岗位地点】
工作地:北京,阿里巴巴科技园
杭州 ,阿里巴巴云谷园区
联系人邮箱:bingyu.zj@alibaba-inc.com
联系人电话同微信:18612378710
职级:p6,p7,p8
【职位描述】
- 负责阿里云容器云原生AI和大数据产品的架构设计和开发工作
- 负责容器产品调度、管理大规模GPU/NPU/RDMA等异构资源集群的效率、性能和稳定性的持续优化
- 负责基于Kubernetes容器构建面向AI/大模型训练和推理,大规模数据处理和工作流等场景的基础设施产品和解决方案
- 负责云原生AI领域新技术和新方向的预研和落地,及相关开源能力建设
【职位要求】
- 计算机、软件工程及相关专业,计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种
- 熟悉至少一项云原生技术(如Docker,Kubernetes,Kubeflow,Fluid等),有相关项目经验
- 熟悉分布式计算/存储/调度系统的开发运维,具有基本的性能和稳定性优化经验
- 熟悉至少一个AI大数据引擎的使用(包括但不限于Spark,Flink,Ray,Pytorch,Deepspeed,Megatron,vLLM,SGLang,Mooncake等),有开发经验优先
- 有构建和运维MLOps/AI工程平台,运行模型训练/推理,或CUDA/驱动开发和性能优化等经验者优先
- 熟练使用AI工具和平台,有提升开发效率、优化代码质量、加速问题排查与产品迭代经验者优先
- 对技术保持热情,善于快速学习和动手实践,乐于分享、沟通和团队协作,勇于应对挑战