阿里
Posted:
March 02, 2026
Location:
Beijing, Beijing, China
Job Description
为大规模分布式训练/推理、大规模三维重建等多种重计算任务设计和实现分布式计算方案,并对各类任务进行定制化优化。具体工作包括且不限于:
1.搭建分布式高性能计算框架,研究和实验新的分布式计算技术,基于Pytorch DDP/Megatron/Ray/MPI等主流分布式框架进行研发和优化。
2.分析和优化训练/三维重建中的单机计算效率,通过GPU算子优化、异步并发、IO优化等方式减少计算耗时
3.设计和优化网络架构,对各种任务partition和并行方式进行性能调优
4.领导和指导团队中的研究人员和工程师,共同解决大规模分布式计算中的挑战
1.搭建分布式高性能计算框架,研究和实验新的分布式计算技术,基于Pytorch DDP/Megatron/Ray/MPI等主流分布式框架进行研发和优化。
2.分析和优化训练/三维重建中的单机计算效率,通过GPU算子优化、异步并发、IO优化等方式减少计算耗时
3.设计和优化网络架构,对各种任务partition和并行方式进行性能调优
4.领导和指导团队中的研究人员和工程师,共同解决大规模分布式计算中的挑战
Apply for this Job
Submit your application for the 高德-高性能计算/分布式训练优化专家-视觉技术中心 position at 阿里巴巴集团.
Apply Now Save for LaterJob Overview
Job Type:
Full-time
Location:
Beijing, China
Posted:
March 02, 2026
Deadline:
April 11, 2026