Te
Posted:
June 12, 2026
Location:
Shanghai, Shanghai, China
Job Description
大模型Infra技术研究员-(北京)or 上海 分享 渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。 岗位职责 1.负责大模型推理引擎架构设计、研发与迭代,深度适配主流GPU及异构AI芯片,优化推理性能与算力成本,搭建生产级PD分离推理调度系统,保障推理服务高并发、低延迟、高稳定;
2.搭建并优化多模态大模型训练底层基建,解决训练端显存管理、混合并行调度、跨节点通信同步痛点,完善算力调度与数据流水线,支撑模型高效稳定训练;
3.针对训练与推理场景核心技术难题,落地动态显存分配、KV Cache优化、变长序列批处理、通信优化、异构算力负载均衡等关键技术;
4.基于GPU与异构芯片架构,完成训练、推理全流程性能分析、算子及调度优化,推动优化方案工程化落地;
5.跟踪大模型Infra前沿技术,沉淀优化实践经验;参与vLLM、SGLang等开源项目协作,实现内部技术与开源生态双向赋能。 岗位要求 1.计算机科学、计算机体系结构、软件工程、人工智能等相关专业的博士及优秀硕士;具有大规模分布式训练系统、高性能计算或 MLSys 方向研究与工程背景者优先;
2.深入理解大规模分布式训练系统,熟悉 DeepSpeed、Megatron-LM、PyTorch FSDP 等主流框架原理;熟悉张量并行、流水线并行、序列并行等并行策略;精通 Python 与 C++,熟悉 CUDA 编程及高性能算子开发;在 MLSys、SC、EuroSys、OSDI、ATC 等系统顶会或 CVPR/NeurIPS/ICML 系统方向有相关成果者优先;
3.对底层系统与 AI 交叉方向有浓厚兴趣,具备从系统视角分解和量化性能瓶颈的能力;工程严谨性强,能在超大规模训练...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 CSIG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月11日2.搭建并优化多模态大模型训练底层基建,解决训练端显存管理、混合并行调度、跨节点通信同步痛点,完善算力调度与数据流水线,支撑模型高效稳定训练;
3.针对训练与推理场景核心技术难题,落地动态显存分配、KV Cache优化、变长序列批处理、通信优化、异构算力负载均衡等关键技术;
4.基于GPU与异构芯片架构,完成训练、推理全流程性能分析、算子及调度优化,推动优化方案工程化落地;
5.跟踪大模型Infra前沿技术,沉淀优化实践经验;参与vLLM、SGLang等开源项目协作,实现内部技术与开源生态双向赋能。
2.深入理解大规模分布式训练系统,熟悉 DeepSpeed、Megatron-LM、PyTorch FSDP 等主流框架原理;熟悉张量并行、流水线并行、序列并行等并行策略;精通 Python 与 C++,熟悉 CUDA 编程及高性能算子开发;在 MLSys、SC、EuroSys、OSDI、ATC 等系统顶会或 CVPR/NeurIPS/ICML 系统方向有相关成果者优先;
3.对底层系统与 AI 交叉方向有浓厚兴趣,具备从系统视角分解和量化性能瓶颈的能力;工程严谨性强,能在超大规模训练...
Apply for this Job
Submit your application for the 大模型Infra技术研究员-(北京)or position at Tencent.
Apply Now Save for LaterJob Overview
Job Type:
Full-time
Location:
Shanghai, China
Posted:
June 12, 2026
Deadline:
July 22, 2026