微信-WeLM 大模型预训练框架研发工程师（深圳、上海）

Tencent

Full-time Beijing, Beijing Other-General

Posted:

June 12, 2026

Location:

Beijing, Beijing, China

Job Description

                    微信-WeLM 大模型预训练框架研发工程师（深圳、上海） 北京 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 WXG 点击了解更多BG信息 技术 两年以上工作经验 更新于年05月13日 岗位职责 1.负责构建和优化大规模预训练框架，支持文本、语音、图像等多模态数据的联合学习与高效训练；
2.深入优化长序列场景下的分布式训练与显存利用（如context parallel、2D/环形 Attention、混合并行、激活重计算等），在百万级 token 训练中提升吞吐与性价比；
3.负责后训练（Post-training）阶段框架建设，包括强化学习（RL/RLHF）、偏好建模（Reward Model）及人类反馈优化（Alignment）等流程；
4.深入优化分布式训练框架与推理效率，提升算力利用率与模型吞吐性能；
5.跟踪前沿研究趋势，探索高效预训练策略（如Mixture of Experts、Continual Pretraining等）；
6.与算法、数据、平台团队协作，形成从数据处理到训练部署的全流程自动化解决方案。
 岗位要求 1.计算机科学、人工智能、模式识别、计算语言学等相关专业硕士及以上学历；
2.精通一种或多种主流深度学习框架（PyTorch、JAX、TensorFlow），具备大规模分布式训练经验；
3.熟悉Transformer系列架构，理解其在语言、语音、视觉等方向的模型原理与实现；
4.了解 LLM 的训练流程，有 Megatron, DeepSpeed 等大规模训练框架使用经验者优先；
5.对RL/RLHF、偏好学习、奖励建模有实践经验者优先；
6.具备扎实的工程实现能力与代码规范意识，熟悉CUDA优化、参数并行、流水线并行等技术；
7.具备良好的团队协作与沟通能力，热爱探索与创新。
 加分项 1.在 GitHub 等平台持续参与主流大模型 / 分布式训练 / RLHF 等项目的开发维护，有高质量 PR 被核心项目合并，或担任 maintainer / revie...
                

Apply for this Job

Submit your application for the 微信-WeLM 大模型预训练框架研发工程师（深圳、上海） position at Tencent.

Apply Now Save for Later

Job Overview

Job Type: Full-time

Location: Beijing, China

Posted: June 12, 2026

Deadline: July 22, 2026