Te
Posted:
June 11, 2026
Location:
Shenzhen, Guangdong Province, China
Job Description
混元多模态大模型推理加速工程师(深圳/北京/上海/杭州) 深圳 分享 1.负责通用多模态大模型的推理部署,包括多模态理解、生成、语音大模型等研发支持,推动算法落地;
2.多模态大模型性能优化及推理框架优化,提升整体吞吐、降低部署成本;提升框架易用性;
3.紧跟多模态生成和理解领域的技术前沿,推动技术创新在产品中落地;
4.针对落地业务,优化部署方案及适配定制化需求。 岗位要求 1.了解AI基础设施、机器学习系统或高性能计算相关领域经验, 具有 vllm/sglang/TensorRT/FasterTransformer 等推理引擎实践经验;
2.精通主流多模态或全模态大模型,主导或核心参与过多模态大模型项目优先;有行业落地案例或相关开源项目经验者优先;
3.熟悉主流深度学习框架的网络结构与算子底层实现细节,具备模型训练 / 推理调优、CPU/GPU 加速、分布式训练与推理部署的实操经验者优先;
4.熟悉分布式推理常用加速方法(算子融合、量化策略、动态批处理、KV 缓存优化等),有超大模型分布式部署经验优先;
5.在视觉问答、图像生成、视频理解/生成,语音识别/合成等领域有项目积累,或发表过相关方向顶级学术论文者优先;
6.具备较强的自主学习能力与技术钻研精神,良好的跨团队沟通协作能力。
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月08日 岗位职责2.多模态大模型性能优化及推理框架优化,提升整体吞吐、降低部署成本;提升框架易用性;
3.紧跟多模态生成和理解领域的技术前沿,推动技术创新在产品中落地;
4.针对落地业务,优化部署方案及适配定制化需求。
2.精通主流多模态或全模态大模型,主导或核心参与过多模态大模型项目优先;有行业落地案例或相关开源项目经验者优先;
3.熟悉主流深度学习框架的网络结构与算子底层实现细节,具备模型训练 / 推理调优、CPU/GPU 加速、分布式训练与推理部署的实操经验者优先;
4.熟悉分布式推理常用加速方法(算子融合、量化策略、动态批处理、KV 缓存优化等),有超大模型分布式部署经验优先;
5.在视觉问答、图像生成、视频理解/生成,语音识别/合成等领域有项目积累,或发表过相关方向顶级学术论文者优先;
6.具备较强的自主学习能力与技术钻研精神,良好的跨团队沟通协作能力。
Apply for this Job
Submit your application for the 混元多模态大模型推理加速工程师(深圳/北京/上海/杭州) position at Tencent.
Apply Now Save for LaterJob Overview
Job Type:
Full-time
Location:
Shenzhen, China
Posted:
June 11, 2026
Deadline:
July 21, 2026