Posted:
June 11, 2026
Location:
Shenzhen, Guangdong Province, China

Job Description

混元多模态大模型推理加速工程师(深圳/北京/上海/杭州) 深圳 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月08日 岗位职责
  • 1.负责通用多模态大模型的推理部署,包括多模态理解、生成、语音大模型等研发支持,推动算法落地;
    2.多模态大模型性能优化及推理框架优化,提升整体吞吐、降低部署成本;提升框架易用性;
    3.紧跟多模态生成和理解领域的技术前沿,推动技术创新在产品中落地;
    4.针对落地业务,优化部署方案及适配定制化需求。
  • 岗位要求
  • 1.了解AI基础设施、机器学习系统或高性能计算相关领域经验, 具有 vllm/sglang/TensorRT/FasterTransformer 等推理引擎实践经验;
    2.精通主流多模态或全模态大模型,主导或核心参与过多模态大模型项目优先;有行业落地案例或相关开源项目经验者优先;
    3.熟悉主流深度学习框架的网络结构与算子底层实现细节,具备模型训练 / 推理调优、CPU/GPU 加速、分布式训练与推理部署的实操经验者优先;
    4.熟悉分布式推理常用加速方法(算子融合、量化策略、动态批处理、KV 缓存优化等),有超大模型分布式部署经验优先;
    5.在视觉问答、图像生成、视频理解/生成,语音识别/合成等领域有项目积累,或发表过相关方向顶级学术论文者优先;
    6.具备较强的自主学习能力与技术钻研精神,良好的跨团队沟通协作能力。
  • Apply for this Job

    Submit your application for the 混元多模态大模型推理加速工程师(深圳/北京/上海/杭州) position at Tencent.

    Apply Now Save for Later

    Job Overview

    Job Type: Full-time
    Location: Shenzhen, China
    Posted: June 11, 2026
    Deadline: July 21, 2026