Te
Posted:
June 17, 2026
Location:
Beijing, Beijing, China
Job Description
混元Agent强化学习框架工程师(深圳/北京/上海) 北京 分享 1.参与 Research 场景下 Agent 框架的研发与维护,支持强化学习、数据生成、自动化评估和实验复现等业务需求;
2.统一封装模型调用、工具调用、任务执行、上下文管理、日志 Trace、结果收集和评估逻辑,沉淀稳定可复用的框架组件;
3.支持各类 Agent 策略及评估逻辑接入,维护相关接口、组件和验证机制;
4.优化框架易用性、稳定性和性能表现,解决实际运行中的并发、资源、链路和行为一致性问题,保障实验流程高效执行;
5.结合大模型训练视角,与算法团队共同推进新 Agent 范式、强化学习训练链路和评测方法的工程化落地。 岗位要求 1.具备扎实的 Python 编程能力,熟悉异步编程(Asyncio)、并发处理和工程化最佳实践;
2.熟悉大模型与 Agent 相关应用技术,理解模型调用、工具调用、上下文管理、任务执行、日志 Trace 和结果评估等核心链路;
3.熟悉 Kubernetes 和容器化技术,具备在集群环境下进行开发、部署、排障或性能优化的经验;
4.了解大模型训练流程和基本原理,包括预训练、SFT、RLHF、强化学习训练或自动化评估中的至少一类;
5.具备良好的软件工程能力,重视模块化设计、测试、日志、性能和稳定性治理;
6.具备良好的问题分析及解决能力、沟通合作能力和 owner 意识,能高频承接算法团队需求并持续迭代。 加分项 1.熟练使用 AI 编程工具,并理解其工作原理、适用边界和工程落地方式;
2.有 Agent 框架、AI Coding CLI、强化学习环境或评测框架经验;
3.有研发效能平台、Review / Debug / Monitor、实验结果分析、问题追踪或知识库工具建设经验;
4.具备跨语言协作能力,能借助 AI 工具阅读和维护 Type...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月02日 岗位职责2.统一封装模型调用、工具调用、任务执行、上下文管理、日志 Trace、结果收集和评估逻辑,沉淀稳定可复用的框架组件;
3.支持各类 Agent 策略及评估逻辑接入,维护相关接口、组件和验证机制;
4.优化框架易用性、稳定性和性能表现,解决实际运行中的并发、资源、链路和行为一致性问题,保障实验流程高效执行;
5.结合大模型训练视角,与算法团队共同推进新 Agent 范式、强化学习训练链路和评测方法的工程化落地。
2.熟悉大模型与 Agent 相关应用技术,理解模型调用、工具调用、上下文管理、任务执行、日志 Trace 和结果评估等核心链路;
3.熟悉 Kubernetes 和容器化技术,具备在集群环境下进行开发、部署、排障或性能优化的经验;
4.了解大模型训练流程和基本原理,包括预训练、SFT、RLHF、强化学习训练或自动化评估中的至少一类;
5.具备良好的软件工程能力,重视模块化设计、测试、日志、性能和稳定性治理;
6.具备良好的问题分析及解决能力、沟通合作能力和 owner 意识,能高频承接算法团队需求并持续迭代。
2.有 Agent 框架、AI Coding CLI、强化学习环境或评测框架经验;
3.有研发效能平台、Review / Debug / Monitor、实验结果分析、问题追踪或知识库工具建设经验;
4.具备跨语言协作能力,能借助 AI 工具阅读和维护 Type...
Apply for this Job
Submit your application for the 混元Agent强化学习框架工程师(深圳/北京/上海) position at Tencent.
Apply Now Save for LaterJob Overview
Job Type:
Full-time
Location:
Beijing, China
Posted:
June 17, 2026
Deadline:
July 27, 2026