大模型语音算法工程师 (J251127015)

DiDi
Full-time Beijing, Beijing Other-General
Posted:
June 11, 2026
Location:
Beijing, Beijing, China

Job Description

职位描述

1. 参与语音大模型 应用研发与落地

2. 参与语音全双工语音交互、包含打断、拒识、判停

3. 参与 语音理解、语音生成、语音端到端等大模型效果优化

任职要求

1、 熟悉主流语音合成框架(如 CoSyVoice、F5、Bert-VITS、GPT-SoVITS 等),并具备实际调优经验。

2、熟悉常见音频表征模型(hubert / best-rq 、wav2bert2.0)、有小语种方言落地经验优先、

3、具备大规模语音预训练、后训练(Post-training) 经验,熟悉数据增强、模型微调等技术。

4、在语音合成(TTS)、语音识别(ASR)、端到端语音大模型、语音唤醒、前端信号、VAD 至少一个方向有落地经历

5、在 ICASSP、Interspeech、NeurIPS 等顶会发表过相关论文,或参与过开源语音项目贡献优先。

Apply for this Job

Submit your application for the 大模型语音算法工程师 (J251127015) position at DiDi.

Apply Now Save for Later

Job Overview

Job Type: Full-time
Location: Beijing, China
Posted: June 11, 2026
Deadline: July 21, 2026