Job Description
工作地点:杭州/北京
1.负责公司分布式存储系统(对象存储 / 文件存储)的日常运维与稳定性保障,包括部署、扩容、升级、迁移与故障处理。
2.建立并持续优化存储系统高可用、容灾、备份与恢复方案,保障数据安全与业务连续性。
3.对存储集群进行容量规划、性能评估与成本优化,提升资源利用率,降低单位存储成本。
4.监控存储系统关键指标(IOPS、Latency、Throughput、错误率、容量水位等),提前识别和消除风险。
5.参与重大故障应急响应与根因分析(RCA),推动问题系统性解决与改进。
6.与研发、架构、业务团队协作,参与存储系统架构演进、性能优化与新业务接入支持。
7.推进存储运维自动化与平台化建设,完善监控、告警、巡检与运维工具链。
8.编写并维护运维规范、应急预案、技术文档和知识库,提升团队整体运维效率
任职要求
1.本科及以上学历,计算机相关专业,3 年及以上 Linux 运维或存储系统运维经验。
2.精通 Linux 系统原理,熟悉进程、内存、网络、文件系统、磁盘 IO 等核心机制。
3.熟悉至少一种主流分布式存储系统:Ceph / HDFS / MinIO / GlusterFS / Lustre / 自研存储系统等。
4.熟悉常见文件系统(ext4、XFS)及磁盘技术(HDD / SSD / NVMe、RAID、JBOD)。
5.具备扎实的存储性能分析与问题定位能力(IO 放大、热点、长尾延迟、抖动等)。
6.熟悉监控与可观测体系(Prometheus、Grafana等),具备告警治理经验。
7.熟练使用至少一种脚本或编程语言(Shell / Python / Go),具备自动化运维能力。
8.具备良好的沟通能力、责任心和抗压能力,能参与值班与应急响应。
Apply for this Job
Submit your application for the CPG-高级存储运维研发工程师 (JR20260107008) position at DiDi.
Apply Now Save for Later