Junior ML Infrastructure Engineer

GPU Solutions
Full-time Spain, community of madrid Other-General
Posted:
June 08, 2026
Location:
Spain, community of madrid, Spain

Job Description

Sobre nosotros En GPU Solutions operamos infraestructura de cómputo de última generación, incluyendo NVIDIA B200, para servir modelos de IA en producción. Somos un equipo pequeño donde cada persona tiene impacto directo sobre el producto y las decisiones técnicas.


El puesto Buscamos a alguien al inicio de su carrera con ganas de especializarse en inference serving sobre hardware top de gama. Vas a trabajar mano a mano con modelos de lenguaje y visión grandes, desplegándolos, optimizándolos y midiendo su rendimiento sobre B200. No te vamos a pedir que llegues sabiéndolo todo: te vamos a pedir que aprendas rápido y traigas iniciativa.


Qué harás Desplegar y servir modelos (LLMs, VLMs, modelos de difusión) usando frameworks como vLLM, TensorRT-LLM, SGLang o Triton Inference Server. Optimizar latencia y throughput mediante cuantización (FP8, INT4), batching dinámico y paralelismo de tensor...

Apply for this Job

Submit your application for the Junior ML Infrastructure Engineer position at GPU Solutions.

Apply Now Save for Later

Job Overview

Job Type: Full-time
Location: Spain, Spain
Posted: June 08, 2026
Deadline: July 18, 2026