Sobre Creai

En Creai nos especializamos en aprovechar el poder de la inteligencia artificial y el aprendizaje automático para transformar negocios. Nuestra misión es ayudar a nuestros clientes a reducir costos, aumentar la eficiencia y desbloquear nuevas oportunidades mediante soluciones de IA de vanguardia.

Objetivo del Puesto

Diseñar, construir y evolucionar la plataforma de ingeniería de Creai como un producto interno de autoservicio (IDP). Como primer miembro del equipo reportando directamente al CTO, establecerás los cimientos técnicos y la cultura de infraestructura para soportar proyectos de IA/ML a escala global, con autonomía total para definir la arquitectura y la visión tecnológica de largo plazo.

👤 Requisitos

Experiencia profesional

Track record comprobable de más de 4 años en Platform Engineering, DevOps o SRE, gestionando infraestructura crítica en producción dentro de entornos de alto crecimiento (fast-paced).
Dominio avanzado de AWS y Azure: arquitectura de red compleja, seguridad de identidad (IAM/Entra ID) y gestión experta de clústeres Kubernetes (EKS/AKS).
Maestría en Terraform: desarrollo de módulos reutilizables, gestión de estado a escala y automatización total del ciclo de vida de los recursos.
Experiencia profunda operando clústeres en producción: implementación de RBAC, políticas de red, Helm, y optimización de escalamiento dinámico (HPA, VPA, Cluster Autoscaler).
Diseño de ecosistemas de entrega continua robustos utilizando GitHub Actions, GitLab CI o Azure DevOps, bajo principios de GitOps (ArgoCD o Flux).
Dominio de Docker (imágenes multi-stage, optimización de capas) y seguridad proactiva mediante escaneo de vulnerabilidades (Trivy, Snyk) y endurecimiento de runtimes.
Implementación de estrategias de observabilidad (métricas, logs, trazas) con Prometheus, Grafana, Datadog u OpenTelemetry, enfocadas en la definición de SLAs/SLOs.
Sólidas capacidades de programación en Python y Bash para la creación de herramientas internas que eliminen el trabajo manual (toil).

Soft skills

Inglés avanzado indispensable (escrito y verbal) para colaboración con equipos y clientes globales.
Mentalidad de "Ownership" y capacidad para navegar la ambigüedad de una startup.
Comunicación asertiva, capaz de traducir requerimientos técnicos en valor de negocio.

⭐ Conocimientos Deseables

MLOps de última generación: Experiencia con MLflow, Kubeflow o SageMaker Pipelines para el ciclo de vida de modelos.
Infraestructura de Cómputo Intensivo: Gestión de recursos GPU, orquestación de cargas de trabajo para LLMs y arquitecturas de Bases de Datos Vectoriales (Pinecone, Weaviate).
FinOps: Capacidad para monitorear y optimizar costos de cómputo en la nube, garantizando eficiencia financiera.
Service Mesh: Implementación de Istio o Linkerd para mTLS y control de tráfico fino.
Certificaciones: AWS Solutions Architect Pro o Azure Solutions Architect Expert.

🗂 Funciones Principales

Liderar la estrategia multi-cloud (AWS/Azure) mediante Terraform, garantizando una infraestructura inmutable, segura y altamente escalable.
Desarrollar herramientas y abstracciones que mejoren la Developer Experience (DevEx), permitiendo que los equipos de ingeniería y ciencia de datos desplieguen con fricción cero.
Orquestar clústeres de alta disponibilidad para cargas de trabajo de IA Generativa, optimizando el uso de hardware especializado (GPUs) y arquitecturas RAG.
Implementar el principio de mínimo privilegio y gestión avanzada de secretos. Liderar la respuesta a incidentes y promover una cultura de blameless post-mortems.
Monitorear el rendimiento del stack tecnológico y ejecutar estrategias de FinOps para maximizar el ROI de la infraestructura cloud.
Definir los estándares de ingeniería de plataforma y actuar como mentor para el crecimiento del equipo técnico.
Colaborar directamente con clientes para diseñar arquitecturas que resuelvan sus retos de IA más complejos.

🎁Beneficios

💻 Trabajo flexible con horario alineado a CST.
🏖️ PTO ilimitado: Confiamos en que gestionarás tu tiempo de manera efectiva.
🎓 Presupuesto anual para desarrollo: Acceso a cursos, certificaciones y conferencias.
🛠️ Presupuesto para equipamiento: Configura tu espacio de trabajo remoto ideal.
🩺 Beneficio de salud: Acceso a cobertura médica privada o subsidios para seguro médico.
🚀 Oportunidades de crecimiento: Plan de carrera y mentoría con expertos en IA y tecnología.
⚡ Ambiente de startup dinámico y flexible: Autonomía para tomar decisiones y proponer ideas, con un enfoque en resultados en lugar de horas trabajadas.
⚖️ Balance vida-trabajo: Cultura que prioriza la flexibilidad y el bienestar, permitiéndote gestionar tu tiempo sin sacrificar tu vida personal.Beneficios

Plaftorm Engineer

Creemos el futuro juntos