Remoto
·
Completamente remoto
GenAI Engineer
Creemos el futuro juntos
Sobre Creai
En Creai, nos especializamos en aprovechar el poder de la inteligencia artificial y el aprendizaje automático para transformar negocios. Nuestra misión es ayudar a los clientes a reducir costos, aumentar la eficiencia y desbloquear nuevas oportunidades mediante soluciones de IA de vanguardia.
Descripción del puesto
Como Senior Generative AI Software Engineer en Creai, serás responsable de diseñar, implementar y mantener soluciones empresariales complejas basadas en Inteligencia Artificial Generativa, Large Language Models (LLM) y Retrieval-Augmented Generation (RAG). Este rol requiere expertise técnico profundo en el ciclo completo de vida de proyectos GenAI, desde el discovery inicial hasta el despliegue en producción y optimización continua.
Serás el guardián de la calidad y robustez de nuestras soluciones GenAI, liderando la implementación de nuestra metodología estandarizada y asegurando que cada sistema entregue valor real de negocio mientras mantiene los más altos estándares de precisión, seguridad y eficiencia de costos. Trabajarás directamente con clientes enterprise para traducir problemas de negocio complejos en arquitecturas GenAI escalables y confiables.
Este puesto exige
Arquitectura y Diseño de Soluciones GenAI: Diseñar arquitecturas end-to-end para sistemas RAG, agentes conversacionales, sistemas multi-agente y soluciones de generación de contenido. Tomar decisiones críticas sobre approach técnico (prompt engineering, RAG, fine-tuning o combinaciones), selección de modelos LLM, vectorstores, y estrategias de retrieval basándose en requisitos específicos de cada proyecto.Implementación de Sistemas RAG Complejos: Construir pipelines completos de RAG incluyendo document loaders, estrategias de chunking óptimas, enrichment de metadata, embeddings, vectorstores, hybrid search, re-ranking, y generation con LLMs. Optimizar cada componente para maximizar relevancia, groundedness y performance.
Prompt Engineering Avanzado: Diseñar, iterar y optimizar prompts complejos aplicando técnicas avanzadas como few-shot learning, chain-of-thought, ReAct patterns, y self-consistency. Implementar guardrails robustos para control de alucinaciones, incluyendo grounding explícito, citation enforcement, y post-processing validation.
Gestión y Procesamiento de Conocimiento: Diseñar e implementar pipelines de ingesta, procesamiento y estructuración de fuentes de conocimiento diversas (documentos, bases de datos, APIs). Implementar estrategias avanzadas de chunking, metadata extraction, deduplication, y data governance con control de acceso role-based y protección de PII.
Evaluación y Validación Sistemática: Implementar frameworks de evaluación exhaustivos combinando métricas automáticas (model-based), métricas de retrieval (context precision/recall, MRR, NDCG), benchmarks con referencias, y evaluación humana. Diseñar test datasets representativos y realizar análisis de failure modes para mejora continua.
Integración con LLMs y Plataformas Cloud: Implementar integraciones robustas con modelos como GPT-4, Claude, Gemini, Llama, y Mistral usando APIs, function calling, structured outputs, y output parsing. Gestionar deployments en plataformas cloud (AWS Bedrock, SageMaker, Azure OpenAI, Vertex AI) optimizando para latencia, costo y escalabilidad.
Desarrollo de Agentes Autónomos: Implementar agentes GenAI capaces de razonamiento, toma de decisiones, y ejecución de acciones mediante tool integration (APIs, bases de datos, code interpreters). Diseñar arquitecturas de agentes (ReAct, Plan-and-Execute, Multi-Agent) con memory management, error handling, y retry logic robusto.
Observabilidad y Monitoreo de Producción: Implementar sistemas de monitoreo continuo para métricas de calidad (relevancia, precisión factual, groundedness), experiencia de usuario (satisfacción, task success rate), y eficiencia operacional (latencia, costos de tokens, performance). Configurar alertas, dashboards, y feedback loops para mejora iterativa.
Optimización de Costos y Performance: Analizar y optimizar continuamente el consumo de tokens, estrategias de caching, model routing, y uso de recursos computacionales. Implementar técnicas de cost efficiency como prompt compression, semantic caching, y selección dinámica de modelos según complejidad de query.
Seguridad, Privacidad y Compliance: Implementar medidas de seguridad robustas incluyendo defense contra prompt injection, data leakage prevention, sanitización de inputs, y rate limiting. Asegurar compliance con GDPR y regulaciones locales mediante PII protection, data residency, audit logging, y encryption.
Testing de Robustez y Red Teaming: Realizar testing exhaustivo incluyendo adversarial testing (jailbreak attempts, prompt injection), edge cases, load testing bajo alta concurrencia, y validación de error handling. Ejecutar ejercicios de red teaming regular para identificar vulnerabilidades.
Colaboración con Stakeholders Técnicos y de Negocio: Comunicar decisiones arquitectónicas complejas, trade-offs técnicos, limitaciones de GenAI, y recomendaciones a audiencias diversas desde developers hasta ejecutivos. Liderar sesiones de discovery con clientes para entender requisitos y definir métricas de éxito en dimensiones de calidad, UX, y negocio.
Mejora Continua y Adopción de Emerging Technologies: Mantenerse actualizado con últimos avances en GenAI/LLM, evaluar nuevas técnicas y modelos, y proponer innovaciones que mejoren la efectividad de nuestras soluciones. Contribuir a la evolución de mejores prácticas y metodologías internas.
Documentación Técnica Exhaustiva: Crear documentación arquitectónica detallada, diagramas de sistemas, especificaciones técnicas, guías de implementación, y runbooks operacionales que permitan la ejecución exitosa y mantenimiento sostenible de soluciones GenAI.
Requisitos y competencias
Experiencia Profunda en GenAI/LLM: 3+ años de experiencia práctica diseñando e implementando soluciones de producción basadas en Large Language Models, incluyendo sistemas RAG, agentes conversacionales, y generación de contenido. Experiencia comprobada llevando proyectos GenAI desde discovery hasta producción.Dominio de Frameworks y Herramientas GenAI: Experiencia avanzada con frameworks como LangChain, LlamaIndex, o similares. Conocimiento profundo de plataformas de LLM (OpenAI API, Anthropic Claude, Google Gemini) y sus capacidades de function calling, structured outputs, y JSON mode.
Expertise en Sistemas RAG: Experiencia sólida implementando arquitecturas RAG completas incluyendo document processing, chunking strategies, embedding models (OpenAI, sentence-transformers), vectorstores (Pinecone, Chroma, Weaviate, pgvector), retrieval strategies (semantic search, hybrid search, re-ranking), y generation patterns.
Prompt Engineering Avanzado: Habilidad comprobada diseñando y optimizando prompts complejos usando técnicas avanzadas (few-shot, chain-of-thought, ReAct). Experiencia implementando guardrails efectivos contra alucinaciones, incluyendo grounding, citation enforcement, y validation post-processing.
Familiaridad con frameworks de agentes multi-agente como AutoGen, CrewAI, o LangGraph para orquestar workflows complejos.
Desarrollo de Software y Arquitectura: Sólidas habilidades de programación en Python con experiencia en desarrollo de aplicaciones escalables. Conocimiento de patrones arquitectónicos (microservicios, event-driven), APIs RESTful, y mejores prácticas de ingeniería de software (testing, CI/CD, version control).
MLOps y Despliegue en Producción: Experiencia implementando pipelines de ML en producción incluyendo model serving, monitoring, logging, y continuous evaluation. Familiaridad con containerización (Docker), orchestration (Kubernetes), e infrastructure as code (Terraform).
Plataformas Cloud y Servicios de IA: Experiencia práctica con servicios cloud de AI/ML en AWS (Bedrock, SageMaker), Google Cloud (Vertex AI), o Azure (OpenAI Service). Conocimiento de compute, storage, networking, y managed services.
Data Engineering y Procesamiento: Experiencia procesando datos no estructurados (PDFs, documentos, HTML), estructurados (bases de datos, APIs), y semi-estructurados. Conocimiento de ETL/ELT, data pipelines, y herramientas de procesamiento (pandas, Apache Spark).
Evaluación y Testing de Sistemas GenAI: Experiencia implementando frameworks de evaluación para sistemas GenAI usando métricas automáticas, evaluación humana, y benchmarking. Conocimiento de métricas de retrieval (precision, recall, MRR, NDCG) y métricas de generación (BLEU, ROUGE, BERTScore).
Seguridad y Compliance: Conocimiento de security best practices en GenAI incluyendo prompt injection defense, PII protection, access control, y audit logging. Familiaridad con regulaciones de privacidad (GDPR, CCPA) y su aplicación en sistemas de IA.
Habilidades de Comunicación Técnica: Capacidad excepcional para comunicar conceptos técnicos complejos a audiencias diversas, presentar arquitecturas y trade-offs a stakeholders ejecutivos, y crear documentación técnica clara y comprensiva.
Mentalidad de Producto y Foco en Negocio: Capacidad para traducir requisitos de negocio en soluciones técnicas, definir métricas de éxito alineadas con objetivos empresariales, y optimizar soluciones para maximizar ROI y valor del cliente.
Experiencia Trabajando con Clientes: Experiencia en consultoría técnica o roles customer-facing, con habilidad para realizar discovery sessions, manejar expectativas, y comunicar riesgos y oportunidades de manera transparente.
Inglés Avanzado: Capacidad para comunicarse efectivamente en inglés técnico, tanto verbal como escrito, para colaboración con equipos internacionales y lectura de documentación técnica.
Habilidades deseables
Experiencia con modelos open-source (Llama 3, Mistral, Falcon) y self-hosted deployments usando vLLM, TGI, o Ollama.Conocimiento profundo de técnicas avanzadas de RAG como HyDE (Hypothetical Document Embeddings), query decomposition, multi-query retrieval, parent document retrieval, y contextual compression.
Experiencia con fine-tuning de LLMs usando técnicas eficientes como LoRA, QLoRA, o PEFT para adaptar modelos a dominios específicos.
Experiencia implementando GraphRAG o Knowledge Graph-augmented RAG para razonamiento sobre relaciones complejas entre entidades.
Conocimiento de técnicas de model compression, quantization (GGUF, GPTQ), y optimization para reducir latencia y costos.
Experiencia con herramientas de observabilidad especializada para GenAI como LangFuse, LangSmith, Weights & Biases (W&B), Arize, o Phoenix.
Certificaciones en cloud platforms (AWS Solutions Architect, Google Cloud Professional ML Engineer) o certificaciones específicas de GenAI/LLM.
Background en research de NLP/ML con publicaciones o contribuciones a proyectos open-source de GenAI.
Experiencia implementando responsible AI practices incluyendo fairness testing, bias detection, explainability, y AI governance frameworks.
Conocimiento de técnicas avanzadas de prompt optimization como DSPy, automatic prompt engineering, o prompt compression.
Experiencia con multimodal LLMs (GPT-4 Vision, Gemini Pro Vision, Claude 3) para procesar imágenes, audio, o video junto con texto.
Beneficios
- 💻 Trabajo 100% remoto con horario alineado a CST.
- 🏖️ PTO ilimitado: Confiamos en que gestionarás tu tiempo de manera efectiva.
- 🎓 Presupuesto anual para desarrollo: Acceso a cursos, certificaciones y conferencias.
- 🛠️ Presupuesto para equipamiento: Configura tu espacio de trabajo remoto ideal.
- 💰 Bonos semestrales por desempeño: Reconocemos y recompensamos tu impacto con incentivos económicos.
- 🩺 Beneficio de salud: Acceso a cobertura médica privada o subsidios para seguro médico.
- 🚀 Oportunidades de crecimiento: Plan de carrera y mentoría con expertos en IA y tecnología.
- 🚀 Ambiente de startup dinámico y flexible: Autonomía para tomar decisiones y proponer ideas, con un enfoque en resultados en lugar de horas trabajadas.
- ⚖️ Balance vida-trabajo: Cultura que prioriza la flexibilidad y el bienestar, permitiéndote gestionar tu tiempo sin sacrificar tu vida personal.
¡Te invitamos a postularte!
Incluso si no cumples con todos los requisitos, valoramos experiencias y perspectivas diversas. Si te apasiona el reclutamiento y quieres crecer en una empresa enfocada en datos e IA, ¡nos encantaría conocerte!
- Ubicaciones
- Remoto
- Estado remoto
- Completamente remoto
¿Ya trabajas en Creai?
Ayúdanos a encontrar a tu próximo compañero/a.