Senior GenAI Engineer

Para LATAM

¿Cuáles serán tus responsabilidades? 

Como Senior GenAI Engineer en DinoCloud participaras en  el ciclo end-to-end de análisis de datos, ML y GenAI en AWS: desde EDA y diseño experimental, hasta entrenamiento, evaluación, despliegue y operación de modelos de ML y aplicaciones LLM (RAG) en producción

  • Diseñar arquitecturas basadas en inteligencia artificial generativa y planificación de proyectos
  • Diseñar y poner en producción modelos de IA Generativa con evaluación rigurosa de costo, latencia y trazabilidad. Construir aplicaciones LLM utilizando Amazon Bedrock (Agentes, Bases de Conocimiento, guardrails, evaluación de calidad y alucinaciones) y RAG sobre datos internos.
  • Integrar y operar arquitecturas de Agentes de IA o IA Generativa: chatbots conversacionales, automatización de procesos, personalización y mejora de la experiencia de usuario basada en decisiones tomadas por LLMs
  • Asegurar seguridad, gobierno, costos y confiabilidad; participar en discovery y priorización de proyectos.
  • Implementar pipelines de MLOps para el ciclo de vida completo de modelos generativos, incluyendo versionado, pruebas A/B y despliegues automáticos.
  • Colaborar  equipos de ingeniería y negocios para acelerar casos de uso, habilitar acceso a información mediante lenguaje natural y generar impacto medible en los procesos de nuestros clientes.

¿Qué necesitamos de ti?

  • Amazon Bedrock en entornos de producción con: Agentes, Bases de Conocimiento (embeddings/almacenes vectoriales), guardrails, selección y evaluación de modelos (Claude, Titan u otros).
  • Experiencia práctica en desarrollo de software y diseño de arquitectura de software relacionada con proyectos de Agentes de IA o IA Generativa en general.
  • Experiencia práctica en arquitecturas de Agentes de IA o IA Generativa:
    • Diseño e implementación de arquitecturas basadas en IA Generativa
    • Desarrollo e integración de modelos LLM
    • Gestión de bases de datos de almacenamiento de contexto conversacional
  • Experiencia con soluciones basadas en RAG: diseño de recuperación (retrieval), estrategias de chunking y embeddings, evaluación, optimización de latencia y costo.
  • Conocimientos sólidos de seguridad y cumplimiento normativo (manejo de PII, IAM, cifrado en tránsito y en reposo).
  • Inglés nivel C1 para comunicación técnica y documentación.

Es un plus si cuentas con:

  • Experiencia con Spark/Databricks, Snowflake; Feature Stores; experimentación a escala, pruebas A/B.
  • Sólida experiencia en arquitecturas de datos: data warehouse, data lakes, arquitecturas de eventos y streaming.
  • Conocimientos en observabilidad y monitoreo (CloudWatch, Prometheus, métricas personalizadas).
  • Experiencia en BI y visualización (QuickSight, Power BI, Looker) y storytelling con datos.
  • Contenerización y orquestación (Docker, Kubernetes, Amazon ECS/EKS).
  • Certificaciones AWS relevantes (ML Specialty, Data Engineer, Solutions Architect).
  • Experiencia con Amazon Q, LangChain/LlamaIndex, OpenSearch/Pinecone/FAISS.
  • Conocimiento en fine-tuning de modelos y técnicas de optimización (LoRA, QLoRA).