About This Opportunity
Propósito del rol: Diseñar, implementar y evolucionar la estrategia de observabilidad end-to-end para sistemas críticos, garantizando disponibilidad, resiliencia y experiencia del cliente. Responsabilidades principales: - Diseñar soluciones de observabilidad (logs, métricas, trazas) - Implementar estándares de instrumentación (Open Telemetry) - Integrar herramientas como Datadog, Dynatrace, Prometheus, Grafana Splunk, New Relic - Crear dashboards basados en SLIs/SLOs - Gestionar alertamiento inteligente y análisis de incidentes - Reducir MTTR mediante automatización - Integrar herramientas como Datadog, Dynatrace, Prometheus, Grafana Requisitos: - +4 años en observabilidad, SRE o Dev Ops - Experiencia en entornos críticos de alta disponibilidad - Conocimiento en cloud (AWS, Azure o GCP) - Experiencia con Kubernetes y Docker Competencias: - Pensamiento analítico - Resolución de problemas - Comunicación efectiva Tecnologías • Observabilidad / APM: Dynatrace, Datadog, New Relic, App Dynam...