Descripción general¿Te apasiona asegurar la fiabilidad y escalabilidad de infraestructuras complejas?
¡Te estamos buscando!
Buscamos un Site Reliability Engineer (SRE) que nos ayude a optimizar nuestros sistemas, garantizar su estabilidad y mejorar nuestra capacidad de respuesta ante incidentes.
Responsabilidades:Diseñar, implementar y mantener infraestructuras escalables y altamente disponibles.Colaborar con equipos de desarrollo para mejorar la capacidad de observabilidad y monitoreo de los servicios.Automatizar procesos operativos para optimizar tiempos de respuesta y reducir la intervención manual.Identificar y solucionar problemas de rendimiento y fiabilidad en los sistemas.Participar en la gestión de incidentes y resolver problemas críticos con rapidez.Implementar soluciones de alta disponibilidad (HA) y disaster recovery (DR).Mantener métricas clave (SLOs, SLIs, SLAs) para garantizar un rendimiento óptimo.Requisitos:Profesional en Ingeniería de sistemas o carreras profesionales relacionadas.Vivir en Bogotá o municipios aledaños a Bogotá.Experiencia previa en un rol de SRE, DevOps o ingeniería de infraestructura.Conocimiento profundo de sistemas operativos Linux/Unix.Experiencia con herramientas de monitoreo como Prometheus, Grafana, o similares.Conocimiento de contenedores y orquestadores como Docker y Kubernetes.Experiencia con scripting y automatización (Python, Bash, etc.
).Familiaridad con servicios en la nube (AWS, GCP, Azure).Habilidades en la resolución de problemas complejos y gestión de incidentes.Fuerte orientación al trabajo en equipo y capacidad de comunicación.Beneficios:Oportunidad de trabajar en un entorno dinámico y colaborativo.Desarrollo profesional y oportunidades de crecimiento.Paquete de beneficios competitivos.¡Si estás listo para unirte a un equipo innovador y contribuir al éxito de proyectos emocionantes, no dudes en postularte!
#J-18808-Ljbffr