Descripción general ¿Te apasiona asegurar la fiabilidad y escalabilidad de infraestructuras complejas?
¡Te estamos buscando!
Buscamos un Site Reliability Engineer (SRE) que nos ayude a optimizar nuestros sistemas, garantizar su estabilidad y mejorar nuestra capacidad de respuesta ante incidentes.
Responsabilidades: Diseñar, implementar y mantener infraestructuras escalables y altamente disponibles.
Colaborar con equipos de desarrollo para mejorar la capacidad de observabilidad y monitoreo de los servicios.
Automatizar procesos operativos para optimizar tiempos de respuesta y reducir la intervención manual.
Identificar y solucionar problemas de rendimiento y fiabilidad en los sistemas.
Participar en la gestión de incidentes y resolver problemas críticos con rapidez.
Implementar soluciones de alta disponibilidad (HA) y disaster recovery (DR).
Mantener métricas clave (SLOs, SLIs, SLAs) para garantizar un rendimiento óptimo.
Requisitos: Profesional en Ingeniería de sistemas o carreras profesionales relacionadas.
Vivir en Bogotá o municipios aledaños a Bogotá.
Experiencia previa en un rol de SRE, DevOps o ingeniería de infraestructura.
Conocimiento profundo de sistemas operativos Linux/Unix.
Experiencia con herramientas de monitoreo como Prometheus, Grafana, o similares.
Conocimiento de contenedores y orquestadores como Docker y Kubernetes.
Experiencia con scripting y automatización (Python, Bash, etc.).
Familiaridad con servicios en la nube (AWS, GCP, Azure).
Habilidades en la resolución de problemas complejos y gestión de incidentes.
Fuerte orientación al trabajo en equipo y capacidad de comunicación.
Beneficios: Oportunidad de trabajar en un entorno dinámico y colaborativo.
Desarrollo profesional y oportunidades de crecimiento.
Paquete de beneficios competitivos.
¡Si estás listo para unirte a un equipo innovador y contribuir al éxito de proyectos emocionantes, no dudes en postularte!#J-18808-Ljbffr