2021-04-07 16:45:38
«Флант» срочно ищет трех SRE-инженеров, помешанных на observability Мы выделяем команду мониторинга и ищем в нее трех senior SRE. Задача команды — разрабатывать внутренние решения компании для мониторинга.
Команда сфокусируется на разработке платформы (на основе Prometheus, Cortex, Grafana и ряда других решений) и смысловой части (правильных метрик, наглядных графиков и своевременных алертов).
Три бравых SRE нужны именно в «смысловую» часть.
Основная работа будет посвящена следующим направлениям:
* Поиск способов эффективного и безопасного сбора метрик. Реализация этих способов на Go или в существующих Open Source-экспортерах, или в собственных экспортерах.
* Анализ и реализация таких графиков и дашбордов, по которым с первого взгляда понятно, что пошло не так и где надо починить. Которые реально помогают найти проблему, а не просто показывают миллион бесполезных лампочек.
* Вытачивание алертов, которые никогда не шумят, но при этом сообщают настолько заранее о приближающихся проблемах, насколько это возможно.
Если у вас это отзывается в сердце
(или что-там у вас вместо сердца… TSDB?..), а также вы любите целыми днями разбираться в вопросах вроде: «почему оно сломалось?», «какого черта в этих метриках какая-то чушь?», «ого, какой интересный promql получился!» — вам очень понравится работать в этой команде! Ведь в нашем Prometheus — около 1 млрд метрик с сотен кластеров Kubernetes… но это не точно
По всем вопросам — @Sukhanova_Anna или на hr@flant.ru.
А если у вас есть кто-то из знакомых на примете — любые репосты очень приветствуются!
P.S. Кстати, заодно
мы ищем и Frontend-разработчика. В основном это React. Мы очень любим Grafana, но не всё в ней устраивает. Хотим слепить «графанкенштейна», который будет полностью совместим с панелями и дашбордами Grafana, но иметь совсем другие возможности навигации и совершенно другую логику связей/переходов между дашбордами.
979 views13:45