Получи случайную криптовалюту за регистрацию!

Задали вопрос: «За что премировать SRE-команды (site reliabili | Про процессы и людей глазами очевидца

Задали вопрос: «За что премировать SRE-команды (site reliability engineering)?» Какие есть ли особенности премирования с учетом функционала таких сотрудников.

Site reliability engineering, или по-русски обеспечение надежности инфраструктуры — это дисциплина на стыке разработки программного обеспечения и управления инфраструктурой. Основная цель — создание масштабируемых и высоконадежных систем. Представитель такой профессии может и код поправить/написать, и хорошо знает, как работают сервера, сети итп.

В самой профессии нет ничего нового: инженеры, системные администраторы и раньше код писали. Только не назывались так красиво. Но SRE пришло из Google, там умеют красивые слова придумывать для обычных вещей.

За что можно давать премии?

Сразу скажу, я не сторонник давать премии за работу, которую и так должен хорошо выполнять сотрудник. Его же для этого и брали, да? Но если уж отвечать на вопрос, то я бы исходил из задач бизнеса. И влияние на них команд SRE.

Работа инженера — обеспечение непрерывности бизнеса и его развития:
1. Обеспечение непрерывного функционирования ключевой инфраструктуры, от работы которой зависит производство, продажи итп.
2. Помощь в снижении Time-to-market в части взаимодействия с производством.

Непрерывное функционирование инфраструктуры связано с реактивным решением проблем и с проактивым:
- реагирование на текущие инциденты (какой-то из узлов, компонентов вышел из строя и влияет на процессы);
- развитие инфраструктуры для предотвращения инцидентов в будущем;

Влияние на снижение TTM — организация процесса публикации изменений максимально быстрым образом. Программист сделал за час, а в бой смогли отправить только через неделю? Так себе история.

Поскольку на деятельность команд влияют люди, которых в них состоят, то еще одно направление работы SRE-инженеров — развитие компетенций сотрудников, обеспечение их взаимозаменяемости. Например, если базу данных может поднять только один сотрудник, то это очень негативно может повлиять на бизнес. Люди болеют, ходят в отпуск, не всегда берут телефоны по ночам. Поэтому задача — чтобы как минимум двое сотрудников могли обеспечивать непрерывную работу каждого компонента. Найти узкие места в команде можно, например, с помощью Кловери.

И если компания большая и у нее есть бизнес-задача оптимизация расходов, то можно еще и эту историю включить — например, измерять, насколько утилизируются ресурсы инфраструктуры, за которую отвечают SRE.

Итак, три составляющих, влияющих на премии SRE-команд:
- Развитие продукта компании в части скорости поставки;
- Развитие процессов компании в части надежности работы инфраструктуры, оптимизации ресурсов;
- Развитие персонала компании в части развития компетенций.

Напоминаю, можете задать мне вопрос в чате канала или в личку, и я на него отвечу.