Вчера с 21 до 24 у нас был самый большой сбой за последние пар | LiveDune
Вчера с 21 до 24 у нас был самый большой сбой за последние пару лет. В этот промежуток времени сервис был недоступен.
Что произошло: ситуация была очень похожая на то, что случилось недавно у Facebook. Мы проводили плановое обновление софта для улучшения безопасности сервиса, и словили полное зависание базы данных. Мы до последнего надеялись, что она заработает но нет
В итоге сейчас сервис работает на резервном сервере в штатном режиме, наша главная ошибка была в том, что не переключились на него сразу же.
Мы приносим извинения за доставленные неудобства, такая ситуация просто недопустима, но она подсветила проблемные места как в наших процессах, так и в архитектуре сервиса - их исправлением мы и займемся.