Служба User ID стала причиной глобального сбоя на сервисах Google

Служба User ID стала причиной глобального сбоя на сервисах Google

От автора: причиной глобального сбоя на сервисах Google, который произошел 14 декабря, стала ошибка службы аутентификации.

14 декабря произошел глобальный сбой в системе Google, который затронул Gmail, YouTube и Google Docs. В течение 45 мин. Эти сервисы были недоступны по всему миру. Как объяснили специалисты компании, в Google для каждого пользователя существует свой уникальный идентификатор. Для его распознавания служба аутентификации использует cookies и токены OAuth, хранящиеся в распределенной БД. В ней для проверки актуальности данных применяются протоколы Paxos, которые не принимают устаревшие данные.

Осенью Google начал обновлять систему User ID Service. Но при этом часть старых квот сохранилась и их использование для отправки запросов спровоцировало наступление первой фазы сбоя. Они вызвали ошибку о нулевом применении службы User ID.

После окончания отсрочки на применение квот сработал механизм их автоматического снижения для службы идентификации пользователей. Это стало причиной второй (более глобальной) фазы сбоя из-за переполнения БД.

Источник: status.cloud.google.com