Крупный технический сбой в облачной инфраструктуре Amazon Web Services парализовал работу ряда сервисов, включая криптовалютную биржу Coinbase. Причиной инцидента стал перегрев оборудования в одном из центров обработки данных, который привел к каскадным отключениям и вынудил инженеров экстренно перенаправлять потоки данных в другие зоны доступности для спасения систем.
Представители AWS отчитались о частичном восстановлении работоспособности систем к пятнице, 8 мая, однако полная стабилизация инфраструктуры займет еще несколько часов. Инцидент вновь обнажил уязвимость современных дата-центров перед лицом экстремальных вычислительных нагрузок. Потребности систем искусственного интеллекта и облачных вычислений растут быстрее, чем возможности существующих систем охлаждения, что вынуждает операторов переходить на жидкостные технологии.Подобные аварии перестают быть редкостью: ранее отказ системы охлаждения в дата-центре CyrusOne привел к масштабным проблемам у CME Group. В AWS признают проблему, но указывают на длительные сроки, необходимые для модернизации инфраструктуры. Ситуация осложняется тем, что компания также ведет работу по восстановлению мощностей на Ближнем Востоке, пострадавших в ходе региональных конфликтов, что дополнительно растягивает график технического обслуживания.
Комментарии (0)
Пока нет комментариев. Будьте первым!