Многие крупнейшие мировые сайты, включая Snapchat, Reddit и Roblox, были отключены в понедельник из-за масштабного сбоя Amazon Web Services (AWS).
Более 1000 приложений и веб-сайтов, включая банки, такие как Lloyds и Halifax, пострадали от проблемы, которая лежит в основе деятельности гиганта облачных вычислений в США, согласно данным Downdetector, отслеживающего сбои платформы.
В компании сообщили, что количество сообщений от пользователей probleglobally резко возросло до более чем 6,5 миллионов во время сбоя в понедельник утром.
Хотя Amazon заявила об устранении сбоя к 12:00 по британскому летнему времени, эксперты считают, что это демонстрирует опасности, с которыми сталкиваются многие компании, полагающиеся на одного доминирующего провайдера.
«Этот эпизод подчеркнул, насколько взаимозависима наша инфраструктура», — сказал профессор Алан Вудворд из Университета Суррея.
«Многие онлайн-сервисы полагаются на сторонние ресурсы для обеспечения своей физической инфраструктуры, и это показывает, что проблемы могут возникать даже у самых крупных из этих сторонних поставщиков.
«Небольшие ошибки, часто вызванные человеческим фактором, могут иметь масштабные и значительные последствия».
Проблемы, по всей видимости, начались около 7:00 по британскому летнему времени в понедельник, когда пользователи начали сообщать о проблемах с доступом к множеству платформ.
Это касалось широкого спектра различных сайтов и сервисов, от популярных онлайн-игр, таких как Fortnite, до приложения для изучения языков Duolingo.
Downdetector сообщил BBC, что всего за несколько часов получил более четырёх миллионов сообщений от пользователей с 500 сайтов — это более чем вдвое больше, чем за весь обычный будний день.
Позже число сообщений превысило шесть миллионов, говорится в сообщении, поскольку всё больше сервисов, включая Reddit и Банк Lloyds Bank предпринял попытку восстановления.
Около 11:00 по британскому летнему времени (BST) Amazon сообщила, что большинство затронутых сервисов восстановлено.
Что пошло не так?
Amazon пока не раскрыла точную причину сбоя в понедельник и не опубликовала официального заявления по этому поводу.
В обновлении на своей веб-странице статуса сервиса говорится, что проблема, «по всей видимости, связана с разрешением DNS конечной точки API DynamoDB в регионе US-EAST-1».
DNS (система доменных имён) часто сравнивают с телефонным справочником в интернете.
Система фактически преобразует используемые пользователями названия веб-сайтов (например, bbc.co.uk) в числа, которые могут прочитать и понять компьютеры.
Этот процесс, по сути, лежит в основе того, как мы пользуемся интернетом, и его сбои могут привести к тому, что веб-браузеры не смогут найти нужный контент.
Мэтью Принс, генеральный директор Cloudflare, рассказал BBC, что сбой в работе AWS продемонстрировал влияние облачных сервисов на работу интернета.
«У всех бывают плохие дни, сегодня у Amazon был плохой день», — сказал он.
«В облаке есть удивительные возможности: оно позволяет масштабироваться… но такой сбой может вывести из строя множество сервисов, от которых мы зависим».
А Кори Крайдер, глава Института будущего технологий, рассказала BBC, что это «немного похоже на обрушение моста».
«Важнейшая часть экономики развалилась», — сказала она.
А учитывая, что облачные вычисления в значительной степени зависят от Amazon, Microsoft и Google (по оценкам, около 70%), она заявила, что статус-кво «неустойчив».
«Как только у вас есть концентрированный источник… «Когда что-то подобное рушится, горстка монопольных поставщиков услуг теряет огромную долю экономики», — сказала она.
«Нам действительно стоит подумать о покупке большего количества местных услуг, а не полагаться на горстку американских монопольных платформ.
«Это риск для нашей безопасности, нашего суверенитета и нашей экономики, и нам необходимо рассмотреть структурное разделение, чтобы сделать наши рынки более устойчивыми к подобным потрясениям».
Дополнительный материал от Эсиллта Карра.
