Проблем с неизяснена база данни на Amazon наруши живота на милиони хора в САЩ и по света, след като основни интернет услуги на редица компании спряха да функционират.

Устройствата Alexa не можеха да чуват. Корпоративните съобщения в Slack не се публикуваха. Студентите не можеха да предават задачи или да имат достъп до материали от курсовете. Финансовите трансакции на определени платформи бяха невъзможни. Потребителите на Zoom, Venmo, Instacart и редица други услуги се сблъскаха с продължителни прекъсвания, които се отразиха на домовете и бизнеса, пише Wall Street Journal.

Проблемът започна няколко часа след полунощ на източното крайбрежие на САЩ, или след 7 часа сутринта българско време.

Незначителна актуализация на т.нар. система за имена на домейни (Domain Name System, DNS) – вид софтуерна настройка, която се извършва милиони пъти на ден в интернет – срина добре смазаната машина, която поддържа съвременния интернет.

DNS действа като телефонен указател за интернет, давайки инструкции на машините как да се откриват една друга. Неправилната актуализация даде грешна информация за DynamoDB – продукт на Amazon Web Services, който се превърна в една от най-важните бази данни в света.

Изведнъж машините по източното крайбрежие, които се опитваха да обработят трилиони заявки, получаваха нещо, което в интернет се равнява на грешен номер.

Услугите на Amazon бяха едни от първите, които почувстваха ефектите.

Около 2 часа сутринта източно време системите, които помагат на Amazon да сортира пакетите в камионите и да насочва шофьорите по пътищата, са престанали да функционират, се вижда от вътрешно съобщение, видяно от WSJ.

Към 3 часа сутринта радиусът на въздействието стига далеч отвъд Amazon, разпространявайки се из интернет, забавяйки повече от 4000 полета, блокирайки новинарски уебсайтове като The Wall Street Journal, засягайки финансовите трансакции и покривайки множество елементи от ежедневието.

Инцидентът, който се превърна в един от най-продължителните ежедневни сривове за Amazon Web Services, напомни за това колко крехка е глобалната свързаност, която през последните години е прекъсвана няколко пъти след на пръв поглед незначителни софтуерни актуализации. В късния следобед в понеделник Amazon съобщи, че е възстановила голяма част от услугата, която беше прекъсната.

„Дори да е за кратко, прекъсването на големи доставчици като AWS показва уязвимостта на това, което се е превърнало в критична инфраструктура за организациите и, в някои случаи, за правителствата по целия свят“, коментира Джейкъб Бърн, анализатор в изследователската фирма eMarketer. „С разширяването на зависимостта от облака и увеличаването на натоварването, тези прекъсвания могат да засегнат индустриите по-силно.“

По подобен начин друго прекъсване на AWS през 2021 г. наруши бизнес и лични дейности в цялата икономика през по-голямата част от деня. Amazon контролира около една трета от публичния пазар на облачни изчисления, основната инфраструктура на съвременния интернет.

Един час след началото на прекъсването Amazon изглеждаше оптимистично настроена. „Продължаваме да наблюдаваме възстановяване на повечето от засегнатите AWS услуги“, написа компанията. Половин час по-късно тя призна, че клиентите все още не са излезли от кризата. Клиентите имаха проблеми със стартирането на нови сървъри за облачни изчисления – гръбнакът на операциите на AWS.

Проблемите с DynamoDB се трупаха. Скоро те щяха да направят AWS практически неизползваема за клиентите, зависими от центровете за данни на Amazon на източното крайбрежие. До края на деня 142 продукта на AWS щяха да бъдат засегнати, включително софтуерът, който компанията използва за разпределяне на изчислителното търсене в мрежата си от центрове за данни, и софтуерът за доставка на съдържание, който използва за показване на сайтове в интернет браузърите.

Толкова много услуги на източното крайбрежие бяха засегнати, че клиентите, които просто искаха да преместят изчислителните си операции в друга част от облака на Amazon, се оказаха неспособни да мигрират.

В 4 часа сутринта в понеделник борсата за криптовалути Coinbase съобщи на клиентите си, че е наясно, че много от тях не могат да влязат в акаунтите си поради прекъсването на Amazon и полага усилия, за да им предостави достъп.

Някои клиенти заявиха, че прекъсването им е попречило да затворят сделките си. „Криптоборса, свалена от централизирано облачно хранилище. Не можеш да проповядваш децентрализация и все пак да разчиташ на AWS, за да останеш онлайн“, пише потребител.

По същото време търговската платформа Robinhood също съобщи, че прекъсването на AWS е спряло работата ѝ. В социалната мрежа X компанията заяви, че проблемите са продължили през целия понеделник, но в крайна сметка са били решени.

Макар че е твърде рано да се разбере напълно колко е струвало прекъсването, други компании се изправиха пред искове и съдебни дела за милиони долари, когато техните услуги са били в основата на глобални прекъсвания.

Миналата година софтуерен пач от CrowdStrike извади от строя близо 10 млн. компютъра, засягайки болници, ресторанти, медийни компании и други. Въпреки че острата последица от това събитие беше свързана с лаптопи, използващи софтуер на Microsoft, които станаха неизползваеми, облакът също изигра роля.

Доставчикът на застраховки срещу цифрови смущения Parametrix заяви, че събитието с CrowdStrike е причинило загуби в размер на 5,4 млрд. долара за компаниите от Fortune 500, без да се включва Microsoft.

Анализатори коментират, че прекъсването на Amazon Web Services ще ускори тенденцията сред много мениджъри да разнообразят своите облачни услуги. Това може да улесни реагирането и адаптирането към прекъсвания, но мениджърите в софтуерния сектор предупреждават, че проблеми могат да възникнат и на други облачни платформи.

Някои компании, които са се диверсифицирали, са успели да избегнат хаоса, с който другите се сблъскаха през деня.

Шон Хънт, главен информационен директор на McKenney's, заяви, че строителната компания, базирана в Атланта, не е претърпяла пълно спиране, тъй като използва няколко облачни платформи и работи със собствени центрове за данни. „Имаме стратегия за диверсифициране на риска“, каза той.

През последното десетилетие DynamoDB не само захранва търговската дейност на Amazon, но и все повече съхранява данните, използвани от самите изчислителни услуги на AWS, според Адриан Коккрофт, бивш мениджър на AWS, който сега е технологичен съветник.

„Но ако не можете да го достигнете, защото DNS не работи, тогава всичко останало също не работи“, пояснява той. „Това е като да се опитате да посетите сайт, който не съществува.“