Насколько легко уронить интернет?Может быть вы заметили, что в последние полгода резко участились одновременные падения разных интернет-ресурсов. Как выяснилось, в мире есть два сервиса, ошибки в которых могут уронить почти весь интернет:
Amazon Web Services, один из самых больших игроков, предоставляющих облачные ресурсы, и
Cloudflare, основной щит от сетевых атак, который в настоящее время используется на слишком многих веб-сайтах (если вы когда-то нажимали оранжевую кнопочку с капчей «Подтвердите, что Вы не робот» — это оно).
Очень весело читать, в чем же были ошибки. Так вот, в случае AWS возникла классическая проблема: произошел непредвиденный конфликт в распределенной системе DynamoDB. А с Cloudflare все еще смешнее: вылезла проблема в обращении к памяти в коде на языке, разработанном специально для нейтрализации таких проблем, — Rust (справедливости ради, дело было не в самом Rust, а в кривом конфигурационном файле). А вообще Cloudflare начал что-то слишком часто падать…
Ссылки:
1.
Сбой AWS 19-20 октября: во всём виноват DNS. Постмортем2.
В Cloudflare раскрыли причину многочасового глобального сбоя в работе — файл конфигурации3.
В Cloudflare раскрыли причину получасового глобального сбоя в работе 5 декабря — проблемы в коде на языке Lua