Amazon, Ring, Netflix, Amazon Prime Video ve Roku dahil olmak üzere yüksek profilli sitelerin ve çevrimiçi hizmetlerden oluşan uzun bir listenin uzun süreli kesintiler yaşamasına neden olan bu haftaki büyük AWS kesintisinin arkasındaki temel nedene biraz ışık tutmak için bir açıklama yayınladı.
Kesinti Salı günü yaklaşık 10:30 EST’de başladı. Yaşanan kesintiye, ABD’nin kuzeydoğu kesimindeki kullanıcılar ve şirketler için hizmet veren US-EAST-1 AWS bölgesi sebep olmuştu.
Yaşanan kesintide, Netflix, Amazon Prime ve Roku üzerinden yapılan yayınlar kesintiye uğradı ve uzaktan kamera izleme servisi olan Ring’in kullanıcıları da kameralarına erişemedi.
Buna ek olarak, Amazon’un teslimat çalışanları, paketleri taramak, teslimat rotalarına erişmek veya yaklaşan programları görmek için gereken dahili uygulamalara erişimde de sorunlar yaşadı.
Amazon, bu olaya dair yayınladığı açıklamada: “Ana AWS ağında barındırılan AWS hizmetlerinden birinin kapasitesini ölçeklendirmek için 07:30 PST’de gerçekleşen otomatik bir etkinlik, dahili ağ içindeki çok sayıda istemciden beklenmeyen bir davranışı tetikledi,” dedi.
“Bu, dahili ağ ile ana AWS ağı arasındaki ağ aygıtlarının aşırı yüklenmesine sebep olan ve bu ağlar arasındaki iletişimde gecikmelere neden olan büyük gecikmeye neden oldu.”
“Bu gecikmeler, bu ağlar arasında iletişim kuran hizmetler için gecikmeyi ve hataları artırarak daha fazla bağlantı girişimi ve yeniden denemeye neden oldu. Bu da, iki ağı birbirine bağlayan cihazlarda kalıcı tıkanıklık ve performans sorunlarına yol açtı.”
“Destek İletişim Merkezimiz de dahili AWS ağı üzerinden çalışmakta, bu nedenle destek vakaları oluşturma işlemleri de 07:33’ten 14:25 PST’ye kadar etkilenmiştir. Hizmetin etkisini anlamayı kolaylaştıracak Hizmet Sağlığı Panomuzun yeni bir sürümünü ve müşterilerle iletişimde gecikme yaşamamamızı sağlamak için birden çok AWS bölgesinde aktif olarak çalışan yeni bir destek sistemi mimarisini önümüzdeki yılın başlarında yayınlamayı umuyoruz.” – Amazon
Salı günü yaşanan AWS kesintisi, Kasım 2020’de aynı bölgeyi etkileyen büyük ölçekli bir olay da dahil olmak üzere 2011’den bu yana benzer birçok olay da göz önüne alındığında türünün ilk örneği olmadığını söyleyebiliriz.
Kesinti yaşandığında, Amazon’un gerçek zamanlı akış verilerini işlemeye yönelik Kinesis hizmeti de sorun yaşamaya başladıktan sonra çok sayıda site ve çevrimiçi platform da çöktü.
Bir yıl önce, Eylül 2019’da, Kuzey Virginia’daki AWS US-EAST-1 veri merkezinde meydana gelen bir elektrik kesintisi, dosyalarını geri yüklemek için çalışan, yedekleri olmayan tüm Amazon müşterileri için veri kaybına neden oldu.
Şubat 2017’de ise, yine AWS üzerinde yaşanan S3 (Basit Depolama Hizmeti) kesintisi, Adobe’nin uygulamaları ve hizmetleri, Docker, Mailchimp, Medium, Signal, Slack, Trello, Twilio, IFTTT de dahil olmak üzere milyonlarca küçük ve yüksek profilli siteyi ve çevrimiçi platformu etkilemişti.
Kaynak: bleepingcomputer.com
İlginizi Çekebilecek Diğer Haberler
Honda, F1’e Şampiyonlukla Veda Ediyor
Log4j Yayılmaya Devam Ediyor Şimdi de VMware
Log4Shell Zafiyeti İçin Mitigate Yöntemleri Yayınlandı