Alaska Airlines IT sorunları nedeniyle uçaklar durdu

Tarih:

Paylaş:

Veri merkezi arızası Alaska Airlines operasyonlarını durdurdu

Alaska Airlines IT sorunları, havayolunun birincil veri merkezinde meydana gelen arızayla birlikte filonun yere indirilmesine ve çok sayıda uçuşun aksamasına yol açtı. Şirket, kritik sistemlerdeki kesintinin ardından operasyonları geçici olarak durdurduğunu belirtirken, yolcular havalimanlarında beklemek zorunda kaldı. Bu olay, Temmuz ayından bu yana yaşanan ikinci geniş kapsamlı kesinti olarak dikkat çekiyor ve altyapı dayanıklılığına ilişkin soruları artırıyor.

Mevcut bilgilere göre sorun, havayolunun temel operasyon sistemlerinin barındırıldığı birincil veri merkezindeki arızadan kaynaklandı. Uçuş planlama, mürettebat eşleştirme, bakım serbest bırakma ve yük-denge (weight and balance) gibi görev-kritik uygulamalar birbiriyle sıkı entegrasyon içinde çalıştığından, bu tür bir kesinti çoğu zaman geniş bir zincirleme etki yaratıyor. Yedek sistemlere devrin beklenildiği gibi gerçekleşmemesi veya kısmi bir devrin tutarsız veriler üretmesi durumunda ise güvenlik gereği uçakların yerde tutulması tercih ediliyor.

Alaska Airlines IT sorunları: muhtemel nedenler ve zincirleme etkiler

Benzer vakalarda tipik kök nedenler arasında elektrik altyapısı arızaları, ağ segmentasyonu kaynaklı iletişim kopuklukları, depolama kümesi sorunları, kimlik doğrulama/izin hizmetlerindeki kesintiler ya da veri merkezleri arası çoğaltma hataları sayılabilir. Bu katmanlardan herhangi biri bozulduğunda, uçuş operasyonlarının güvenli ve düzenli yürütülmesi için zorunlu olan verilerin (uçak konfigürasyonu, performans hesapları, enroute kısıtlar, slot/kapı atamaları vb.) erişilebilirliği sınırlanır.

Havayolları genellikle aktif-aktif veya aktif-pasif coğrafi yedeklilik planları uygular, düzenli felaket kurtarma testleri yapar ve olağanüstü durum senaryolarını tatbik eder. Buna rağmen, gerçek dünyadaki arıza kalıpları bazen test senaryolarını aşarak beklenmedik kenar durumlar doğurabilir. Temmuzdan beri ikinci kez yaşanan bu kapsamda kesinti, mimari dayanıklılık, prosedürel uygulama ve değişiklik yönetimi (change management) disiplinlerinin birlikte gözden geçirilmesi gerektiğine işaret ediyor.

Operasyonların yeniden başlatılması ve yolcu etkisi

Geri dönüş (recovery) safhasında tipik yaklaşım, önce kimlik, ağ ve veri katmanı gibi temel servisleri ayağa kaldırmak; ardından uçuş operasyonları, bakım, yük-denge ve rezervasyon sistemlerini senkronize ederek kademe kademe kapasiteyi artırmaktır. Bu süreçte, ABD hava trafik otoriteleriyle koordinasyon, slot ve kapı planlarının yeniden hesaplanması ve operasyonel güvenlik kontrollerinin tamamlanması gerekir. Kademeli açılış sırasında bazı uçuşlar yeniden zamanlanabilir, rotalar optimize edilebilir ve mürettebat eşleştirmeleri güncellenebilir.

Yolcular açısından kısa vadede iptal ve gecikmeler, bağlantı kaçırma riskleri ve bagaj operasyonlarında yoğunluk beklenebilir. Taşıyıcılar bu gibi durumlarda genellikle esnek değişiklik/iadeleri devreye alır, alternatif uçuşlara ücretsiz aktarma sunar ve iletişimi mobil uygulama, SMS ve e-posta üzerinden sürdürür. ABD düzenlemeleri uyarınca iptal edilen bir uçuş için yolcuların geri ödeme hakkı bulunur; ancak ikincil masraflar (konaklama, transfer) şirket politikalarına ve olayın niteliğine göre değişebilir. Yolcuların, havayolunun bildirim kanallarını ve uçuş durumlarını sık aralıklarla kontrol etmesi önerilir.

Sektör için çıkarımlar

Bu olay, havacılıkta kritik BT altyapısının sadece yedekli olmasının değil, yedeklerin tutarlı, test edilmiş ve görünürlüğü yüksek şekilde işletilmesinin önemini vurguluyor. Gözlemlenebilirlik (observability), kapsamlı olay müdahale (incident response) planları, kaos mühendisliği tatbikatları ve tedarikçi bağımlılıklarının (DNS, kimlik, bulut/colo sağlayıcıları) uçtan uca risk değerlendirmeleri, benzer kesintilerin etkisini azaltabilir. Ayrıca, değişiklik dondurma pencereleri, sürüm geri alma stratejileri ve veri bütünlüğü denetimleri, kısmi iyileşmenin tutarsızlıklara yol açmasını önlemeye yardımcı olur.

Alaska Airlines IT sorunları bağlamında, kök neden analizi tamamlanana dek kesin yargılardan kaçınmak gerekir. Bununla birlikte, olayın Temmuzdan bu yana ikinci kez yaşanması, uzun vadeli bir dayanıklılık programı, kapasite artırımları ve süreç iyileştirmeleri için kurumsal önceliklendirmeyi muhtemelen hızlandıracaktır. Şirketin ayrıntılı bir rapor paylaşması ve öğrenilen dersleri sektöre aktarması beklenir.

Diğer Haberler

The Witcher 4 için yazarla nadir danışma

Andrzej Sapkowski, The Witcher'ın yazarı, The Witcher 4 geliştiricisi CD Projekt ile mükemmel bir anlaşma yaptığını belirtti. Ancak, CD Projekt'in artık kendisinden pek sık tavsiye istemediğini ifade etti.

Outer Worlds 2 kötü adam olarak eğlenceli bir deneyim

Outer Worlds 2, RPG oyunları arasında bir fark yaratarak kötü adam olmanın eğlenceli yanlarını ortaya koyuyor. Oyuncular, iyi niyetli kahraman rolünden çıkıp, sevilmeyen bir karakter olmayı deneyimleyerek yeni bir oyun tarzı benimseyebiliyorlar.

Jean Grey Marvel return hakkında yeni açıklamalar

Famke Janssen, Jean Grey karakterinin yeniden dönmesiyle ilgili olarak Marvel'ın kendisini asla geri çağırmadığını belirtti. X-Men filmiyle tanınan Janssen, 2014'ten beri bu rolü oynamadığı için sürpriz bir şekilde sorularla karşılaştığını ifade etti.

Brendan Greene açık dünya oyunu erken erişimde

Brendan Greene açık dünya türündeki yeni oyununun erken erişim sürümü bu ay çıkış yapıyor. Oyun, oyunculara zorlu doğa koşullarında ilerlemelerini kaydetme olanağı sunacak ve ek oyun modları ile harita editörü içerecek.