Yüksek Erişilebilirlik (HA) Nedir? Kesintisiz Sistem Altyapısı Rehberi

Yüksek Erişilebilirlik (HA) Nedir? Kesintisiz Sistem Altyapısı Rehberi

Author

Ayberk Tığlı

Publication Date
21st May 2026
Views
700

Kesintisiz Hizmetin Kalesi: Yüksek Erişilebilirlik (High Availability) Rehberi

Bir pazar günü öğleden sonra, en yoğun satış trafiğini beklediğiniz anda sistemlerinizin aniden sustuğunu hayal edin. Sadece birkaç dakikalık bir kesinti; müşteri güveninde sarsılma, binlerce liralık ciro kaybı ve teknik ekibin yaşadığı o tarifsiz panik... İşte bu kabusu gerçeğe dönüştürmeyen sihirli kavramın adı: Yüksek Erişilebilirlik (High Availability - HA).

Günümüzde teknoloji dünyasında "çalışıyor olmak" artık yeterli değil. Önemli olan "her zaman çalışıyor olmak". Peki, ama nasıl?

1. Yüksek Erişilebilirlik Tam Olarak Nedir?

Yüksek Erişilebilirlik, basit bir ifadeyle bir sistemin veya servisin, belirli bir zaman dilimi içinde (genellikle yıl bazında) kabul edilebilir bir kesinti süresiyle kesintisiz çalışabilme kapasitesidir. Buradaki kritik nokta, sistemin tek bir hata noktasına (Single Point of Failure - SPOF) sahip olmamasıdır.

Yazılım ve donanım dünyasında HA, bir "sigorta" poliçesi gibidir. Bir sunucu çökerse diğeri devreye girer; bir veri merkezi su baskınına uğrarsa trafik diğer coğrafi bölgeye yönlenir. Kullanıcı bu sırada arkada neler döndüğünü ruhu bile duymadan hizmetini almaya devam eder.

2. Dokuzların Gizemi: %99.999 Ne Anlama Geliyor?

HA dünyasında başarıyı ölçmek için kullanılan standart bir "dokuzlar" tablosu vardır. Bir sistemin ne kadar "erişilebilir" olduğunu bu yüzdelik oranlar belirler:

  • %99 (İki Dokuz): Yılda yaklaşık 3.65 gün kesinti (Kabul edilemez).
  • %99.9 (Üç Dokuz): Yılda 8.77 saat kesinti (Genel kabul gören başlangıç seviyesi).
  • %99.99 (Dört Dokuz): Yılda 52.6 dakika kesinti (Profesyonel sistemler için standart).
  • %99.999 (Beş Dokuz): Yılda sadece 5.26 dakika kesinti (Kritik altyapılar ve bankacılık düzeyi).

3. HA Sistemlerinin Temel Bileşenleri

Bir sistemi gerçekten erişilebilir kılmak için masaya yatırmamız gereken üç ana sütun vardır:

A. Redundancy (Yedeklilik)

Sistemdeki her kritik parçanın bir ikamesinin olmasıdır. Bir güç kaynağı (UPS), bir switch, bir disk veya bir sunucu bozulduğunda, işi devralacak "yedeğin" hazırda beklemesi gerekir.

B. Failover (Hata Devretme)

Yedeklilik tek başına yeterli değildir. Bir hata oluştuğunda sistemin bu hatayı algılayıp trafiği otomatik olarak sağlam olan yedek birime aktarması gerekir. Manuel müdahale gerektiren bir failover süreci, gerçek bir HA senaryosu sayılamaz.

C. Data Replication (Veri Çoğaltma)

Donanımı yedeklediniz, trafik aktı; peki ya veriler? Eğer veritabanınız senkronize değilse, ikinci sunucu devreye girdiğinde müşterilerinizin son 10 dakikalık işlemlerini görememesi felaketle sonuçlanır. Verinin anlık olarak düğümler (node) arasında kopyalanması hayati önem taşır. (Bakınız: Veri Tutarlılığı ve CAP Teoremi).

4. Mimari Yaklaşımlar: Active-Passive vs. Active-Active

HA altyapısı kurarken genellikle iki popüler yoldan birini seçeriz:

  • Active-Passive (Aktif-Pasif): Bir ana sunucu vardır, trafik buraya akar. Diğer sunucu ise "nöbette" bekler. Ana sunucu ölürse pasif olan ayağa kalkar. Maliyet açısından daha uygundur ancak failover sırasında kısa bir "uyanma" süresi olabilir.
  • Active-Active (Aktif-Aktif): Tüm sunucular aynı anda trafiği karşılar. Bir Load Balancer (Yük Dengeleyici) gelen istekleri paylaştırır. Biri çökerse, diğerleri yükü sırtlanmaya devam eder. En yüksek performans ve erişilebilirlik bu yöntemle sağlanır.

5. Yüksek Erişilebilirliği Engelleyen Gizli Düşmanlar

Profesyonel bir sistem kurduğunuzu sanırken sizi arkadan vurabilecek durumlar şunlardır:

  • Tek Noktadan Beslenme (SPOF): Binlerce sunucunuz olabilir ama hepsi aynı switch’e bağlıysa, o switch bozulduğunda tüm sisteminiz çöker.
  • Otomasyon Eksikliği: İnsan hatası, kesintilerin en büyük sebebidir. Scriptlerle otomatize edilmemiş bir kurtarma süreci, "insan faktörü" nedeniyle uzayabilir.
  • Test Etmeme Hatası: "Nasıl olsa yedeğimiz var" demek en büyük yanılgıdır. Felaket kurtarma (Disaster Recovery) senaryoları düzenli olarak test edilmelidir. (Bakınız: Kaos Mühendisliği).

6. Geleceğin HA Dünyası: Bulut ve Konteynerler

Klasik fiziksel sunuculardan bulut teknolojilerine geçiş, HA süreçlerini demokratikleştirdi. Artık Kubernetes gibi konteyner orkestrasyon araçları sayesinde, çöken bir uygulamanın saniyeler içinde yeni bir kopyasının otomatik olarak başka bir fiziksel makinede ayağa kalkmasını sağlayabiliyoruz. Multi-cloud ve Multi-region stratejileri ile artık sadece bir sunucunun değil, koca bir veri merkezinin yok olması bile işlerinizi durdurmuyor.

Sonuç: Bir Lüks Değil, Bir Zorunluluk

Yüksek Erişilebilirlik, sadece büyük bankaların veya teknoloji devlerinin bir lüksü değil; dijital varlığı olan her işletmenin temel ihtiyacıdır. Kesinti süresi maliyeti, HA altyapısı kurma maliyetini geçtiği noktada, bu yatırımı yapmak artık kaçınılmazdır.

Unutmayın; en iyi sistem, hata yapmayan sistem değil, hata yaptığında bunu kimseye fark ettirmeden yoluna devam edebilen sistemdir.

Bu yazı, sistemlerini bir üst seviyeye taşımak isteyen teknoloji tutkunları ve işletme sahipleri için hazırlanmıştır.