| GaonIT Cloud — 호스팅 & 클라우드
가온IT

고가용 웹스택

개발자가 사랑하는 호스팅 & 클라우드. 지금 바로 시작하세요.

Solution 고가용성 Stateless 우선

고가용 웹스택 (High Availability Web Stack)

웹/API 서비스의 무중단 운영을 목표로, L4/L7 분산, 상태검사, 자동 치유, 다중AZ, 데이터 이중화, 디도스 보호(프록시)까지 설계→구현→운영을 일괄 지원합니다. 요금은 별도문의로 안내합니다.

참조 아키텍처
엣지/보호
디도스 보호(프록시), WAF(옵션), TLS 종료/재암호화.
L4/L7 로드밸런서
헬스체크, 최소연결/가중치/해시 라우팅, 커넥션 드레이닝.
애플리케이션
Stateless 우선, 세션 외부화(쿠키/Redis), 오토스케일.
데이터
R/W 분리, 동기/반동기 복제, 스냅샷/백업, PITR.
캐시/메시지
Redis(세션/캐시), MQ로 비동기화/버퍼링.
관측/운영
메트릭/로그/트레이싱, 알림/자가치유, IaC/깃옵스.
네트워킹
다중AZ/서브넷, 보안그룹, NAT 게이트웨이, 전용선/CCX(옵션).
DR
크로스리전 복제, 자동 페일오버/수동 승격, 정기 DR연습.
가용성 패턴
패턴 적합 상황 비고
Active-Active 수평 확장 가능한 웹/API 상태 외부화 필요, 지역 간 지연 고려
Active-Passive (Warm) DB 중심 워크로드, 비용 최적 RTO 중간, 정기 전환 리허설
Blue/Green 무중단 배포, 롤백 신속 자원 2배 기간 발생
Canary 점진 릴리스/오류 탐지 메트릭/알림 연계 필수
목표 가용성/복구 지표
티어 가용성 RTO RPO 설계 포인트
Standard 99.9% ≤ 15분 ≤ 5분 단일 리전 다중AZ, A/P DB, 오토스케일
Plus 99.95% ≤ 5분 ≤ 1분 A/A 웹, 동기 복제, 카나리 배포
Enterprise 99.99% ≤ 1분 0~30초 크로스리전, 동기/준동기 혼합, 자동 페일오버
* 실제 수치는 워크로드/네트워크/복제 거리 등에 따라 달라집니다.
DB 복제/페일오버
# PostgreSQL 예: 동기 복제(부분 동기) + 자동 승격(개념 예시)
primary:
  synchronous_standby_names = 'FIRST 1 (node_b, node_c)'
  wal_level = replica
  max_wal_senders = 20
standby:
  primary_conninfo = 'host=10.0.0.10 user=replica password=*** sslmode=prefer'
  primary_slot_name = 'node_b'
# 감시/승격: repmgr or patroni 등 사용
세션 외부화/캐시
# Redis 예: 세션/캐시 분리 운용
redis-session: maxmemory-policy allkeys-lru
redis-cache:   maxmemory-policy volatile-ttl
# 앱: 세션=쿠키+Redis(고정 필요 시 해시 라우팅), 데이터=캐시 미스시 DB 조회
L7 라우팅/가중치 배포
# HAProxy 예: leastconn + 카나리 10%
frontend https-in
  bind :443 ssl crt /etc/ssl/site.pem alpn h2,http/1.1
  default_backend app
backend app
  balance leastconn
  http-check send meth GET uri /health
  server v1 10.0.1.11:443 ssl check verify none weight 9
  server v2 10.0.1.12:443 ssl check verify none weight 1  # 카나리
VIP 장애조치(Active-Passive)
# Keepalived 예: VRRP를 이용한 VIP 페일오버
vrrp_instance VI_1 {
  state MASTER
  interface eth0
  virtual_router_id 51
  priority 110
  advert_int 1
  authentication { auth_type PASS auth_pass **** }
  virtual_ipaddress { 203.0.113.10/24 dev eth0 }
}
회복력 & 테스트 플랜
헬스체크/치유 — 실패 임계/간격, 격리·복귀 자동화.
카오스 실험 — 인스턴스/네트워크 격리 테스트.
백업·복원 — 스냅샷 주기/보관, 복구 리허설.
DR 드릴 — 크로스리전 전환 리허설/체크리스트.
용량 관리 — 자동/수동 스케일, 핫스팟 제거.
보안 — 디도스 보호(프록시), WAF, 보안그룹 정합성.
관측성(Observability)
영역 주요 지표/로그 알림 기준(예)
LB RPS, 지연 p95/p99, 4xx/5xx, 헬스 오류율 5분 평균 > 2%
에러율, Apdex, 큐 대기 Apdex < 0.85, 에러율 > 1%
DB 복제지연, 락/대기, 커넥션 복제지연 > 3s
인프라 CPU/메모리/디스크/네트워크 사용률 임계 초과 시 확장
운영 런북(요약)
사건 즉각 조치 영향/대응
웹 에러율 급증 릴리스 중지, 카나리 롤백 LB에서 v2 가중치=0, 원인 분석
DB 복제지연 읽기 트래픽 캐시로 완충 장기 시 리소스 확장/쿼리 튜닝
AZ 장애 불량 노드 격리 확인 A/A 분산 확인, 필요시 트래픽 셰이핑
디도스 공격 프록시 보호 정책 상향 WAF 룰/레이트 제한 적용
요금 안내
요금: 별도문의

요건(가용성 목표, 트래픽/RPS, 리전/AZ 수, 보호옵션, 데이터 복제 거리)에 따라 산정됩니다.

고가용 아키텍처, 빠르게 구축해드립니다
현 구성/장애 이력만 알려주시면 바로 설계안과 이행계획을 드립니다.