반응형
서킷 브레이커(Circuit Breaker)는 소프트웨어 아키텍처에서 서비스 간의 호출 실패를 관리하고 시스템 안정성을 유지하기 위해 사용되는 디자인 패턴입니다. 주로 분산 시스템이나 마이크로서비스 환경에서 활용됩니다.
서킷 브레이커의 동작 원리
서킷 브레이커는 전기 회로의 차단기에서 유래된 개념으로, 비정상적인 상황에서 서비스 호출을 차단하여 문제가 확대되는 것을 방지합니다. 아래는 서킷 브레이커의 주요 상태와 동작 방식입니다.
- Closed(닫힘):
- 정상 상태.
- 요청이 서비스로 전달되며, 실패율을 모니터링합니다.
- 실패율이 허용 임계치를 넘지 않으면 요청을 계속 전달합니다.
- Open(열림):
- 서비스 호출 실패율이 허용 임계치를 초과하면 회로가 열립니다.
- 새로운 요청은 즉시 차단되며, 대체 응답(예: 오류 메시지)을 반환합니다.
- 이를 통해 불필요한 호출로 인한 자원 낭비를 방지합니다.
- Half-Open(반열림):
- 일정 시간이 지나면 일부 요청을 서비스로 전달하여 회복 여부를 테스트합니다.
- 테스트 요청이 성공하면 회로를 닫고 정상 상태로 복구합니다.
- 실패하면 다시 열림 상태로 전환됩니다.
서킷 브레이커의 목적
- 시스템 안정성 유지:
- 장애가 발생한 서비스로의 요청을 차단하여 문제 확산을 방지합니다.
- 다른 서비스에 미치는 영향을 최소화합니다.
- 자원 보호:
- 문제가 있는 서비스로 계속 요청을 보내는 것을 방지하여 CPU, 메모리 등의 자원을 보호합니다.
- 성능 최적화:
- 빠른 실패 처리를 통해 요청 대기 시간을 단축하고 사용자 경험을 개선합니다.
- 장애 복구 지원:
- 서비스 복구 여부를 점진적으로 테스트하여 장애를 복구합니다.
서킷 브레이커의 동작 시나리오
- 서비스 호출 성공 상태:
- A 서비스가 B 서비스에 요청을 보냅니다.
- B 서비스가 정상적으로 응답하므로 서킷 브레이커는 닫힌 상태(Closed)를 유지합니다.
- 서비스 호출 실패 증가:
- B 서비스가 장애 상태에 빠지면서 A 서비스의 요청이 계속 실패합니다.
- 실패율이 설정된 임계치(예: 50%)를 초과하면 서킷 브레이커는 열린 상태(Open)로 전환됩니다.
- 서비스 복구 테스트:
- 서킷 브레이커가 열린 상태에서 일정 시간이 지나면 일부 요청을 B 서비스로 보냅니다.
- B 서비스가 정상적으로 응답하면 서킷 브레이커는 반열림 상태(Half-Open)에서 닫힌 상태(Closed)로 복구됩니다.
서킷 브레이커의 구성 요소
- Failure Threshold(실패 임계치):
- 서킷 브레이커가 열린 상태로 전환되기 전에 허용되는 실패율.
- Timeout Period(시간 초과 기간):
- 열린 상태에서 반열림 상태로 전환되기까지의 대기 시간.
- Retry Logic(재시도 로직):
- 반열림 상태에서 서비스 복구 여부를 테스트하는 로직.
- Fallback Mechanism(대체 메커니즘):
- 서비스 호출 실패 시 사용자에게 제공할 대체 응답(예: 캐시 데이터, 기본 메시지 등).
서킷 브레이커를 구현하는 프레임워크 및 라이브러리
- Java:
- Netflix Hystrix: 마이크로서비스를 위한 서킷 브레이커 및 장애 복구 라이브러리.
- Resilience4j: Hystrix 대안으로 경량화된 라이브러리.
- Python:
- pybreaker: Python용 서킷 브레이커 라이브러리.
- Tenacity: 서킷 브레이커와 재시도 로직을 포함한 Python 라이브러리.
- JavaScript:
- opossum: Node.js용 서킷 브레이커 라이브러리.
서킷 브레이커와 함께 자주 사용하는 패턴
- 재시도(Retry) 패턴:
- 서킷 브레이커가 열린 상태로 전환되기 전에 요청을 재시도합니다.
- 폴백(Fallback) 패턴:
- 서킷 브레이커가 열린 상태일 때 대체 응답을 제공합니다.
- 로드 밸런싱 패턴:
- 다른 서비스로 트래픽을 분산하여 장애가 있는 서비스를 우회합니다.
서킷 브레이커의 실제 사용 사례
- 전자 상거래 사이트:
- 결제 서비스가 장애를 일으키면 서킷 브레이커가 활성화되어 결제를 일시적으로 중단하고 대체 결제 수단을 제공합니다.
- 마이크로서비스 아키텍처:
- A 서비스가 B 서비스에 의존할 때 B 서비스 장애 시 서킷 브레이커를 사용해 빠르게 실패를 처리하고, 시스템 전체의 안정성을 유지합니다.
- API 게이트웨이:
- API 호출 실패가 일정 수준 이상 발생하면 서킷 브레이커가 API 호출을 차단합니다.
서킷 브레이커는 마이크로서비스 아키텍처에서 중요한 안정성 패턴으로, 시스템 장애 확산을 방지하고 복구 가능성을 높이는 데 필수적입니다.
반응형