2.8 장애 허용성
이번에는 장애 허용을 살펴보겠습니다. 장애 허용이란 일부 요소가 고장 나서 제대로 돌아가지 않거나 네트워크 문제가 발생해도 시스템이 정상적으로 작동을 계속할 수 있음을 의미합니다. 이는 시스템이 장애를 자동으로 감지하고 복구할 수 있도록 설계하고 구현하는 것을 포함하여 사람이 개입하지 않아도 문제를 해결할 수 있게 합니다.
장애 허용을 구현하고자 분산 시스템에서는 다중화(중복성), 복제, 장애 감지 및 복구 메커니즘 같은 여러 기술을 사용합니다. 다중화는 시스템 구성 요소나 데이터를 여러 개로 만들어 두는 것으로, 하나가 고장 나더라도 다른 것이 대신 역할을 수행하여 시스템 전체가 중단되지 않도록 합니다. 복제는 데이터나 서비스를 여러 위치에 복사하여 저장하는 방식으로, 특정 위치에 장애가 발생해도 다른 위치에서 계속 서비스를 제공할 수 있도록 합니다.