Distributed Systems
Ceph Erasure Coding 데이터 조회 흐름
Ceph EC 읽기 경로와 복구 읽기(degraded read) 비용을 정리합니다.
Ceph Erasure Coding 데이터 조회 흐름
EC 읽기는 정상 경로와 복구 경로를 구분해 이해해야 합니다.
정상 읽기
필요 데이터 조각이 모두 있으면 단순 조합으로 응답합니다.
Degraded read
일부 조각이 없으면:
- 최소 복구 조합 선택
- 추가 조각 요청
- 디코딩 연산 수행
- 원본 응답 생성
이때 지연과 네트워크 비용이 크게 증가합니다.
운영 포인트
- 디스크 장애 시 degraded read 비율을 별도 모니터링
- 복구 작업(backfill/recovery)과 사용자 읽기 간 자원 경쟁 제어
- 핫 오브젝트는 읽기 패턴에 맞게 계층/풀 전략 분리
결론
EC 읽기 성능은 평시 평균보다 장애 시 최악 지연을 봐야 합니다. SLO는 degraded 상황 기준으로 설정하는 것이 안전합니다.